bias-variance tradeoff是什么意思?

  统计/机器学习 开放问题    浏览次数:7852        分享
0

很多模型都提到bias-variance tradeoff,这个到底怎么理解?

 

汪王往望   2017-05-23 08:44



   2个回答 
5

bias(偏差)一般都是由于模型中错误的前提假设导致的。高bias通常意味着模型欠拟合。

variance(方差)一般是由于模型对数据集中的噪音的敏感导致的。高variance通常意味着模型过拟合。

bias–variance decomposition(偏差-方差分解)是将模型中的误差(error)分解成bias和variance两部分

$$\text{Error}=\text{Error}_\text{bias}+\text{Error}_\text{var}$$

很明显,如果在Error不变的情况下,如果降低$\text{Error}_\text{bias}$,必然会导致$\text{Error}_\text{var}$变大;反之亦然。这就是所谓的bias-variance tradeoff。

SofaSofa数据科学社区DS面试题库 DS面经

GuoLinhui   2018-08-12 11:37

2

我们在建立模型的时候,希望这个模型又要精度高,又要方差小,但是通常很难两全其美。所以我们要在这两者之间权衡。


比如说一个人找两个大师去算命。大师A说,你在20岁到80岁之间会发一次大财,这是你这辈子最大的一次财运;大师B说,你在41、2岁的时候会发一次大财,这是你这辈子最大的一次财运。过了几十年之后,你在45岁的时候发了人生一笔横财。那么回过头想,哪个大师说得准呢?


回到机器学习上面,举个例子。对于kNN来说,k选的小,可以让bias变小,但是variance会变大;k选大了,bias会大,但是variance会变小。所以k过大,k过小都不好,就像上面的大师A和B。让bias和variance达到平衡,这样的模型才比较好。


这个英文博客有兴趣的话可以看看bias variance tradeoff


SofaSofa数据科学社区DS面试题库 DS面经

黄前志   2017-05-25 10:00



  相关讨论

如何学习机器学习?有没有好的经验。

数据泄漏(data leakage)是什么意思?

Generic/Heuristic Algorithm是什么意思?有什么区别?

机器学习如何快速入门?

hyperparameter与parameter的区别?

强人工智能的研究现在怎么样了?

机器学习提到的MVP是什么意思?

函数型数据分析

机器学习算法的鲁棒性是什么意思?

如何理解VC dimension?

  随便看看

神经网络中的dense和sparse是什么意思?

pandas报错: 'DataFrame' object has no attribute 'unique'

分类特征的目标编码是什么意思?

怎么对pandas dataframe做转置?

特征归一化对K Means有影响吗?