当数据量很小的时候,怎么做模型验证?

  统计/机器学习 监督式学习 模型验证 开放问题    浏览次数:4444        分享
1

当数据量很小的时候,怎么做模型验证?

是用留一法验证还是交叉验证呢?


我另一个相关问题:哪些机器学习分类模型适用于小数据?

 

超越本人   2018-09-19 13:35



   1个回答 
3

当数据很少的时候,就必须得充分利用数据了,所以更推荐用交叉验证。但是交叉验证只能用来估计误差,而不能用来调参,因为一旦用来调参就很容易过拟合。

另外k-fold交叉验证时,k不能选太大,对于小数据集而言,k取3或者4就足够了。

SofaSofa数据科学社区DS面试题库 DS面经

Lydia   2018-09-20 13:05



  相关讨论

训练误差、测试误差、泛化误差的区别

建模时一定需要验证集或者测试集吗?

模型调参时常用到的Grid Search是什么意思?

关于训练时候loss一开始就很低?

有顺序的多元分类模型应该用评判标准?

logistic回归有哪些指标可以评价模型效果?

分类中的F1精度、F2精度、F3精度是什么意思?

怎么用KS值来评价二元分类器?

二元分类问题中经常提到的TP,TN,FN,FP都是什么意思?

机器学习中lift的概念是什么?怎么用来评价模型?

  随便看看

除了PCA,还有什么降维的方法?

推荐开放数据库

logloss的取值范围是多少?一般好的分类器能达到多少?

模型调参时常用到的Grid Search是什么意思?

在使用PCA降维时,有哪些坑?