k一般是怎么选?这方面的资料很难找到。
谢谢!
3个回答
如果k取得比较小,比如2,3,4,可能偏差会比较大。
如果k取得比较大,比如20,30,会特别费时间。
我通常一般取5到10之间的数。
如果cross validation的结果对你很重要,你愿意花时间去做的话,我推荐可以做多次cross validation。因为k-fold cross validation中每个fold的validation error不是独立的。比如说,你可以先做5-fold cross validation,然后重新随机划分,再重复4次5-fold cross validation。
SofaSofa数据科学社区DS面试题库 DS面经一般都是随便设定的哈,3到10都可以吧。因为cross validation本身就是用来选模型参数的,再花大功夫选k是不是显得有点多此一举?我个人都是设定fold=5
SofaSofa数据科学社区DS面试题库 DS面经