比如训练集中有两列特征X1和X2,现在分别对每一列特征乘以1000,构造数据集A,再对原始的每一列特征除以1000 构造数据集B,
问:在这两个训练集下训练的LR模型,哪个具有过拟合的风险?为什么?
1个回答
如果原来的特征X1和X2不存在共线性,那么数据集A里这两个放大的特征,也不会存在共线性的问题,所以没有过拟合的情况。
数据集B和上面的情况类似,数据集也只有2个特征,所以不大会过拟合。即使它们会过拟合,也和乘除无关吧。
SofaSofa数据科学社区DS面试题库 DS面经
学习了
-
Pan
2019-08-27 15:23