如果有十个特征,其中两个维度完全相同。那么这种情况有什么影响呢?
对LR、SVM、xgb、神经网络、FM等不同的模型都有什么影响呢?
谢谢
2个回答
简单点说,对线性回归影响比较大,因为矩阵不可逆了;对线性模型,或者说广义线性模型、逻辑回归的影响不大,但是有可能会模型系数不收敛;对树类模型影响很小,可以参考决策树、随机森林中的多重共线性问题
SofaSofa数据科学社区DS面试题库 DS面经
谢谢您的回答,请问如果是FM模型会有什么影响呢?谢谢
-
求offer
2019-03-27 20:22
特征相关性高往往影响的是模型的解释性和稳定性。
我觉得多重共线性对FM影响应该是不大,因为FM本质上和PCA是类似的,而PCA本身也是可以处理特征相关性的。
SofaSofa数据科学社区DS面试题库 DS面经