如果一列特征有90%以上的数值都是0,这个特征还有用吗?可以直接删掉吗?
4个回答
当然不能直接删掉,你可以只用这一个特征训练模型,看看效果如何,也可以用其他特征选择的方法,总之是不能直接删掉。
极端一点,假如你做一个binary classifcation,y就是90%是0,10%是1,现在你有一个y一模一样数值的黄金特征,难道你不用,要直接删掉?
SofaSofa数据科学社区DS面试题库 DS面经如果一列特征有90%以上的数值都是0,这个特征还有用吗?可以直接删掉吗?
当然不能直接删掉,你可以只用这一个特征训练模型,看看效果如何,也可以用其他特征选择的方法,总之是不能直接删掉。
极端一点,假如你做一个binary classifcation,y就是90%是0,10%是1,现在你有一个y一模一样数值的黄金特征,难道你不用,要直接删掉?
SofaSofa数据科学社区DS面试题库 DS面经