尤其是梯度分类树,当然也包括回归,对于共线性,缺失都能在树里面很好的自我处理,那么特征是否还需要再筛选
(ps:我自己试了下,用简单的L1筛选和不筛选,比较了一下,在5折的下准确率均值有0.1,0.2的差距)
2个回答
需要进行特征选择的,不然的话整个模型就是garbage-in-garbage-out(垃圾数据进,垃圾数据出)。
具体效果,还是应数据而定,看交叉验证的结果。
SofaSofa数据科学社区DS面试题库 DS面经尤其是梯度分类树,当然也包括回归,对于共线性,缺失都能在树里面很好的自我处理,那么特征是否还需要再筛选
(ps:我自己试了下,用简单的L1筛选和不筛选,比较了一下,在5折的下准确率均值有0.1,0.2的差距)
需要进行特征选择的,不然的话整个模型就是garbage-in-garbage-out(垃圾数据进,垃圾数据出)。
具体效果,还是应数据而定,看交叉验证的结果。
SofaSofa数据科学社区DS面试题库 DS面经