常用无监督的特征筛选方法会有哪些?
1个回答
无监督方法就要排除lasso、逐一选择法之类的了。
不依赖于y标签的特征选择还可以考虑
- 看特征方差,特征是常数或者接近为常数的,可以直接剔除
- 看特征的缺失值占比,缺失值占比过高的,可以直接剔除
- 重复的特征,比如两个特征几乎一样,也可以直接剔除
- 相关性的特征可以剔除,比如用皮尔逊系数、卡方检验、VIF等等
复杂的方法里,可以考虑Sparse PCA,这个也是无监督的,和PCA不同,Sparse不是压缩特征,是类似于选择特征。
常用无监督的特征筛选方法会有哪些?
无监督方法就要排除lasso、逐一选择法之类的了。
不依赖于y标签的特征选择还可以考虑
复杂的方法里,可以考虑Sparse PCA,这个也是无监督的,和PCA不同,Sparse不是压缩特征,是类似于选择特征。