请问大家常用的无监督的特征筛选方法会有哪些?

  统计/机器学习 无监督学习 特征选择    浏览次数:1549        分享
0

常用无监督的特征筛选方法会有哪些?

 

雨陌   2021-03-10 18:06



   1个回答 
1

无监督方法就要排除lasso、逐一选择法之类的了。

不依赖于y标签的特征选择还可以考虑

  • 看特征方差,特征是常数或者接近为常数的,可以直接剔除
  • 看特征的缺失值占比,缺失值占比过高的,可以直接剔除
  • 重复的特征,比如两个特征几乎一样,也可以直接剔除
  • 相关性的特征可以剔除,比如用皮尔逊系数、卡方检验VIF等等

复杂的方法里,可以考虑Sparse PCA,这个也是无监督的,和PCA不同,Sparse不是压缩特征,是类似于选择特征。

SofaSofa数据科学社区DS面试题库 DS面经

神算子   2022-04-28 09:16



  相关讨论

关于K均值聚类的权重问题

python使用MFCC特征训练GMMHMM模型

什么情况下需要做特征选择?

wrapper特征选择法是什么意思?

对于组合特征怎么理解?

一个特征有两个可选的值,只需满足其中一个即可,该如何处理?

谱聚类中的相似矩阵是怎么定义的?

层次聚类里的linkage是什么意思?

软聚类,硬聚类?

聚类问题可以用stacking model的方法吗?

  随便看看

如何清空pandas dataframe里的全部数据但是保留列名?

python去掉中文文本中所有的标点符号

pandas把一列日期转换为星期

Resnet-18, Resnet-50, Resnet-101这些模型里的数字是什么意思?

为什么自然常数e等于阶乘的倒数的和?