主成分分析法(PCA)算是黑盒算法吗?

  统计/机器学习 无监督学习 数据降维    浏览次数:1045        分享
0
才接触机器学习不大久,了解到主成分分析,是线性降维的方法,但是降维之后的特征和原来的特征好像就不大对的上了。那么PCA算是黑盒算法吗?
 

特级开心果   2022-03-18 22:40



   2个回答 
3

PCA这种降维方式是把原来的m个变量,进行糅杂,缩减到n个新组建的变量上。至于新组建的变量又是原变量的线性组合。线性组合本身具有可解释性,但是这些变量硬组合在一起,基本上是无法理解的。我觉得是类似黑盒的。

举个例子,比如说对一个商品数据进行pca降维,其中一个新变量是 2*商品价格 - 0.5*商品重量 + 1.2*商品销量;这种情况下,就完全没有可解释性了。

SofaSofa数据科学社区DS面试题库 DS面经

yxyu   2022-04-03 16:54

1

特征选择是从已存在的特征中选取携带信息最多的,选完之后的特征依然具有可解释性,我们依然知道这个特征在原数据的哪个位置,代表着原数据上的什么含义。

PCA是降维算法,将已存在的特征进行压缩,降维完毕后的特征不是原本的特征矩阵中的任何一个特征,而是通过某些方式组合起来的新特征。通常来说,在新的特征矩阵生成之前,我们无法知晓降维算法们都建立了怎样的新特征向量,新特征矩阵生成之后也不具有可读性。

PCA一般不适用于探索特征和标签之间的关系的模型(如线性回归),因为无法解释的新特征和标签之间的关系不具有意义。在线性回归模型中,我们更倾向于用特征选择。

SofaSofa数据科学社区DS面试题库 DS面经

简Cheng   2022-04-07 10:08



  相关讨论

PCA算法是一种保距算法吗?

为什么PCA被称作非监督式学习?

PCA降维中的特征值和特征向量

Truncated SVD和PCA有什么区别吗?

用pca对数据集降维时为什么一定要训练集和测试集?

一个关于PCA与eigenvector的问题

PCA降维之前为什么要先标准化?

PCA会降低分类器的精度吗?

利用PCA降维,降到几维比较合适?

除了PCA,还有什么降维的方法?

  随便看看

怎么在已有的dataframe中插入一个新列(Pandas)

模型调参时常用到的Grid Search是什么意思?

numpy里生成单位矩阵?

为什么LASSO可以做特征选择,而Ridge却不行?

对于xgboost,还有必要做很多特征工程吗?