为什么PCA被称作非监督式学习?

  统计/机器学习 无监督学习 数据降维 开放问题    浏览次数:8182        分享
5

明明PCA不能直接用在聚类上,为什么PCA还是会被称为非监督式学习(unsupervised learning)?


在监督式学习中,PCA可以用来降维,为什么不称它为监督式学习(supervised learning)?


 

ljljlj   2017-10-04 23:33



   2个回答 
7

非监督式学习是个很大的范畴,并不只是聚类。

贴一段维基百科对非监督式学习的解释。

Unsupervised machine learning is the machine learning task of inferring a function to describe hidden structure from "unlabeled" data.

大意是说对没有标签的数据进行发掘探索就是非监督式学习

我们知道,用PCA对数据进行降维时,我们是不需要数据的标签的(也就是在做PCA时,我们会剔除y那列),所以这也符合了非监督学习的定义。



SofaSofa数据科学社区DS面试题库 DS面经

Nagozi   2017-10-09 10:10

3

PCA并没有用到label的信息,所以是unsupervised。


SofaSofa数据科学社区DS面试题库 DS面经

岛歌   2017-10-09 10:44



  相关讨论

PCA算法是一种保距算法吗?

主成分分析法(PCA)算是黑盒算法吗?

PCA降维中的特征值和特征向量

Truncated SVD和PCA有什么区别吗?

用pca对数据集降维时为什么一定要训练集和测试集?

一个关于PCA与eigenvector的问题

除了PCA,还有什么降维的方法?

PCA降维之前为什么要先标准化?

PCA会降低分类器的精度吗?

利用PCA降维,降到几维比较合适?

  随便看看

pandas.DataFrame更改列名

plt.bar怎么设置每个bar的颜色?

随机森林(random forest)和支持向量机(SVM)各有什么优劣

logloss的取值范围是多少?一般好的分类器能达到多少?

pandas DataFrame中经常出现SettingWithCopyWarning