用pca对数据集降维时为什么一定要训练集和测试集?
为什么数据不能合在一起做pca降维呢?
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
Raymond 2020-02-25 23:35
如果合一起做PCA,测试集里的信息会泄露到PCA中。打个比方,训练集是黄色,测试集是蓝色,合一起PCA会是绿色。
Zealing 2020-02-25 23:56
因为会造成数据泄露啊,训练集中不应该含有测试集的信息。
MangoCoke 2020-02-27 23:02
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
Truncated SVD和PCA有什么区别吗?
PCA降维之前为什么要先标准化?
PCA会降低分类器的精度吗?
主成分分析法(PCA)算是黑盒算法吗?
PCA算法是一种保距算法吗?
利用PCA降维,降到几维比较合适?
sklearn.decomposition.PCA方法中fit, fit_transform, transform应该怎么用
sklearn pca 数据降维结果不一致
为什么PCA被称作非监督式学习?
PCA与非负矩阵分解(NMF)的异同?
随便看看
AB实验的哈希分桶技术是什么意思?
为什么矩阵的二范数和向量的二范数的定义不同?
Data Application Lab怎么样?
怎么对2维的numpy array取整?
序列的autocorrelation(自相关系数)的计算公式