当数据特征多的时候,我们可以用PCA降维,一般降到几维比较合适?
1个回答
- 如果是为了数据可视化,可以降到1维(线),2维(平面),或者3维(立体)。
- 如果是为了建立预测模型而降维,比较常用的方法是看多少个主成分解释了多少百分比的方差,常用的比如说99%,95%,90%。
- 另一个方法是Kaiser's Rule,保留所有奇异值大于1的
- 还有个类似elbow method的方法,画出主成分的个数和解释方差百分比的曲线,找出手肘的那个点。
当数据特征多的时候,我们可以用PCA降维,一般降到几维比较合适?