作为一个降维手段,随机投影的实际效果如何?和PCA比的话,有优势吗?
1个回答
PCA是要找到一个最佳的投影矩阵(最大方差的方向),而且随机投影就是用一个随机的投影矩阵。既然要“找到”最好的,PCA的计算复杂度远远大于随机投影。
简单来说,随机投影是牺牲了一些精度,但是大大降低了计算量。所以你看你的“实际效果”指的是精读还是计算效率了。
如果数据的分布是接近高斯混合模型的时候,随机投影的效果也不错。(参考文献 Dasgupta, Sanjoy. "Experiments with random projection." )
SofaSofa数据科学社区DS面试题库 DS面经