RT
不管是任何方法,三维以上直接聚类的话,好像是无法观察结果的。只能通过在低维度的投影来观察结果。或者通过silhouette plot来看结果是否正确可以吗?
3个回答
你的聚类问题应该是没有外部信息来确认ground truth的情况。
参考一下这个不知道真实分类,怎么评价一个聚类算法?
SofaSofa数据科学社区DS面试题库 DS面经
谢谢。我觉得这才是我应该问的问题,非常感谢。
-
noob123
2019-05-10 21:07
如果你想可视化的话就必须要降维,比如t-sne,pca或者spectral clustering。如果不降维的话,你只能在低维观察,比如可以任选两组维度进行观测,然后多观测几组。
如果有真实分类,可以用rand index来判别聚类的效果;如果没有真实分类,就只能通过silhouette来看聚类的稳定性一致性。
SofaSofa数据科学社区DS面试题库 DS面经
谢谢你。可是如果不降维,如何才能知道“有真实分类”?只能在低维观察?
-
noob123
2019-05-06 22:23
聚类不一定要降维。
但是如果你想肉眼看聚类的效果的话,就需要降维。
从另一方面说,如果你肉眼很明显能看出聚类,那也不一定需要模型了吧,你人为设定几个边界就够了吧...
SofaSofa数据科学社区DS面试题库 DS面经
如果不用肉眼,如何能看出来聚类效果呢?除了silhouette以外
-
noob123
2019-05-06 22:21