怎么评价一个聚类算法?

  统计/机器学习 无监督学习 模型验证    浏览次数:5971        分享
1
聚类算法不同于监督式学习,没有y的真实值,那怎么评价一个聚类算法?
 

机器小白   2017-05-30 10:11



   2个回答 
2

1. 通过聚类指标来看 ,包括RMSSTD,SPRSQ,RSQ,CCC,伪F,伪T等

2. 通过散点图看,是否聚类的是你想要的。

3. 看每个聚类的各个指标的平均值,如果各个指标的值都很明显区分,可以业务上解释,即为聚类效果好。

SofaSofa数据科学社区DS面试题库 DS面经

kevin_wu   2017-11-16 14:16

1

如果没有真实的y,那么可以用calinski-harabaz-index 或者 silhouette coefficient

SofaSofa数据科学社区DS面试题库 DS面经

whs_ita   2018-01-03 04:51



  相关讨论

怎么理解聚类算法的评价指标Rand Index(RI)?

聚类问题需不需要分出测试集?

dbscan 中的参数值如何确定?

谱聚类中的相似矩阵是怎么定义的?

软聚类,硬聚类?

层次聚类里的linkage是什么意思?

什么是K-Modes(K众数)聚类法?

聚类问题可以用stacking model的方法吗?

层次聚类中的Ward's method是什么意思

十折交叉验证

  随便看看

tf.placeholder(tf.float32, shape=(None, 1024))中的None是什么意思

随机森林如何调参?

AIC可以是负数吗?

在使用PCA降维时,有哪些坑?

两个独立的正态随机变量的乘积服从什么分布?