聚类问题需不需要分出测试集?

  统计/机器学习 无监督学习 模型验证    浏览次数:7685        分享
0

以前做K-Means之类的聚类,好像都没有划分训练集和测试集,都是用了整个数据集。

我想知道聚类问题到底需不需要分出测试集?

 

vivian_o   2018-11-12 14:14



   1个回答 
2

这个问题见仁见智吧

分出test data有时候可以用来检验是否overfitting

SofaSofa数据科学社区DS面试题库 DS面经

Lydia   2018-12-03 23:17



  相关讨论

怎么理解聚类算法的评价指标Rand Index(RI)?

怎么评价一个聚类算法?

dbscan 中的参数值如何确定?

谱聚类中的相似矩阵是怎么定义的?

层次聚类里的linkage是什么意思?

什么是K-Modes(K众数)聚类法?

层次聚类中的Ward's method是什么意思

聚类问题可以用stacking model的方法吗?

软聚类,硬聚类?

python中实现k-modes的包

  随便看看

xgboost的gblinear是什么意思?

查看sklearn的线性回归系数的p value

pandas报错: 'DataFrame' object has no attribute 'unique'

抛的硬币直到连续出现两次正面为止,平均要扔多少次

二元分类为什么不能用MSE做为损失函数?