以前做K-Means之类的聚类,好像都没有划分训练集和测试集,都是用了整个数据集。
我想知道聚类问题到底需不需要分出测试集?
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
vivian_o 2018-11-12 14:14
这个问题见仁见智吧
分出test data有时候可以用来检验是否overfitting
Lydia 2018-12-03 23:17
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
怎么理解聚类算法的评价指标Rand Index(RI)?
怎么评价一个聚类算法?
dbscan 中的参数值如何确定?
谱聚类中的相似矩阵是怎么定义的?
层次聚类里的linkage是什么意思?
什么是K-Modes(K众数)聚类法?
层次聚类中的Ward's method是什么意思
聚类问题可以用stacking model的方法吗?
软聚类,硬聚类?
python中实现k-modes的包
随便看看
xgboost的gblinear是什么意思?
查看sklearn的线性回归系数的p value
pandas报错: 'DataFrame' object has no attribute 'unique'
抛的硬币直到连续出现两次正面为止,平均要扔多少次
二元分类为什么不能用MSE做为损失函数?