全部问题问题热门未解答所有标签标签收藏收藏我要提问

进行K-Means聚类前，需要对数据做怎样的预处理？

统计/机器学习无监督学习数据预处理浏览次数：15219 分享

二维码

手机扫描二维码

案例分析面试常见题？

进行K-Means聚类前，需要对数据做怎样的预处理？不是非常明白，请多多指教！

MeganC 2017-04-30 19:46

1个回答

对于数值变量，最重要的就是对原始数据标准化，使得每个变量的方差的大小相等。原因类似于我们PCA之前要先标准化。

对于分类变量，要做编码。

SofaSofa数据科学社区 DS面试题库 DS面经

蓝色北方 2017-05-01 08:53

相关讨论

特征归一化对K Means有影响吗？

KMeans++是怎么选初始点的？

kmeans可以用在三维数据上吗？

K-Means实现mini-batch online learning的原理是什么？

K Means初始点必须是样本中的点吗

kernal kmeans是什么意思？和一般的kmeans的区别是什么？

k-medoids和k-means区别

关于online KMeans步骤中成员更新分类的问题？

kmeans可以做并行化计算达到加速效果吗？

关于小批量K均值（mini-batch K Means）的问题

随便看看

怎么把pandas.DataFrame转成torch.tensor的格式？

去掉pandas DataFrame的index的名字

怎么理解推荐系统中的NDCG？

两个独立的正态随机变量的乘积服从什么分布？

凸优化中局部最优解就是全局最优解吗？