进行K-Means聚类前,需要对数据做怎样的预处理?

  统计/机器学习 无监督学习 数据预处理    浏览次数:14548        分享
0

进行K-Means聚类前,需要对数据做怎样的预处理?不是非常明白,请多多指教!

 

MeganC   2017-04-30 19:46



   1个回答 
3

对于数值变量,最重要的就是对原始数据标准化,使得每个变量的方差的大小相等。原因类似于我们PCA之前要先标准化

对于分类变量,要做编码。

SofaSofa数据科学社区DS面试题库 DS面经

蓝色北方   2017-05-01 08:53



  相关讨论

特征归一化对K Means有影响吗?

KMeans++是怎么选初始点的?

kmeans可以用在三维数据上吗?

K-Means实现mini-batch online learning的原理是什么?

K Means初始点必须是样本中的点吗

kernal kmeans是什么意思?和一般的kmeans的区别是什么?

k-medoids和k-means区别

关于online KMeans步骤中成员更新分类的问题?

kmeans可以做并行化计算达到加速效果吗?

关于小批量K均值(mini-batch K Means)的问题

  随便看看

怎么把pandas.DataFrame转成torch.tensor的格式?

去掉pandas DataFrame的index的名字

怎么理解推荐系统中的NDCG?

两个独立的正态随机变量的乘积服从什么分布?

凸优化中局部最优解就是全局最优解吗?