进行K-Means聚类前,需要对数据做怎样的预处理?不是非常明白,请多多指教!
您确定要删除本贴么?所有相关回复也会被一并删除并且无法恢复。
MeganC 2017-04-30 19:46
对于数值变量,最重要的就是对原始数据标准化,使得每个变量的方差的大小相等。原因类似于我们PCA之前要先标准化。
对于分类变量,要做编码。
蓝色北方 2017-05-01 08:53
回答问题时需要注意什么?
我们谢绝在回答前讲“生动”的故事。 我们谢绝答非所问。 我们谢绝自己不会、硬要回答。我们谢绝“这么简单,自己想”、“书上有,自己找”这类回答;如果你认为对方提问方式或者内容不妥,可以直接忽略,不作解答,甚至投反对票。我们感激每一个用户在编写答案时的努力与付出!
相关讨论
特征归一化对K Means有影响吗?
KMeans++是怎么选初始点的?
kmeans可以用在三维数据上吗?
K-Means实现mini-batch online learning的原理是什么?
K Means初始点必须是样本中的点吗
kernal kmeans是什么意思?和一般的kmeans的区别是什么?
k-medoids和k-means区别
关于online KMeans步骤中成员更新分类的问题?
kmeans可以做并行化计算达到加速效果吗?
关于小批量K均值(mini-batch K Means)的问题
随便看看
怎么把pandas.DataFrame转成torch.tensor的格式?
去掉pandas DataFrame的index的名字
怎么理解推荐系统中的NDCG?
两个独立的正态随机变量的乘积服从什么分布?
凸优化中局部最优解就是全局最优解吗?