全部问题问题热门未解答所有标签标签收藏收藏我要提问

关于K均值聚类的权重问题

统计/机器学习无监督学习特征选择浏览次数：6330 分享

二维码

手机扫描二维码

案例分析面试常见题？

K均值聚类的时候可以设置某个变量的权重大点么？

因为知道数据集变量的真实意义，我是想主要根据这个变量的不同进行聚类。

吴昊通 2018-02-18 11:16

2个回答

可以啊，你把这个你觉得重量的变量缩放到[-k, k]的维度上，其他变量缩放到[-1, 1]的维度上，至于k多大，就看你觉得到底那个变量有多重要了。

SofaSofa数据科学社区 DS面试题库 DS面经

Lydia 2018-02-20 08:09

把不重要的变量压缩，把重要的变量拉伸，这样应该就可以了

SofaSofa数据科学社区 DS面试题库 DS面经

Beck 2018-02-23 09:57

相关讨论

请问大家常用的无监督的特征筛选方法会有哪些？

python使用MFCC特征训练GMMHMM模型

什么情况下需要做特征选择？

wrapper特征选择法是什么意思？

对于组合特征怎么理解？

一个特征有两个可选的值，只需满足其中一个即可，该如何处理？

层次聚类里的linkage是什么意思？

软聚类，硬聚类？

层次聚类中的Ward's method是什么意思

什么是K-Modes（K众数）聚类法？

随便看看

sklearn中的predict_proba方法的返回值的意义

'str' object has no attribute 'decode' 代码运行时有错误呢？请高手帮忙解决

为什么梯度的反方向是函数下降最快的方向？

AB实验的哈希分桶技术是什么意思？

单一变量下的异常检测该怎么做？