sklearn.cluster.KMeans怎么给样本加权重?

  统计/机器学习 无监督学习 Python    浏览次数:7284        分享
0

如果聚类问题中每个样本的不是等权重的怎么办?sklearn.cluster.KMeans怎么给每个样本加权重?

 

lllinnn   2018-09-08 15:20



   1个回答 
2

目前好像不支持,他们正在github上讨论(这里),而且已经有人在做了,估计以后就会有了吧。

如果题主急的话,可以看看这个https://github.com/oliviaguest/weighted_k_means,不过我也没用过,不知道效果如何。

SofaSofa数据科学社区DS面试题库 DS面经

chrisliang   2018-09-11 11:29



  相关讨论

python中计算加权平均

python中求加权中位数

python里求加权标准差或者加权方差的函数是什么?

模型融合方法:加权融合

如何计算加权最小二乘法的样本权重?

sklearn kmeans里的n_init是什么意思

sklearn.cluster.KMeans用的哪种距离?

sklearn.cluster.KMeans的fit_transform方法的返回值是什么意义?

sklearn.cluster.KMeans可以用其他距离吗?

pyspark groupby 加权平均?

  随便看看

样本权重大小不同时,用什么分类算法比较合适?

kappa statistic怎么理解?有什么意义?

二元分类问题中经常提到的TP,TN,FN,FP都是什么意思?

huber loss是什么?什么时候用?

micro和macro F1 score分别是什么意思?