kmeans可以做并行化计算达到加速效果吗?上周面试被问的题目,没什么思路,谢谢
3个回答
可以并行。Kmeans分两步,第一步算n个点到k个中心的最小距离,数据点间计算不相关,可以用m个进程并行计算m个点的最小距离。第二步更新k个中心点时,要连续使用n个点数据,加法运算有顺序,不能并行。
SofaSofa数据科学社区DS面试题库 DS面经可以的,有分布式聚类算法DK-means
https://wenku.baidu.com/view/db713dd38e9951e79b8927a2.html