全部问题问题热门未解答所有标签标签收藏收藏我要提问

怎么对时间序列类的数据进行聚类？

统计/机器学习无监督学习时间序列开放问题浏览次数：6394 分享

二维码

手机扫描二维码

案例分析面试常见题？

假设每个样本都有自己的一条时间序列曲线，怎么对时间序列类的数据进行聚类？

Raymond 2019-07-07 15:20

2个回答

使用传统K-Means等等都可以，问题的关键是如何定义距离。有两个东西可以给你参考：

1. Time Series Data Clustering，书籍Data Clustering: Algorithms and Applications的第15章，从学术的角度阐明各种不同时间序列聚类的方法；

2. 近几年刚刚提出的K-Shape算法：http://www1.cs.columbia.edu/~jopa/Papers/PaparrizosSIGMOD2015.pdf

SofaSofa数据科学社区 DS面试题库 DS面经

moriarty0405 2019-09-11 16:04

要看你聚类的目的是什么了。简单一点的话，就每个样本提起出均值和方差，然后做两维的kmeans。

稍微复杂一点，就以每个时间点作为一个特征，比如每个样本都有相同起始终止点，一共有50个时间点，那么相当于每个样本都有50个特征，然后做50维的kmeans。

SofaSofa数据科学社区 DS面试题库 DS面经

WinJ 2019-09-11 13:51

相关讨论

时序中的change point是什么意思？

有什么方法可以找到时间序列的周期？

python中有哪些关于隐马尔可夫模型（HMM）的package？

python里有现成的卡尔曼滤波器的包吗？

关于领域自适应问题

ARIMA模型中的三个参数(p, d, q)都是什么意思?

怎么对时间序列进行交叉验证？

怎么判断一个时间序列是平稳的？

一维的数据可以做聚类吗？

如何判断时间序列的周期性？

随便看看

在jupyter后台进程没有shutdown的notebook一直会占用内存吗？

keras里sparse_categorical_crossentropy和categorical_crossentropy什么不同？

把tf.Tensor转换为numpy array

python pandas里有没有类似R的summary的函数？

为什么过拟合不好？