怎么对时间序列类的数据进行聚类?

  统计/机器学习 无监督学习 时间序列 开放问题    浏览次数:5163        分享
1

假设每个样本都有自己的一条时间序列曲线,怎么对时间序列类的数据进行聚类?

 

Raymond   2019-07-07 15:20



   2个回答 
6

使用传统K-Means等等都可以,问题的关键是如何定义距离。有两个东西可以给你参考:

1. Time Series Data Clustering,书籍Data Clustering: Algorithms and Applications的第15章,从学术的角度阐明各种不同时间序列聚类的方法;

2. 近几年刚刚提出的K-Shape算法:http://www1.cs.columbia.edu/~jopa/Papers/PaparrizosSIGMOD2015.pdf

SofaSofa数据科学社区DS面试题库 DS面经

moriarty0405   2019-09-11 16:04

2

要看你聚类的目的是什么了。简单一点的话,就每个样本提起出均值和方差,然后做两维的kmeans。

稍微复杂一点,就以每个时间点作为一个特征,比如每个样本都有相同起始终止点,一共有50个时间点,那么相当于每个样本都有50个特征,然后做50维的kmeans。

SofaSofa数据科学社区DS面试题库 DS面经

WinJ   2019-09-11 13:51



  相关讨论

时序中的change point是什么意思?

有什么方法可以找到时间序列的周期?

python中有哪些关于隐马尔可夫模型(HMM)的package?

python里有现成的卡尔曼滤波器的包吗?

关于领域自适应问题

ARIMA模型中的三个参数(p, d, q)都是什么意思?

怎么对时间序列进行交叉验证?

怎么判断一个时间序列是平稳的?

一维的数据可以做聚类吗?

如何判断时间序列的周期性?

  随便看看

在jupyter后台进程没有shutdown的notebook一直会占用内存吗?

keras里sparse_categorical_crossentropy和categorical_crossentropy什么不同?

把tf.Tensor转换为numpy array

python pandas里有没有类似R的summary的函数?

为什么过拟合不好?