有什么方法可以找到时间序列的周期?

  统计/机器学习 时间序列 开放问题    浏览次数:7474        分享
0

比如有的时间序列的周期是按天,有的按周,有的按两周,有什么方法可以自动找到时间序列的周期?

 

zhaijing   2018-12-05 12:10



   3个回答 
4

算周期简单的方法是计算自相关(autocorrelation)。如果要计算所有可能位移的自相关系数,计算量为$\mathcal{O}(n^2)$。这时通常用换到频域,根据时域卷积等于频域相乘,利用FFT和IFFT把计算量减小到$\mathcal{O}(n\log{}n)$。如果只计算个别位移的自相关系数,可以直接计算。

做了个实验。

import numpy as np
from numpy.fft import fft,ifft
import matplotlib.pyplot as plt
from sklearn import linear_model
N=1024 # days
m=8 # cycles
# np.random.seed(0)
x = np.linspace(0,m*2*np.pi, N) # N days= m cycles, N/m days/cycle
y0=np.sin(x+1.)
SNR=1./10
noise_std=y0.std()*np.sqrt(1/SNR)
y=y0+np.random.randn(N)*noise_std+x*.5
# y=y-y.mean()
# y=y/y.std()

regr = linear_model.LinearRegression()
regr.fit(x.reshape([-1,1]), y.reshape([-1,1]))
y_slow = regr.predict(x.reshape([-1,1])).flatten()
# y_slow=0
y_residual=y-y_slow

plt.plot(y,label='y')
plt.plot(y_slow,label='y slow')
plt.plot(y_residual,label='y residual')
plt.title('y')
plt.legend()
plt.show()

# FFT to calculate auto-correlation
y_fft=fft(y_residual)
S=y_fft*y_fft
y_corr=ifft(S)
plt.plot(np.absolute(S),'-*')
plt.xlim([0,N/2])
plt.title('|S|')
plt.show()

cycles=np.argmax(np.absolute(S)[:N/2])
print ('# of cycles=%d'%cycles)
print ('%d days/cycle'%(N*1./cycles))
print ('frequency =%.5f'%(cycles*1./N))
# temp=S*0
# temp[max_index]=1
# y_corr=ifft(temp)
# plt.plot(y_corr)
# plt.show()


# of cycles=8
128 days/cycle
frequency =0.00781


SofaSofa数据科学社区DS面试题库 DS面经

Zealing   2019-03-13 03:20

谢谢 - zhaijing   2019-03-13 10:14
你这个例子是个确定性信号吧,如果是随机信号,是不是先求自相关函数,然后在傅里叶变换到功率谱密度。 - shilongcn   2019-03-13 11:00
加了噪声,已经是随机信号。不求自相关函数,直接通过fft求功率谱密度函数。 - Zealing   2019-03-13 11:36
谢谢,受教了,频率谱转功率谱的时候,频率范围缩小为了N/2,为什么呢?有没有相关资料呀? - shilongcn   2019-03-13 16:06
那是因为当输入为实数时,DFT系数共轭偶对称$X_k=X^*_{N-k}$。 - Zealing   2019-03-13 16:55
Thank you! - shilongcn   2019-03-14 14:05
3

一个是方法是画图,直接肉眼观察

还有一个方法就是利用自相关系数来确定周期(什么是自相关系数

SofaSofa数据科学社区DS面试题库 DS面经

LiShanfei   2019-02-17 11:37

谢谢,学习了 - zhaijing   2019-03-12 11:07
2

我猜你是想把时序数据分成趋势数据、周期数据、残差数据,好多工具呢,比如facebook家就开源了一个。

SofaSofa数据科学社区DS面试题库 DS面经

gudong321   2019-03-12 17:17

谢谢 - zhaijing   2019-03-13 10:14


  相关讨论

python中有哪些关于隐马尔可夫模型(HMM)的package?

python里有现成的卡尔曼滤波器的包吗?

怎么对时间序列进行交叉验证?

ARIMA模型中的三个参数(p, d, q)都是什么意思?

如何判断时间序列的周期性?

怎么判断一个时间序列是平稳的?

怎么对时间序列类的数据进行聚类?

怎么在python中获取昨天的日期的字符串?

python中怎么判断某一年是闰年?

python中如何修改时间戳变量里的小时?

  随便看看

鞍点的数学定义是什么?

Resnet-18, Resnet-50, Resnet-101这些模型里的数字是什么意思?

cvr和ctr的区别是什么?

对连续特征一定要进行分箱处理吗?

如果样本不是正态分布,还能用t-test或者z-test吗?