对于时间序列类型的预测模型,应该怎么进行交叉验证呢?
如果用普通的交叉验证,会有数据泄露,那么该怎么办呢?
1个回答
你说的对,不能用普通的交叉验证,这样会有数据泄漏。
有个方案是保证时间顺序,永远用后面的数据作为测试集。
比如说你的数据是从1月份到12月。
那么你可以:
1到6月训练,在7月上验证
2到7月训练,在8月上验证
3到8月训练,在9月上验证
4到9月训练,在10月上验证
5到10月训练,在11月上验证
这样的缺点是,1到6月的数据从来不会被用作验证集,所以你最后根据上面交叉验证的结果,是有些偏差性的。
示意图如下:
如果各位有其他的好方法,欢迎指正~
谢谢!正在找这个呢!
-
yayat
2018-02-26 03:39