怎样选择合适的算法?比如这个天气预报数据预测电力故障

  统计/机器学习 监督式学习 模型验证 时间序列 Python    浏览次数:2349        分享
1

新手请教各位前辈。项目是用图1的「天气预报」的数据去预测「电力故障的数量」。


1. 总的来说是一个「回归」问题,什么类型的算法预测效果会比较好呢?

2. target还挺不平衡的(如图2),2/3都是零,非零也主要集中在0-1之间,有延伸至30左右的long tail。这种情况下选模型调参有什么需要注意的地方吗?





 

ladychili   2019-07-08 21:28



   1个回答 
0

参考一下这个问题怎么处理真值大部分为0的回归问题

上面那个问题中kykix回答的可能比较适合你

1)先用所有样本做一个逻辑回归

2)然后对非零样本取log

3)再对log后的非零样本做回归

4)最后再把结果综合起来

SofaSofa数据科学社区DS面试题库 DS面经

木子周   2019-07-09 23:28

非常感谢,我会试试看 - ladychili   2019-07-10 09:57


  相关讨论

怎么对时间序列进行交叉验证?

SARIMAX是什么算法?

python中如何修改时间戳变量里的小时?

fbprophet.Prophet里的growth='linear'和growth='logistic'有什么区别?

求助,按照百度的方法从日期提取年龄出现错误了

python如何对日期做遍历?有没有类似range的函数?

怎么把datetime类型转为字符串类型,但只保留日期

python中怎么判断某一年是闰年?

怎么在python中获取昨天的日期的字符串?

python两个日期,求间隔的天数

  随便看看

怎么对pandas dataframe的列求众数

把pandas.DataFrame中所有行全部随机排列

二维numpy.array转为一维的numpy.array或者list

鞍点的数学定义是什么?

如果样本不是正态分布,还能用t-test或者z-test吗?