请教一下:关于融合stack

  统计/机器学习 回归分析 监督式学习 Python 数据竞赛    浏览次数:3610        分享
0

回归,其实也就是第一个小竞赛。

我直接用单模型跑的,在5kfold,rmse的均值是14.4多。

因为数据过于干净,我试过对分类的数量少的合并,还有对室外和体感做斜率,包括把时间分为工作时间和下班时间,做特征,效果都贼j8差,不如三下五除二的直接fit。排名中等。

于是我就想可能特征已是极限,需要上stack了。

于是我拿rflrgbdtlassolgb等做了一个七列的预测矩阵,把预测矩阵放在xgb下重新训练,

在5折上均值14.9多,也就是这个class瞎忙活了,

真心求教一下,是不是思路错了???


 

陈十一   2018-04-13 16:52



   1个回答 
0

室外和体感做斜率是什么意思?


SofaSofa数据科学社区DS面试题库 DS面经

TheTheThe   2018-04-13 22:22



  相关讨论

有大佬可以分享一下竞赛的TOP解决方案吗

模型融合问题

时下最流行的模型

如何在本地判断算法效果得到优化?

随机森林中的predict_proba

神经网络的预测结果一样,请问我应该怎么改进?

用投票融合(VotingClassifier)的过程中出现问题,求帮助?

大数据建模、分析、挖掘技术应用研修

numpy.array转换为图片并显示出来

大数据建模、分析、挖掘技术应用研修班

  随便看看

pandas.DataFrame里的loc和iloc什么区别?

pandas读取csv中指定的某些列

pandas报错: 'DataFrame' object has no attribute 'unique'

numpy.array从行向量转为列向量

回归问题中R方可以小于0吗?