自己生成了一些组合特征,将一些特征独热编码了,用的GBDT或者XGB模型,要不要用模型之前先进行特征选择?要的话用什么方法进行特征选择好?加入weather特征独热编码后要不要删掉原来的weather特征?然后有些大佬说多个模型融合效果好,基于单个模型的线性回归等得到的RMSE都是20-30左右,而单个GBDT、XGB、RF调下参就有15左右,那选择哪几个模型融合效果会较好呢?哪位排名靠前的大佬分享下思路呗。。
2个回答
请问一下大佬计算RMSE时,测试集的真实值提供了吗?
SofaSofa数据科学社区DS面试题库 DS面经
测试集的没有提供啊,提供的话每个人都是满分了
-
abuu
2020-03-19 16:21
那计算RMSE值怎么算,不是需要预测值和真实值才能算吗
-
Super Wang
2020-03-19 16:40
系统里肯定有的吧,在后台计算的,没有在网站上公布真实值
-
abuu
2020-03-20 08:47
那楼主的RMSE值不是自己算的吗,怎么看RMSE的值呢?
-
Super Wang
2020-03-20 12:53
真实值的RMSE您提交了就能看到了,系统每两小时更新一次。测试集的RMSE可以自己做交叉验证。
-
SofaSofa驹炜
2020-03-20 21:44