公共自行车使用量预测怎么进行特征处理?

  板凳区 Sofa竞赛1    浏览次数:4744        分享
0

我用了xgboost进行简单预测,加入了网格搜索gridSearchCV,在训练集上表现效果还行,但是误差200+,怎么解决啊,大神们

 

杨花似雪   2018-07-14 22:59



   2个回答 
0

这里也有些讨论

有些特征可以做一做加减乘除吧

SofaSofa数据科学社区DS面试题库 DS面经

okayguy   2018-07-15 11:37

但是特征之间的相关性有点理不清,不知道怎么进行处理 - 杨花似雪   2018-07-15 17:42
sklearn.feature_selection.mutual_info_regression 特征和目标之间的互信息。 pandas的一些工具corr()什么的 还有可视化工具matplotlib seaborn这些可以做数据可视化。 但是这个比赛数据很简单,分析不出什么东西。 做几个模型融合应该会好点吧。。 - 青年余文乐   2018-11-21 11:29
0

请问一下楼主,测试集的误差怎么算呀,也没给真实值啊

SofaSofa数据科学社区DS面试题库 DS面经

Super Wang   2020-03-19 20:43

直接对train.csv划分数据集 - swu_czh   2020-10-10 17:08


  相关讨论

Sofa竞赛1的排名数据修复中

#关于公共自行车使用量预测#这个例子计算RMSE时,测试集的真实值在哪里?

第一个比赛预测自行车数量的问题

第一个比赛,自行车,排名靠前的,是做了特征工程吗,

【竞赛1】讨论汇总

怎么看自己提交的成绩呢?

XGBoost模型是如何对属性进行预测的?

求教一下:怎么进阶

有偿!!如何写一个restful api

作为一个ML的博士应该怎么去怎么找文献?

  随便看看

推荐系统有哪些常用的评价标准

logloss的取值范围是多少?一般好的分类器能达到多少?

除了PCA,还有什么降维的方法?

python里的<<或者>>符号是什么意思?

为什么LR要用Sigmoid函数?