RT .
2个回答
GBDT是一个树的boosting方法,并且用到的是回归树,一般来说树模型不需要对数据有太多的操作。如果要使用的话,GBDT也涉及到使用损失函数对预测值的负梯度方向信息进行更新模型,那么我觉得做归一化处理可以加速模型的预测效率。其次,如楼上所说,缺失值也是一个问题,GBDT对于缺失值没有很好的学习策略,不像xgboost,所以做好对数据的预处理也挺重要,但是数据的预处理和特征工程都是要做的事情,才会放到模型里学习。总结来说,没有什么要注意的,不过gbdt处理的是连续型的数据,做回归任务多一些。
SofaSofa数据科学社区DS面试题库 DS面经