决策回归树

  统计/机器学习 回归分析    浏览次数:4022        分享
0

各位大佬,想请教~~

在训练回归tree的时候,是如何抉择初始化分割节点(哪个节点,具体value)

看书的时候说是利用贪心算法。

我的理解是 遍历所有的特征作为某个节点,然后分割value不知道该怎么选?

应该是选取loss最小的那个特征作为分割节点

不知道理解对否,谢谢!

 

jd910910   2018-09-06 17:46



   2个回答 
3

你所谓的分割value也是根据metric来的。

可以参考一下这个对于数值特征,决策树是如何决定分割阈值的?

SofaSofa数据科学社区DS面试题库 DS面经

木子周   2018-09-06 21:35

3

用左子节点的均值作为左子节点的预测值,用右子节点的均值作为右子节点的预测值,对比真实值,可以得到MSE或者MAE

遍历所有特征的所有分割点,找到MSE或者MAE最小的那个分割点

SofaSofa数据科学社区DS面试题库 DS面经

东布东   2019-01-16 09:24



  相关讨论

随机森林回归

GBDT+LR的工作原理?

随机森林回归输出的结果除了采用每棵决策树的平均值,还有别的方法吗?

为什么我用随机森林模型每次的score都不同 差异很大

gbdt为什么需要泰勒公式展开进行节点分裂计算

关于为什么要用GBDT的疑问

请教lightGBM中的level wise具体计算步骤是怎样的?

Adaboost里的树有没有可能权重是负数?

Gradient tree boosting和random forest (随机森林) 有什么区别和联系

怎么理解RandomForest中的max_features?

  随便看看

python直方图y轴显示占比,而不是绝对数值

xgboost的gblinear是什么意思?

numpy里生成单位矩阵?

'numpy.ndarray' object has no attribute 'head'

线性回归或者逻辑回归中常提到的AIC和BIC是什么意思?