随机森林模型可以给出变量的Importance。这个重要性是怎么来的?有明确的定义吗?
谢谢!
2个回答
sklearn里的importance就是所谓的Gini importance。
一个feature的importance等于这个feature在所有的树里的Gini importance的和。
Gini importance就是树在这个feature进行分叉时,Gini impurity下降的数值。
random forest和xgboost计算feature importance是一样的
可以参考这个问题:在random forest和xgboost这类集成树模型中是如何计算_feature_importance的里的回答
SofaSofa数据科学社区DS面试题库 DS面经