请教一个关于决策树的特征重要性的问题:
为什么特征重要性约大,分裂的顺序却是越靠后呢?
case请见这篇帖子:
https://blog.csdn.net/DKY10/article/details/84843864
case中的这个DEMO:
三个X的特征重要性分别为:feat importance = [0.25 0.08333333 0.04166667]
求教!谢谢。
1个回答
特征重要性和使用的先后没有必然联系的,你上面的例子应该只是巧合。
特征的重要性和节点中样本的个数有关,在其他情况一样时,节点样本个数越多,特征越重要。换句话,反而是越靠前的有可能越重要。
SofaSofa数据科学社区DS面试题库 DS面经