cart分类树用基尼指数最小选特征,基尼类似熵概念(值越大不确定性越高),那在选择最初点时,不就该选这种包含信息多的特征作为起始点吗? 可是书里写的是最小原则? 实在不解,求大神解读
1个回答
你这里指的gini指数一般叫做gini不纯。
gini impurity越小,说明这个分叉的结果越纯净,所以就是选小的。
参考问题Gini指数、Gini系数、Gini不纯是一回事吗?
SofaSofa数据科学社区DS面试题库 DS面经
明白了 谢谢
-
jd910910
2018-06-26 13:44