我的数据集只有四个特征,为什么决策树的深度可以是大于四的?
这四个特征用完之后,决策树为什么还能继续分叉?
决策树的深度是应该小于等于数据特征个数的关系吗?
新人刚入ML的坑,问题小白,多多包涵。
1个回答
你理解错了,树的深度和特征的个数没有什么必然联系。
对于二元特征来说,只能被使用一次。可是对于一个数值特征,它可以被反复使用,而不只是使用一次。
下面就是一个小例子,年龄这个特征被用了两次。此时树的深度是2。
谢谢大牛!
-
cyh
2018-03-15 09:15