决策树是如何得到量化的概率,不只是0或1的标签?
2个回答
举个例子好了,你要判断今天有没有下过雨。你观测了过去32天的两项特征:一、能不能看到太阳,二、地上有没有水。于是你就把这32天的数据做成了如下的决策树。
假如今天能看得到太阳,那么根据上面的决策树,今天下雨的概率为1/(1+9)=0.1
假如今天不能看到太阳,但是地上有水,那么预测今天下过雨的概率为18/(18+2)=0.9
假如今天不能看到太阳,地上也没有水,那么预测今天下过雨的概率为0/(0+2)=0.0
所以决策树预测出来的概率就是对应子节点里下雨天的比率。
谢谢!你的图解释得清楚。乍一看,“天上有没有太阳”有点奇怪,意思应该是“能不能看到太阳”吧
-
CatalanFubini
2017-12-15 16:06
其实预测出的分类也是根据数值概率来的。
比如一个叶节点里有3个阳性样本,2个阴性样本,那么这个叶节点预测出来的概率就是0.6。因为0.6 > 0.5,所以预测出来的标签是阳性。