1. 在特征划分之后,有对 数据分布 做前置假设吗?
2. 样本空间被特征划分之后,那么实际生成的是样本数据与划分空间之间的关系,最终还是要落到标记,划分空间与标记之间的映射关系是如何判别的?
1个回答
“1. 在特征划分之后,有对 数据分布 做前置假设吗?”
----------------------
树模型基本都是非参模型(也就是没有什么分布假设)。
正常的假设和其他监督学习差不多,就是包含训练集和预测集是同分布的,比如目标变量的分别是相对均衡的等等。
“2. 样本空间被特征划分之后,那么实际生成的是样本数据与划分空间之间的关系,最终还是要落到标记,划分空间与标记之间的映射关系是如何判别的?”
----------------------
训练好的决策树最终呈现出的结构实际上if-else组成的一个判断逻辑,从树根(顶部)往下一路判断下去就会到最终的叶节点(底部),每个叶节点也是对应的样本空间。这个叶节点里里正样本的占比,就是label为正的概率。
下图就是一个例子: