随机森林中增加树的数量对于偏差和方差的影响
2个回答
Random Forsest是由很多个数组成的,最终的结果可以看作是
$$M=\frac{M_1+M_2+\cdots+M_n}{n}$$
假设$M_i$是同分布的,那么$\mathbb{E}(M)$和$\mathbb{E}(M_i)$是相等的;而对于方差$\text{Var}(M)$应该就是只有$\text{Var}(M_i)$的$1/n$。$n$越大,方差越小,但是减小的幅度也随之变小。所以通常1000以内也就够了。
SofaSofa数据科学社区DS面试题库 DS面经
thx!
-
GEASS
2018-09-02 18:44