朴素贝叶斯中的朴素是什么意思?Naive Bayes为什么是拿衣服的?
1个回答
朴素贝叶斯中的“朴素”二字突出了这个算法的简易性。
朴素贝叶斯的简易性表现该算法基于一个很朴素的假设:所有的变量都是相互独立的。用贝叶斯定理可以写成
$$P(Y|X_1,X_2)=\frac{P(X_1|Y)P(X_2|Y)P(Y)}{P(X_1)P(X_2)}.$$
但是在很多情况下,所有变量两两之间独立,这几乎是不可能的。
举个例子:
$Y$ = 这个人是否是举重运动员
$X_1$ = 性别
$X_2$ = 这个人能否举起100公斤的箱子
变量$X_1$和$X_2$显然不是独立的。
换句话说,朴素贝叶斯的独立性假设很傻很天真,too simple,sometimes naive,所以预测精度往往不是很高。