机器学习中的投票算法是指什么?具体有哪些有名的算法是投票算法?
2个回答
voting(投票)和averaging(平均)是stacking算法两种手段。voting针对的是分类问题,averaging针对的回归问题。
比如随机森林分类就是投票算法。每棵树产生一个预测,我们最终是看所有树的预测结果,得票最多的预测结果就是最终的预测结果。
当然我们也可以创造一些投票模型,比如对于一个二分类问题,我们有5个模型:决策树、SVM、k近邻、逻辑回归、朴素贝叶斯。对于一个样本,我们就可以得到5个预测结果,它们未必相同,我们就选择得票最高的预测结果。
SofaSofa数据科学社区DS面试题库 DS面经投票就是把各个分类器的结果进行汇总。
hard voting:将各个分类器得到的结果进行汇总,选择得票最多的那个结果为预测结果。最终返回标签。
soft voting:将各个分类器得到的预测概率进行平均。最终返回概率。
sklearn里相关的实现:voting-classifier。
SofaSofa数据科学社区DS面试题库 DS面经