ensemble模型时,bagging和stacking有什么区别?

  统计/机器学习 开放问题    浏览次数:8450        分享
0

在提到ensemble的时候,经常会有bagging或者stacking这两种合成方法?

严格上来,它们有什么区别?


 

得得得   2018-01-24 15:06



   2个回答 
5

关于bagging,可以看看这个,bagging是什么意思

说说区别

1. bagging每次是用部分随机数据,然后训练出一个模型。以此反复训练同类型模型(比如多个决策树)。就会多个同类型模型,然后把这些模型的预测结果取均值,就得到了bagging后模型的预测结果。

2. stacking是指训练了多个不同类型模型,比如一个knn,一个svm,一个decision tree,最后把三个预测结果取均值,得到最后的预测结果。

SofaSofa数据科学社区DS面试题库 DS面经

清风   2018-02-08 09:57

2

感觉这两个词也经常混用的。没什么大的讲究吧。

bagging主要强调的是bootstrap的aggregation,一般是指用整个数据集中部分随机样本训练出多个同类型的模型,然后将这些模型叠加在一起(一般简单的处理就是取均值)。常见的比如tree bagging,random forest,bagging of LR。

stacking一般是指用数据集训练出多个不同类似的模型,然后将这些模型的结果组合在一起(对它们的结果取均值,或者加权平均)。


SofaSofa数据科学社区DS面试题库 DS面经

DuckU   2018-02-21 09:04



  相关讨论

hyperparameter与parameter的区别?

除了线性回归,逻辑回归,线性模型(linear model)包括哪些模型和算法?

seq2seq模型有什么应用场景?

推荐开放数据库

sota model是什么意思?

few-shot learning是什么意思?

机器学习+计算机网络

函数型数据分析

建立一个预测模型的流程是什么

baseline模型和benchmark模型的差别?

  随便看看

为什么机器学习中的优化问题很少用到牛顿法?

如何清空pandas dataframe里的全部数据但是保留列名?

logloss的取值范围是多少?一般好的分类器能达到多少?

pandas把一列日期转换为星期

什么是SMOTE sampling方法?