集成学习boosting

最新推荐文章于 2021-08-31 19:40:16 发布

菱形继承

最新推荐文章于 2021-08-31 19:40:16 发布

阅读量267

点赞数

CC 4.0 BY-SA版权

分类专栏： # Machine learning 文章标签：机器学习

如果想转请私信博主，未经同意禁止转载~

本文链接：https://blog.csdn.net/weixin_43798170/article/details/117202434

Machine learning 专栏收录该内容

5 篇文章

订阅专栏

本文解析了Boosting的核心思想，即挑选基础模型中的精英，并通过加法模型优化，调整样例权重以降低偏差。重点对比了Boosting与Bagging在样本选择、样例权重和预测函数上的区别，以及并行计算能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Boosting 的核心思路是 — — 挑选精英。

Boosting 和 bagging 最本质的差别在于他对基础模型不是一致对待的，而是经过不停的考验和筛选来挑选出「精英」，然后给精英更多的投票权，表现不好的基础模型则给较少的投票权，然后综合所有人的投票得到最终结果。

大部分情况下，经过 boosting 得到的结果偏差（bias）更小。

具体过程：

通过加法模型将基础模型进行线性的组合。
每一轮训练都提升那些错误率小的基础模型权重，同时减小错误率高的模型权重。
在每一轮改变训练数据的权值或概率分布，通过提高那些在前一轮被弱分类器分错样例的权值，减小前一轮分对样例的权值，来使得分类器对误分的数据有较好的效果。

Bagging 和 Boosting 的4 点差别

样本选择上：

Bagging：训练集是在原始集中有放回选取的，从原始集中选出的各轮训练集之间是独立的。

Boosting：每一轮的训练集不变，只是训练集中每个样例在分类器中的权重发生变化。而权值是根据上一轮的分类结果进行调整。

样例权重：

Bagging：使用均匀取样，每个样例的权重相等

Boosting：根据错误率不断调整样例的权值，错误率越大则权重越大。

预测函数：

Bagging：所有预测函数的权重相等。

Boosting：每个弱分类器都有相应的权重，对于分类误差小的分类器会有更大的权重。

并行计算：

Bagging：各个预测函数可以并行生成

Boosting：各个预测函数只能顺序生成，因为后一个模型参数需要前一轮模型的结果。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。