news 2026/6/29 17:06:50

李宏毅深度学习课程集成学习学习报告

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
李宏毅深度学习课程集成学习学习报告

近期学习了李宏毅老师深度学习课程中的集成学习(Ensemble Learning) 章节,系统学习了集成学习的核心思想、误差优化原理、Bagging、Boosting、Stacking 三大主流框架。相较于单个模型训练,集成学习通过多模型融合大幅降低模型泛化误差,是机器学习提升精度最核心、最实用的手段之一。本次学习不仅掌握了理论逻辑,同时结合课程公式与实操代码完成了算法验证,对模型优化有了更深的理解。

一、集成学习核心思想

集成学习的核心思想可以概括为:多个弱模型组合成为高精度强模型。

单一模型往往存在固有缺陷:

简单模型:高偏差、欠拟合

复杂模型:高方差、过拟合

集成学习通过多模型差异化训练 + 结果融合,同时降低偏差与方差,从而获得更优的泛化性能。

集成通用预测公式:

二、集成学习三大算法原理(含核心公式)

1. Bagging 并行集成(降低方差)

核心原理

利用自助采样 Bootstrap 构造不同训练集,并行训练多个模型,最后平均融合结果。

集成公式(回归)

Bagging 可以有效抹平单模型方差,因此对容易过拟合的模型(决策树)提升极大,典型代表为随机森林。

2. Boosting 串行集成(降低偏差)

核心原理

串行训练模型,重点学习前一轮错误样本,不断降低模型偏差,逐步提升拟合能力。

AdaBoost 权重更新公式

错误样本权重升高,后续模型更加关注难例数据,不断修正欠拟合问题。

最终集成输出:

3. Stacking 堆叠集成

用多层模型嵌套,第一层多种模型提取特征,第二层模型学习融合权重,拟合能力最强。

三、集成学习误差理论(结合课程 Bias/Variance)

李宏毅老师在课程中明确给出集成学习的误差优化逻辑:

单模型总误差


Error = Bias^2 + Variance + Noise

1. Bagging 主要降低 Variance
多个独立模型平均后:

模型越多,方差越小,过拟合越轻。

2. Boosting 主要降低 Bias
不断迭代修正拟合不足,大幅降低系统偏差,适合弱学习器。

因此:Bagging 稳、Boosting 准、Stacking 强。

四、集成学习 Python 实操代码(可直接运行)

下面给出课程对应随机森林(Bagging)+ AdaBoost(Boosting)完整极简实验代码,可复现集成效果。

# 1.构造数据集
X, y = make_classification(n_samples=1000, random_state=2026)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 2.单一决策树(弱模型)
tree = DecisionTreeClassifier()
tree.fit(X_train, y_train)
pred_tree = tree.predict(X_test)
acc_tree = accuracy_score(y_test, pred_tree)

# 3.Bagging:随机森林
rf = RandomForestClassifier(n_estimators=50)
rf.fit(X_train, y_train)
pred_rf = rf.predict(X_test)
acc_rf = accuracy_score(y_test, pred_rf)

# 4.Boosting:AdaBoost
ada = AdaBoostClassifier(n_estimators=50)
ada.fit(X_train, y_train)
pred_ada = ada.predict(X_test)
acc_ada = accuracy_score(y_test, pred_ada)

# 输出对比
print("单一决策树准确率:", acc_tree)
print("随机森林(Bagging)准确率:", acc_rf)
print("AdaBoost(Boosting)准确率:", acc_ada)
实验结论

单棵决策树:准确率最低,存在过拟合/不稳定

随机森林:方差更低,结果更稳定

AdaBoost:偏差更低,拟合精度更高
完美对应李宏毅老师课程的理论讲解。

五、学习收获与总结

通过本次集成学习的学习,并结合公式推导与代码实验,我完整掌握了集成学习的底层逻辑:

1. Bagging 通过并行平均降低方差,解决过拟合;

2. Boosting 通过迭代加权降低偏差,解决欠拟合;

3. 集成学习本质是对 Bias、Variance 的双向优化;

4. 多模型融合是低成本、高效提升模型泛化能力的核心方法。

本次学习打通了误差理论—优化算法—代码实现的完整链路,不仅理解了理论公式,也能够独立完成集成模型训练。后续我将继续结合梯度下降、反向传播知识,深入深度学习模型的集成与调优,进一步夯实深度学习基础。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/29 17:06:09

TI Dolphin FHSS无线UART开发套件:从硬件设计到协议优化的完整指南

1. 项目概述:从零开始,深入理解德州仪器Dolphin FHSS无线UART开发套件如果你正在寻找一种能够穿透复杂工业环境、抵抗干扰、同时开发门槛又相对较低的无线通信方案,那么跳频扩频(FHSS)技术绝对值得你花时间研究。而德州…

作者头像 李华
网站建设 2026/6/29 17:03:06

Kubernetes DaemonSet 与 StatefulSet 实战指南

每个节点跑一个副本的守护任务 + 需要稳定标识的有状态应用 目录 DaemonSet vs Deployment vs StatefulSet DaemonSet —— 每个节点一个 Pod StatefulSet —— 有状态应用 生产场景实战 故障排查 最佳实践 1. DaemonSet vs D

作者头像 李华
网站建设 2026/6/29 16:59:01

爬虫与反爬的博弈——滑动验证码、请求参数加密、风控绕过

入门级反爬看 UA 和 IP,进阶反爬看验证码、参数加密、行为风控。这一篇讲目前最常见的三种进阶反爬手段怎么应对。 一、滑动验证码 滑块验证码是目前应用最广的人机验证方式,常见的产品有:产品使用方难度极验 Geetest知乎、B站、斗鱼⭐⭐⭐ 标…

作者头像 李华
网站建设 2026/6/29 16:57:30

技术写作的价值与技巧

技术写作的价值与技巧:让复杂信息清晰传递 在信息爆炸的时代,技术写作成为连接专业知识与普通读者的重要桥梁。无论是产品说明书、开发文档,还是技术博客,清晰准确的表达能显著提升信息传递效率,降低沟通成本。技术写…

作者头像 李华
网站建设 2026/6/29 16:56:31

智能融合员中的技术创新与应用拓展

智能融合员中的技术创新与应用拓展 随着人工智能、大数据和物联网技术的快速发展,智能融合员作为一种新兴的职业角色,正逐渐成为企业数字化转型的核心驱动力。智能融合员不仅需要具备跨领域的知识储备,还需通过技术创新与应用拓展&#xff0…

作者头像 李华
网站建设 2026/6/29 16:52:07

SPT-AKI存档编辑器:从新手到高手的3步修改实战指南

SPT-AKI存档编辑器:从新手到高手的3步修改实战指南 【免费下载链接】SPT-AKI-Profile-Editor Программа для редактирования профиля игрока на сервере SPT-AKI 项目地址: https://gitcode.com/gh_mirrors/sp/S…

作者头像 李华