news 2026/5/26 8:09:54

这是一份动手学深度学习笔记!(附学习资料)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
这是一份动手学深度学习笔记!(附学习资料)

如果你正在学习深度学习,肯定听说过李沐老师的动手学深度学习,这是公认的经典之作

这一期主要是给大家总结这个教程的大纲内容

并给大家分享电子pdf、完整的教程视频、配套的课件源码以及学习笔记(如下图)

需要的兄弟可以按照这个图的方式免费获取


第一章:引言和预备知识

机器学习研究计算机系统如何利用经验(通常是数据)来提高特定任务的性能。它结合了统计学、数据挖掘和优化的思想。通常,它是被用作实现人工智能解决方案的一种手段,深度学习不仅取代了传统机器学习的浅层模型,而且取代了劳动密集型的特征工程

第二章:线性神经网络

这一部分先介绍线性回归模型,线性回归是比较简单的线性模型,用pytorch直接手搓线性回归模型,然后介绍softmax回归函数,应用于图像分类数据集,最后从零开始手搓softmax回归

第三章:多层感知机

这一部分先介绍多层感知机的原理,以及从零开始实现多层感知机,然后介绍模型选择,欠拟合和过拟合的问题,权重衰减和dropout的技巧,前向传播,反向传播和计算图模型,介绍一些数值稳定性,模型初始化,分布偏移,最后以kaggle比赛预测房价收尾


第四章:深度学习计算

这一部分先介绍神经网络的层和块,然后介绍参数管理,比如参数访问,参数初始化,参数绑定,然后介绍延后初始化,自定义参数/不带参数的网络层,读写文件,最后是张量与GPU,神经网络与GPU的介绍


第五章:卷积神经网络

这一部分先介绍卷积神经网络的结构,从全连接层到卷积,图像卷积,介绍填充和步幅,然后介绍多输入多输出通道,汇聚层,然后介绍现在常见的CNN的变体,比如VGG, GoogLeNet, ResNet, DenseNet等


第六章:循环神经网络

这一部分先介绍时间序列模型,然后是文本预处理,从零开始实现循环神经网络,然后介绍循环神经网络的变体,包括LSTM和GRU模型,双向循环神经网络,编解码器结构,序列到序列模型等


第七章:注意力机制

这一部分先介绍注意力的概念,注意力机制是深度学习中一个重要创新,这里的注意力机制包括Bahdanau注意力,多头注意力,以及自注意力,在transformer模型中引入了自注意力,交叉注意力和位置编码,引入注意力会增加计算量,但往往都有精度提升


第八章:优化算法

这一部分先介绍优化和深度学习,其次介绍凸函数,梯度下降算法,随机梯度下降,小批量随机梯度下降,动量法,AdaGrad算法,RMSProp算法,Adam优化器等


第九章:计算性能

这一部分先介绍编译器和解释器的概念,异步计算,自动并行,以及相应的硬件的支持,多GPU卡的训练,多GPU的简洁实现,参数服务器等内容


第十章:计算机视觉

这一部分先介绍计算机视觉中的图像增广,模型微调,目标检测和边界框,以及多尺度目标检测算法,目标检测的数据集,单发多框检测SSD,语义分割和数据集,全卷积神经网络,最后介绍kaggle比赛图像分类和狗的品种识别任务


第十一章:自然语言处理

这一部分先介绍词嵌入,预训练模型word2vec, 全局向量的词嵌入Glove,词的相似性和类比任务,以及Bert模型,预训练Bert, 然后介绍情感分析及数据集,使用循环神经网络和卷积神经网络做情感分析,使用注意力做自然语言推断,最后是微调Bert模型的任务

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 2:52:42

多模态媒体发布技术架构解析:Infoseek 如何支撑科技舆情的极速响应?

一、行业背景:科技舆情对媒体发布的技术诉求2025 年 12 月,字节跳动 “豆包手机” 因监管约谈谣言引发舆情风暴,涉事方需在 24 小时内通过多渠道发布澄清声明、技术解读、合规报告,传统媒体发布的 “人工对接 格式适配 效果盲测…

作者头像 李华
网站建设 2026/5/25 23:31:31

Java求职者面试:面试官与水货程序员的搞笑对决

Java求职者面试:面试官与水货程序员的搞笑对决 场景背景 在这场极具挑战的面试中,严肃的面试官和搞笑的水货程序员谢飞机相遇。谢飞机凭借他的幽默感和简短的回答,与面试官进行了三轮提问,内容涉及Java技术栈和实际业务场景。在这…

作者头像 李华
网站建设 2026/5/25 23:32:00

Linux命令行和命令行管理文件

Linux 命令行控制台Console,也就是控制台,也称为终端,提供命令行输入数据和展示命令行输出数据。物理控制台,用于与系统交互的硬件接口。虚拟控制台, 名称为tty1--tty6,通过ctrl alt F1...F6切换。tty1是…

作者头像 李华
网站建设 2026/5/25 15:27:38

OSPF综合实验2

一 实验拓扑二 实验要求1,R5为ISP,其上只能配置IP地址;R4作为企业边界路由器,出口公网地址需要通过PPP协议获取,并进行chap认证2,整个OSPF环境IP基于172.16.0.0/16划分;3,所有设备均…

作者头像 李华
网站建设 2026/5/27 4:21:39

2026年备战浙大全日制 iMBA 复试必须要抓住的三大关键机会!

随着12月20日全国MBA联考初试结束,多数考生第一时间都完成了自己的初试估分工作。具体多少分数可以进入复试?杭州达立易考教育认为:如果初试分数估在150 分上下,就可提前启动浙大全日制 iMBA 项目的复试备考,因为从这两…

作者头像 李华