news 2026/6/10 18:41:28

AI全景之第五章第一节:深度学习(卷积神经网络CNN)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI全景之第五章第一节:深度学习(卷积神经网络CNN)

第五章:卷积神经网络(CNN):从LeNet到ConvNeXt的演进

学习目标

深入理解卷积神经网络的基本原理与核心设计思想,掌握CNN架构演进的关键突破点,能够分析不同CNN变体的适用场景,并具备根据任务需求选择或设计合适CNN架构的能力。


一、卷积神经网络的基石:核心思想与基本组件

1.1 卷积操作的本质:从全连接到局部连接

传统神经网络的局限性
  • 全连接网络:每个神经元与上一层的所有神经元相连
  • 参数爆炸:对于图像数据(如224×224×3 = 150,528像素),单层全连接就需要数亿参数
  • 平移不变性缺失:相同特征出现在不同位置需要重新学习
卷积的核心创新
  1. 局部连接(局部感受野)

    • 每个神经元仅连接输入区域的局部
    • 生物启发:视觉皮层神经元仅处理视野的局部区域
    • 数学表达:yi,j=∑m=0k−1∑n=0k−1wm,n⋅xi+m,j+n+by_{i,j} = \sum_{m=0}^{k-1} \sum_{n=0}^{k-1} w_{m,n} \cdot x_{i+m,j+n} + byi,j=m=0k1n=0k1wm,nxi+m,j+n+b
  2. 权值共享(卷积核)

    • 同一卷积核在输入的不同位置使用相同的权重
    • 显著减少参数:从百万级降至百级
    • 实现平移等变性:无论特征出现在何处,使用相同检测器
  3. 多通道设计

    • 输入:彩色图像有RGB三个通道
    • 输出:每个卷积核生成一个特征图,多个卷积核形成多通道特征
    • 三维卷积核:处理多通道输入,融合跨通道信息

1.2 卷积网络的基本架构组件

卷积层(Convolution Layer)
# 卷积操作的核心参数kernel_size=3# 卷积核大小,常用3×3, 5×5, 7×7stride=1# 滑动步长,控制输出尺寸padding='same'# 填充方式,保持空间尺寸或减小filters=64# 卷积核数量,决定输出通道数
池化层(Pooling Layer)
  • 最大池化:提取最显著特征,增强平移不变性
  • 平均池化:平滑特征,减少噪声影响
  • 全局池化:将特征图压缩为标量,替代全连接层
激活函数
  • ReLU(Rectified Linear Unit)f(x)=max(0,x)f(x) = max(0, x)f(x)=max(0,x)
    • 优点:计算简单,缓解梯度消失,加速收敛
    • 缺点:神经元"死亡"问题(负值完全抑制)
  • 变种:LeakyReLU、PReLU、ELU、GELU
归一化层
  • 批归一化(BatchNorm):对小批量数据标准化,稳定训练
  • 层归一化(LayerNorm):对单个样本所有特征标准化,适用于RNN
  • 实例归一化(InstanceNorm):风格迁移任务常用

二、CNN演进里程碑:从开创到成熟

2.1 开创期:LeNet-5(1998)——卷积网络的雏形

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/11 6:38:07

论文“质检报告”已生成:数据分析如何让你的论文告别纸上谈兵?

深夜的校园里,图书馆的灯光还亮着,键盘敲击声此起彼伏。又到了一年一度的毕业季,无数学生正为毕业论文熬夜奋战。 写作、查重、格式调整、文献整理...每个环节都让人头疼不已。AI写作工具逐渐成为学术研究的得力助手,但市场上琳琅…

作者头像 李华
网站建设 2026/6/10 6:16:20

洗衣液哪些牌子好?洗衣液哪类品牌比较好用?

洗衣液哪些牌子好?洗衣液哪类品牌比较好用? 面对超市货架上琳琅满目的洗衣液品牌,以及电商平台里五花八门的产品分类,很多消费者都会陷入选择困境:到底选哪个牌子才能洗得干净又不伤衣?贵的就一定好用吗&am…

作者头像 李华
网站建设 2026/6/10 23:00:23

你的论文正被“大数据巡逻队”锁定:如何让AIGC痕迹瞬间隐身?

这是2025年学术圈的新常态——论文不仅要过“查重关”,还要过“AIGC检测关”。随着高校和期刊普遍部署专业系统识别AI生成文本,学术写作进入了“双轨制审核”时代。 你可能会发现,辛辛苦苦用AI辅助完成的论文,在常规查重中表现良…

作者头像 李华
网站建设 2026/6/10 1:46:42

在Blazor项目里构造一个覆盖面广泛的权限组件

前言 之前笔者写过一篇推广Blazor的博客《安利一下Blazor:.NET开发者的全栈“优”选项》,简单的聊过一点Blazor的话题,以及它和一些前端框架(如Vue,React)的异曲同工之处。 近期在开发的一个基于Blazor S…

作者头像 李华
网站建设 2026/6/10 17:11:17

FaceFusion人脸替换可用于文化遗产活化再现

FaceFusion人脸替换可用于文化遗产活化再现 在敦煌莫高窟的一幅唐代壁画前,一位游客举起手机扫描二维码——刹那间,画中身着华服的供养人缓缓转头,微笑着开口讲述千年前开凿石窟的故事。这不是科幻电影场景,而是借助AI技术正在实现…

作者头像 李华
网站建设 2026/6/11 0:36:28

出售前如何擦除iPhone数据?9个技巧与3种简单解决方案

iPhone的使用寿命很长,如果保养得当,通常可达10年。但由于苹果频繁更新设备,大多数用户每3年就会通过出售旧设备来升级。然而,在出售之前,采取一些步骤以避免潜在问题是非常重要的。本文将介绍如何在出售前擦除iPhone数…

作者头像 李华