news 2026/6/2 22:47:26

layer normalization和batch normalization

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
layer normalization和batch normalization

layer normalization

常用于长序列文本处理。

https://www.bilibili.com/video/BV1jdWUzkEWc?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在样本内部做归一化,假设一个batch内有五句话(五个样本),对于第一句话,I like to eat apples有五个单词,每个单词的向量由五个维度表示,那么对每个单词的五个维度的特征值计算一个均值和方差,从而实现层归一化。

例题:

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解:shape(batch,序列长度,特征维度)===》(一个batch有几个句子,一个句子有几个单词,每个单词的特征由几个维度表示),也就是有几个单词那么就要计算几个均值和方差。

batch normalization

多应用于图像处理。

https://www.bilibili.com/video/BV1qdWUzkEad?spm_id_from=333.788.videopod.sections&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

在一个batch中的多个样本做归一化,本质上就是对一个batch中多个图片的第i层通道一起做归一化计算,一层通道计算一次均值和方差。

例题:

https://www.bilibili.com/video/BV1L2421N7jQ/?spm_id_from=333.337.search-card.all.click&vd_source=3ca0ef7e7d00a2f1b8033084a87a3a84

解:shape(batch,通道数,高度,宽度),每个样本对应的通道一起做归一化,那么也就是有多少层就要计算多少个均值和方差。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/2 5:12:35

13、Linux 系统上网配置与使用全攻略

Linux 系统上网配置与使用全攻略 在当今数字化时代,互联网已经成为我们生活和工作中不可或缺的一部分。对于使用 Linux 系统的用户来说,如何顺利连接到互联网并高效使用各种网络服务是一个重要的话题。本文将详细介绍 Linux 系统中网络连接的配置、故障排查以及常用网络工具…

作者头像 李华
网站建设 2026/6/1 6:47:40

【Java毕设源码分享】基于springboot+vue的非物质文化遗产数字化传承平台设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/5/31 22:21:13

5分钟掌握nvm-desktop:终极Node.js版本管理解决方案

还在为不同项目需要不同Node.js版本而烦恼吗?nvm-desktop为你提供了完美的解决方案。这款基于Tauri框架开发的桌面应用程序,让Node.js版本管理变得前所未有的简单高效。 【免费下载链接】nvm-desktop 项目地址: https://gitcode.com/gh_mirrors/nv/nv…

作者头像 李华
网站建设 2026/6/2 9:48:15

抛弃 try-catch,错误处理的新方案

在日常开发中,错误处理是不可或缺的环节。提到JavaScript中的错误处理,多数开发者第一时间想到的就是 try-catch 语句。它虽然能捕获代码中的异常,避免程序崩溃,但在实际使用中却存在不少痛点。随着前端技术的发展,越来越多更优雅、更高效的错误处理方案应运而生。本文就将…

作者头像 李华
网站建设 2026/6/1 4:12:12

TestDisk数据恢复终极救援:从硬盘灾难到文件重生的完整指南

当你打开电脑,发现重要分区神秘消失,工作文档和珍贵照片不翼而飞,那种恐慌感足以让人窒息。但请深呼吸,开源世界的"数字救援队"TestDisk和PhotoRec已经整装待发,准备为你找回那些看似永久丢失的数据宝藏。 【…

作者头像 李华
网站建设 2026/5/31 20:42:21

Qwen3-8B-MLX-6bit:双模推理+低精度部署,重塑企业级AI应用范式

Qwen3-8B-MLX-6bit:双模推理低精度部署,重塑企业级AI应用范式 【免费下载链接】Qwen3-8B-MLX-6bit 项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-8B-MLX-6bit 导语 阿里达摩院发布的Qwen3-8B-MLX-6bit开源模型,以82亿参…

作者头像 李华