news 2026/5/26 16:41:57

音频格式全解析:PCM到AAC

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
音频格式全解析:PCM到AAC

目录

一、PCM(最基础,必须懂)

✅ PCM 是什么?

PCM 的特点

PCM 的关键参数

PCM 示例(16bit)

二、WAV(PCM 的“盒子”)

✅ WAV 是什么?

WAV 的特点

WAV 文件结构

WAV vs PCM

三、MP3(有损压缩,体积小)

✅ MP3 是什么?

MP3 的特点

MP3 工作原理(简化)

常见码率

四、AAC(MP3 的升级版)

✅ AAC 是什么?

AAC 的特点

AAC 常见场景

AAC 类型

五、它们之间的关系(一图理解)

六、在 C++ 音视频学习中的真实用途


一、PCM(最基础,必须懂)

✅ PCM 是什么?

PCM(Pulse Code Modulation,脉冲编码调制)
👉最原始的音频数据格式,没有压缩。

你可以把 PCM 理解为:

声卡直接吐出来的声音数字

PCM 的特点

  • ❌ 没有文件头

  • ❌ 没有压缩

  • ✅ 音质最好

  • ❌ 体积最大

  • ✅ 所有音频格式的“原材料”

PCM 的关键参数

参数含义
采样率44100Hz / 48000Hz
采样位数16bit / 24bit
声道数1(单声道) / 2(立体声)
数据排列little endian

PCM 示例(16bit)

01 00 FF 7F 80 FF ...

👉在 C++ 里通常就是:

int16_t sample;

二、WAV(PCM 的“盒子”)

✅ WAV 是什么?

WAV = PCM + 文件头

它不是压缩算法,而是一个容器格式

WAV 的特点

  • 内部通常存的是 PCM

  • 有 RIFF / fmt / data 等头信息

  • 播放器可以直接识别

WAV 文件结构

| RIFF | fmt | data |

WAV vs PCM

对比PCMWAV
是否压缩
是否有头
能否直接播放

👉开发中常见场景:

  • 采集音频:PCM

  • 保存测试文件:WAV


三、MP3(有损压缩,体积小)

✅ MP3 是什么?

MP3 = 有损音频压缩格式

MP3 的特点

  • ✅ 有损压缩

  • ✅ 文件小

  • ❌ 音质有损

  • ❌ 不适合二次编辑

MP3 工作原理(简化)

  1. PCM 输入

  2. 心理声学模型(人听不见的丢掉)

  3. 频域压缩

  4. 输出 MP3

常见码率

  • 128 kbps(普通)

  • 192 kbps(较好)

  • 320 kbps(高质量)


四、AAC(MP3 的升级版)

✅ AAC 是什么?

AAC(Advanced Audio Coding)

AAC 的特点

  • ✅ 同等码率下比 MP3 音质好

  • ✅ 更适合流媒体

  • ✅ 延迟低

  • ❌ 编码解码复杂

AAC 常见场景

  • 视频音频(MP4)

  • 直播推流(RTMP / HLS)

  • 手机系统(iOS / Android)

AAC 类型

类型场景
AAC-LC最常用
HE-AAC低码率
HE-AAC v2极低码率

五、它们之间的关系(一图理解)

真实声音 ↓ PCM(原始数据) ↓ WAV(加壳保存) ↓ MP3 / AAC(压缩编码)

六、在 C++ 音视频学习中的真实用途

学习阶段你会用到
音频采集PCM
音频播放PCM / WAV
文件保存WAV
音频压缩MP3 / AAC
音视频同步AAC + H264
推流直播AAC
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 6:54:49

FaceFusion能否对接阿里云OSS?直接读取云端素材

FaceFusion 能否对接阿里云 OSS?实现云端素材直读的技术路径在智能媒体处理日益向云端迁移的今天,越来越多开发者开始思考:我们是否还能固守“先下载、再处理”的本地化工作流?尤其是在人脸替换这类资源密集型任务中,面…

作者头像 李华
网站建设 2026/5/26 0:56:27

深度学习简介

深度学习的定义深度学习是机器学习的一个子领域,基于人工神经网络(尤其是深层结构)进行数据表征学习。其核心思想是通过多层非线性变换,从原始数据中自动提取高层次的特征,无需依赖人工设计的特征工程。关键特点层次化…

作者头像 李华
网站建设 2026/5/26 6:51:49

FaceFusion支持脸颊脂肪分布调整:体型关联变化

FaceFusion支持脸颊脂肪分布调整:体型关联变化 在影视特效和虚拟内容创作领域,一个长期困扰开发者的问题是:为什么换脸后的人物总“差点意思”?即便五官对齐、肤色匹配,观众仍能敏锐察觉出违和感。问题往往不在于脸本…

作者头像 李华
网站建设 2026/5/26 7:37:06

FaceFusion开发者团队背景揭秘:来自知名AI实验室

基于ESP32的低延迟无线麦克风系统设计与实现在远程会议、直播带货和智能语音交互日益普及的今天,人们对音频传输的实时性和稳定性提出了更高要求。传统蓝牙音频设备虽然普及度高,但动辄100ms以上的延迟让其难以胜任唇音同步、实时对讲等场景。有没有一种…

作者头像 李华
网站建设 2026/5/25 22:19:28

FaceFusion能否用于天文科普?星座人物化演绎

FaceFusion能否用于天文科普?星座人物化演绎在智能手机都能拍出银河的今天,我们离星星似乎更近了。可奇怪的是,大多数人依然叫不出几个星座的名字。学校里的天文课还在用黑白星图讲解黄道十二宫,孩子们盯着那些抽象连线发呆——为…

作者头像 李华
网站建设 2026/5/25 21:48:31

AI模型量化部署,AI应用架构师的核心竞争力

提升核心竞争力:AI模型量化部署全解析 摘要/引言 在当今AI技术飞速发展的时代,AI应用架构师面临着诸多挑战,其中高效的AI模型量化部署是关键一环。随着AI模型规模和复杂度不断增长,如何在有限的硬件资源上快速、准确地部署模型成…

作者头像 李华