news 2026/6/12 2:48:17

13.3 变分自编码器:重参数化技巧、ELBO与后验坍缩

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
13.3 变分自编码器:重参数化技巧、ELBO与后验坍缩

13.3 变分自编码器:重参数化技巧、ELBO与后验坍缩

变分自编码器是一种基于变分推断原理的深度生成模型,它通过一个编码器-解码器结构将概率生成模型与神经网络相结合,旨在学习数据的高效、连续的潜在表示。与只能进行确定性编码的自编码器不同,VAE引入了隐变量的概率分布,使其能够从学习到的潜在空间中进行随机采样并生成新的数据样本[1]。本节将深入解析VAE的三个核心支柱:变分下界重参数化技巧以及训练中常见的挑战后验坍缩

13.3.1 从自编码器到概率生成模型

标准自编码器由编码器和解码器组成,通过学习将输入数据x xx压缩为低维潜在编码z zz(编码过程),再尽可能准确地重建x xx(解码过程)。其目标是最小化重建误差,如均方误差。然而,标准的自编码器存在两个主要缺陷:

  1. 潜在空间不规则性:学习到的潜在空间可能是不连续或不平滑的,导致对潜在点z zz进行插值或随机采样时,解码器可能产生无意义或低质量的输出。
  2. 非概率性:它是一个确定性映射,无法直接用于生成新的、多样化的数据。

VAE通过将编码过程概率化来解决这些问题。VAE假设每个真实数据点x xx都由某个未观察到的连续隐变量z zz生成。具体来说,数据生成过程是:先从先验分布p ( z ) p(z)p(z)(通常为标准正态分布N ( 0 , I ) \mathcal{N}(0, I)N(0,I))中采样一个潜在变量z zz,然后从由参数化分布p θ ( x ∣ z ) p_{\theta}(x|z)pθ(xz)(由解码器建模)中生成数据x xx。我们的目标是最大化所有数据点的边际似然p θ ( x ) = ∫ p θ ( x ∣ z ) p ( z ) d z p_{\theta}(x) = \int p_{\theta}(x|z)p(z) dzpθ(x)=pθ(xz)p(z)dz。由于这个积分难以直接计算(涉及难以处理的后验分布p θ ( z ∣ x ) p_{\theta}(z|x)pθ(zx)),VAE引入变分推断来近似求解。

13.3.2 证据下界:变分推断的核心

为了最大化真实的数据似然log ⁡ p θ ( x ) \log p_{\theta}(x)logpθ(x),VAE引入一个由编码器建模的变分分布q ϕ ( z ∣ x ) q_{\phi}(z|x)qϕ(zx)来逼近真实但未知的后验分布p θ ( z ∣ x ) p_{\theta}(z|x)pθ(zx)。通过数学推导,可以将对数似然分解为:
log ⁡ p θ ( x ) = D K L ( q ϕ ( z ∣ x ) ∥ p θ ( z ∣ x ) ) + L ( θ , ϕ ; x ) \log p_{\theta}(x) = D_{KL}(q_{\phi}(z|x) \parallel p_{\theta}(z|x)) + \mathcal{L}(\theta, \phi; x)logpθ(x)=DKL(qϕ(zx)pθ(zx))+L(θϕ;x)
其中,D K L ( ⋅ ∥ ⋅ ) D_{KL}(\cdot \parallel \cdot)DKL()表示KL散度,用于衡量两个分布的差异。由于KL散度非负,因此有:
log ⁡ p θ ( x ) ≥ L ( θ , ϕ ; x ) \log p_{\theta}(x) \geq \mathcal{L}(\theta, \phi; x)log

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 10:51:11

13.4 流模型:可逆变换与精确似然计算

13.4 流模型:可逆变换与精确似然计算 流模型是一类基于可逆变换的深度生成模型,其核心目标是通过一系列可逆的、参数化的函数,将一个简单的概率分布(如标准正态分布)转化为一个复杂的数据分布。与变分自编码器和生成对抗网络不同,流模型的显著优势在于其能够精确地计算数…

作者头像 李华
网站建设 2026/6/10 19:20:31

Excalidraw试用期策略:转化付费用户的关键

Excalidraw试用期策略:转化付费用户的关键 在远程办公成为常态的今天,团队协作工具早已不再是“锦上添花”,而是决定效率与沟通质量的核心基础设施。尤其对于技术团队而言,一次架构讨论、一场产品评审,往往都始于一块…

作者头像 李华
网站建设 2026/6/9 14:23:24

49、Windows XP使用指南:错误报告、性能优化与系统设置

Windows XP使用指南:错误报告、性能优化与系统设置 在使用Windows XP系统的过程中,我们常常会遇到各种问题,如程序报错、系统运行缓慢等。本文将为你详细介绍如何向微软报告错误、优化系统性能以及进行一系列实用的系统设置。 1. 向微软报告错误 当程序或Windows XP本身停…

作者头像 李华
网站建设 2026/6/11 22:24:06

超级应用(Super Apps)整合多模态AI能力

超级应用的定义与特点 超级应用指通过单一平台提供多样化服务(如社交、支付、出行、购物等)的应用程序,典型代表包括微信、支付宝、Grab等。其核心特点是高度集成化,通过开放API或小程序生态连接第三方服务,形成闭环用…

作者头像 李华
网站建设 2026/6/11 22:07:19

基于Java+SpringBoot+SSM顺丰仓储管理信息系统(源码+LW+调试文档+讲解等)/顺丰物流信息系统/顺丰仓储系统/顺丰管理系统/仓储管理软件/仓储信息系统/物流仓储管理/顺丰信息技术

博主介绍 💗博主介绍:✌全栈领域优质创作者,专注于Java、小程序、Python技术领域和计算机毕业项目实战✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 2025-2026年最新1000个热门Java毕业设计选题…

作者头像 李华
网站建设 2026/6/11 14:44:28

Excalidraw播客访谈邀请名单:行业KOL筛选

Excalidraw播客访谈邀请名单:行业KOL筛选 在一场远程技术评审会议中,团队成员各自盯着屏幕,试图通过文字描述解释一个复杂的微服务架构。有人发了一句:“网关后面接认证中心,然后分流到订单和库存服务……”——但没人…

作者头像 李华