多城市二手车网站源码泉州 网站建设

张小明 2026/1/1 0:47:43
多城市二手车网站源码,泉州 网站建设,站长工具之家,个人建设纪检网站Day 16: 生成模型基础 (Generative Models Basics) 摘要#xff1a;在前面的课程中#xff0c;我们学习的分类、检测、分割任务都属于判别式模型#xff08;判断“是什么”#xff09;。而今天#xff0c;我们将进入生成式模型#xff08;创造“有什么”#xff09;的奇…Day 16: 生成模型基础 (Generative Models Basics)摘要在前面的课程中我们学习的分类、检测、分割任务都属于判别式模型判断“是什么”。而今天我们将进入生成式模型创造“有什么”的奇妙世界。从“左右互搏”的 GAN 到“概率重构”的 VAE本文将带你推开 AI 内容生成AIGC的大门。1. 判别式 vs 生成式在深入具体模型之前先搞清楚两种建模思路的区别模型类型英文核心逻辑例子比喻判别式模型Discriminative学习条件概率 $P(YX)$分类、回归生成式模型Generative学习联合概率P ( X , Y ) P(X,Y)P(X,Y)或分布P ( X ) P(X)P(X)图像生成、文本生成画家从白纸画出一幅画简单来说判别式模型在乎决策边界生成式模型在乎数据分布。2. GAN生成对抗网络 (Generative Adversarial Networks)2014年Ian Goodfellow 提出了 GAN被 Yann LeCun 誉为“过去十年机器学习领域最有趣的想法”。2.1 核心思想零和博弈GAN 由两个网络组成它们就像造假币的团伙和警察生成器 (Generator, G)负责“造假”。输入随机噪声z zz输出假图片G ( z ) G(z)G(z)。目标是骗过判别器。判别器 (Discriminator, D)负责“打假”。输入图片x xx判断它是真的来自数据集还是假的来自G GG。2.2 训练过程两者交替训练最终达到纳什均衡固定 G训练 D让 D 能尽可能区分真图和假图。固定 D训练 G让 G 生成的假图能被 D 误判为真。min ⁡ G max ⁡ D V ( D , G ) E x ∼ p d a t a ( x ) [ log ⁡ D ( x ) ] E z ∼ p z ( z ) [ log ⁡ ( 1 − D ( G ( z ) ) ) ] \min_G \max_D V(D, G) \mathbb{E}_{x \sim p_{data}(x)}[\log D(x)] \mathbb{E}_{z \sim p_{z}(z)}[\log (1 - D(G(z)))]Gmin​Dmax​V(D,G)Ex∼pdata​(x)​[logD(x)]Ez∼pz​(z)​[log(1−D(G(z)))]2.3 训练的痛点模式崩塌 (Mode Collapse)G 发现生成某种特定的图很容易骗过 D于是它就一直生成这一种图失去了多样性。训练不稳定两者很难平衡如果 D 太强G 梯度消失学不动如果 G 太强D 随便猜也没法指导 G。3. 经典 GAN 变体为了解决原始 GAN 的问题无数变体涌现3.1 DCGAN (Deep Convolutional GAN)贡献把 CNN 引入 GAN并给出了一系列工程实践建议如去掉 Pooling 用 Strided Conv用 BatchNorm用 LeakyReLU 等。地位GAN 走向实用化的第一步。3.2 WGAN (Wasserstein GAN)贡献从理论上解决了训练不稳定的问题。用Wasserstein 距离推土机距离代替原来的 JS 散度来衡量分布差异。特点训练超稳定不用小心翼翼调节 D 和 G 的平衡。3.3 StyleGAN贡献生成人脸的霸主。核心引入了Style Transfer的思想通过映射网络Mapping Network把噪声解耦控制生成的不同层级特征粗糙特征控制脸型精细特征控制发色。3.4 BigGAN贡献简单粗暴“大”就是好。更大的模型、更大的 Batch Size生成了高分辨率、高质量的 ImageNet 图像。4. VAE变分自编码器 (Variational Autoencoders)如果说 GAN 是“无中生有”VAE 则是“先压后解”。它基于贝叶斯推断是一个有着严谨数学推导的模型。4.1 结构Encoder (推断网络)输入图片x xx输出隐变量z zz的分布均值μ \muμ和方差σ \sigmaσ。Decoder (生成网络)从分布中采样z zz重构出图片x ^ \hat{x}x^。4.2 核心技巧重参数化 (Reparameterization Trick)问题直接从N ( μ , σ 2 ) N(\mu, \sigma^2)N(μ,σ2)采样这个操作是不可导的没法反向传播。解决把采样变成z μ σ ⋅ ϵ z \mu \sigma \cdot \epsilonzμσ⋅ϵ其中ϵ ∼ N ( 0 , 1 ) \epsilon \sim N(0, 1)ϵ∼N(0,1)。这样ϵ \epsilonϵ是常数μ \muμ和σ \sigmaσ就可以求导了。4.3 损失函数L o s s Reconstruction Loss KL Divergence Loss \text{Reconstruction Loss} \text{KL Divergence}LossReconstruction LossKL Divergence重构损失生成的图要像原图。KL 散度隐变量z zz的分布要尽可能接近标准正态分布N ( 0 , 1 ) N(0, 1)N(0,1)为了方便采样。4.4 GAN vs VAEGAN生成的图清晰度高但多样性可能差训练难。VAE生成的图容易模糊因为是概率分布的均值但分布特性好训练稳定。5. Flow-based Models (流模型)这是一个比较小众但优雅的流派如 Glow。核心设计一系列可逆的变换函数f ff。优点可以精确计算似然概率P ( x ) P(x)P(x)生成的隐变量极其平滑。缺点为了保证可逆网络结构受限计算量巨大。6. 代码实践PyTorch 实现最简单的 GAN这里用 MNIST 数据集演示一个全连接层的 GAN。importtorchimporttorch.nnasnn# 1. 生成器classGenerator(nn.Module):def__init__(self,z_dim64,img_dim784):super().__init__()self.gennn.Sequential(nn.Linear(z_dim,256),nn.LeakyReLU(0.01),nn.Linear(256,img_dim),nn.Tanh()# 输出归一化到 [-1, 1])defforward(self,z):returnself.gen(z)# 2. 判别器classDiscriminator(nn.Module):def__init__(self,img_dim784):super().__init__()self.discnn.Sequential(nn.Linear(img_dim,128),nn.LeakyReLU(0.01),nn.Linear(128,1),nn.Sigmoid()# 输出概率)defforward(self,img):returnself.disc(img)# 3. 训练循环伪代码# for epoch in epochs:# for real_imgs, _ in dataloader:## ### 训练判别器 #### noise torch.randn(batch_size, z_dim)# fake_imgs gen(noise)## real_score disc(real_imgs)# fake_score disc(fake_imgs.detach()) # 注意 detach不传梯度给 G## d_loss -torch.mean(torch.log(real_score) torch.log(1 - fake_score))# opt_disc.zero_grad()# d_loss.backward()# opt_disc.step()## ### 训练生成器 #### # G 希望 D 判定 fake_imgs 为真 (score 接近 1)# fake_score disc(fake_imgs)# g_loss -torch.mean(torch.log(fake_score))## opt_gen.zero_grad()# g_loss.backward()# opt_gen.step()7. 总结GAN是生成领域的“摇滚明星”效果惊艳但脾气暴躁难训练。VAE是“数学教授”理论优美但有时过于平滑图像模糊。Flow是“精密仪器”精确但昂贵。预告虽然 GAN 统治了一段时间但明天我们要介绍的扩散模型 (Diffusion Model)才是当今 AIGC 真正的王者。它结合了概率生成的稳定性像 VAE和生成质量的高保真度超越 GAN。思考为什么 GAN 的 Loss 很难指示训练进度因为它是两个网络的博弈Loss 下降不代表生成质量变好可能只是对手变弱了。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

宁波专业网站推广制作服务天津个人做网站

近日,中国猎鹰特卫国际专委会正式宣告成立,这一行业盛事获得中国新时代党建新闻网的大力支持与重点关注。作为中华人民共和国国家大数据门户网联合主办单位,中国新时代党建新闻网长期聚焦国家发展进程中重要社会组织的建设与发展,…

张小明 2025/12/27 2:40:46 网站建设

html代码雨seo收索引擎优化

外贸网站建设公司推荐在当今全球化的商业环境中,拥有一个专业且功能强大的外贸网站对于企业拓展国际市场至关重要。以下是几家值得推荐的外贸网站建设公司。百年网络科技:成立于2006年3月,是东莞市电子商务协会发起单位、首届理事单位。这家公…

张小明 2025/12/28 19:09:13 网站建设

app网站建设教程视频福田欧曼服务站电话

第一章:还在手动调参?Open-AutoGLM开源让你一键生成高性能语言模型!在深度学习领域,构建高性能语言模型往往依赖繁琐的手动超参数调优过程。如今,随着 Open-AutoGLM 的发布,这一局面被彻底改变。该项目是一…

张小明 2025/12/27 2:40:49 网站建设

如何自己建设电影网站东莞公司有哪些

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个分步骤的J-Link烧录器操作演示项目,包含:1. 硬件连接示意图 2. J-Flash软件配置截图 3. 典型烧录参数设置表格 4. 验证烧录结果的代码示例 5. 常见错…

张小明 2025/12/27 2:40:48 网站建设

做网站网站代理违法吗支付宝签约网站

机器学习核心概念解析 机器学习是通过非编程方式赋予计算机学习能力的研究领域。它使系统能够从数据中自动学习和改进,而无需显式编程。 数据挖掘可视为机器学习与数据库技术的结合,专注于从数据库或数据仓库中提取有价值的信息。其核心在于将机器学习算…

张小明 2025/12/27 2:40:49 网站建设

网站建设推广公众号制作推广青岛建设网站 织梦

本文来源:k学长的深度学习宝库,点击查看源码&详细教程。深度学习,从入门到进阶,你想要的,都在这里。包含学习专栏、视频课程、论文源码、实战项目、云盘资源等。 1、研究背景与动机 (1)医学…

张小明 2025/12/27 2:40:52 网站建设