news 2026/6/7 21:50:38

初探Langevin dynamics(朗之万动力学)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
初探Langevin dynamics(朗之万动力学)

文章目录

    • 一、直觉理解:
    • 二、连续形式(SDE 视角)
    • 三、为什么它能「采样」?
    • 四、离散形式(算法角度)
    • 五、和机器学习的对应关系
      • 5.1 Langevin MCMC
      • 5.2 SGLD(Stochastic Gradient Langevin Dynamics)
    • 六、和 Diffusion Model 的关系
      • 6.1 反向扩散 = Langevin-like dynamics
      • 5.2 Score matching = 学梯度
    • 七、和 Tweedie Estimator[^1] 的桥梁
    • 八、总结
    • 参考

一、直觉理解:

Langevin dynamics =「有噪声的梯度下降」

想象一个小球在能量地形U ( x U(xU(x) 上滚动:

  • 梯度项
    小球会沿着「能量下降最快的方向」滚
    ⇒ \Rightarrow普通梯度下降

  • 随机噪声项
    环境温度导致的小抖动
    ⇒ \Rightarrow帮助跳出局部极小值

👉 所以:

Langevin dynamics = 梯度下降 + 随机热噪声

朗之万动力学通过两个关键力的博弈实现系统调控:摩擦力像水中的阻力让粒子减速,随机力模拟分子碰撞带来的无规则扰动。当这两种力达到平衡时,系统会自然趋向玻尔兹曼分布——这正是复杂概率采样的物理基础。

二、连续形式(SDE 视角)

标准的过阻尼 Langevin SDE

d x t = − ∇ U ( x t ) d t + 2 T d W t \boxed{ \mathrm{d}x_t = - \nabla U(x_t)\mathrm{d}t + \sqrt{2T}\mathrm{d}W_t }dxt=U(xt)dt+2TdWt

各项含义

含义
x t x_txt系统状态(参数、样本、粒子位置)
U ( x U(xU(x)势能函数(能量)
− ∇ U ( x -\nabla U(xU(x)确定性“往低能走”
W t W_tWtWiener 过程(布朗运动)
T TT温度(噪声强度)

三、为什么它能「采样」?

这是Langevin dynamics 的核心魔法

如果你让上面的 SDE 跑足够久,它的稳态分布是:

p ( x ) ∝ e − U ( x ) / T \boxed{ p(x) \propto e^{-U(x)/T} }p(x)eU(x)/T

这就是Boltzmann 分布

换句话说

  • 你不需要知道如何直接采样p ( x p(xp(x)
  • 只要能算∇ U ( x \nabla U(xU(x)
  • 就可以用 Langevin dynamics 从p ( x p(xp(x) 中采样

四、离散形式(算法角度)

Euler–Maruyama 离散化:

x k + 1 = x k + η ∇ U ( x k ) − 2 T η ϵ k , ϵ k ∼ N ( 0 , I ) \boxed{ x_{k+1} = x_k + \eta \nabla U(x_k) - \sqrt{2T\eta}\epsilon_k, \quad \epsilon_k \sim \mathcal{N}(0,I) }xk+1=xk+ηU(xk)2Tηϵk,ϵkN(0,I)

这看起来是不是非常眼熟?

👉SGD + Gaussian noise

五、和机器学习的对应关系

5.1 Langevin MCMC

令:

U ( x ) = − log ⁡ p ( x ) U(x) = - \log p(x)U(x)=logp(x)

则更新变成:

x k + 1 = x k + η ∇ log ⁡ p ( x k ) − 2 η ϵ k x_{k+1} = x_k + \eta \nabla \log p(x_k) - \sqrt{2\eta}\epsilon_kxk+1=xk+ηlogp(xk)2ηϵk

👉用梯度信息做 MCMC

5.2 SGLD(Stochastic Gradient Langevin Dynamics)

在大数据场景中:

  • 用 mini-batch 估计∇ log ⁡ p ( x \nabla \log p(xlogp(x)
  • 噪声天然存在

👉 SGD ≈退化版 Langevin dynamics

六、和 Diffusion Model 的关系

6.1 反向扩散 = Langevin-like dynamics

扩散模型的反向 SDE:

d x = [ f ( x , t ) − g ( t ) 2 ∇ x log ⁡ p t ( x ) ] d t + g ( t ) d W ˉ t \mathrm{d}x = \big[ f(x,t) - g(t)^2 \nabla_x \log p_t(x) \big] \mathrm{d}t + g(t)\mathrm{d}\bar W_tdx=[f(x,t)g(t)2xlogpt(x)]dt+g(t)dWˉt

其中:

  • ∇ x log ⁡ p t ( x \nabla_x \log p_t(xxlogpt(x):score
  • 噪声 + score 驱动采样

👉 本质上是时间变化版 Langevin dynamics

5.2 Score matching = 学梯度

  • Langevin dynamics:已知∇ log ⁡ p ( x \nabla \log p(xlogp(x)→ 采样
  • Diffusion model:先学 score→ 再用 Langevin/SDE 采样

七、和 Tweedie Estimator1的桥梁

在高斯噪声下:

E [ x 0 ∣ x t ] = x t + σ t 2 ∇ log ⁡ p t ( x t ) \boxed{ \mathbb{E}[x_0 \mid x_t] = x_t + \sigma_t^2 \nabla \log p_t(x_t) }E[x0xt]=xt+σt2logpt(xt)
这意味着:

👉 反向扩散 =连续去噪版 Langevin dynamics

八、总结

Langevin dynamics 是:


参考


  1. 一文解释 经验贝叶斯估计, Tweedie’s formula ↩︎

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/7 23:34:54

5大实战技巧:重新定义DeepSeek大模型推理性能

5大实战技巧:重新定义DeepSeek大模型推理性能 【免费下载链接】DeepSeek-V3.2-Exp DeepSeek-V3.2-Exp是DeepSeek推出的实验性模型,基于V3.1-Terminus架构,创新引入DeepSeek Sparse Attention稀疏注意力机制,在保持模型输出质量的同…

作者头像 李华
网站建设 2026/6/7 20:57:06

【Web第三周】『12.9-12.14』

【Web第三周】『12.9-12.14』 1.初步了解数据库(MySQL) 2.初步了解sql注入漏洞 3.练习sql语句 4.搭建sql靶场,找不到的,靶场文件群文件有 1、MySQL …

作者头像 李华
网站建设 2026/6/6 21:59:49

RustDesk隐私模式:实现远程操作完全隐藏的专业解决方案

RustDesk隐私模式:实现远程操作完全隐藏的专业解决方案 【免费下载链接】rustdesk 一个开源的远程桌面,是TeamViewer的替代选择。 项目地址: https://gitcode.com/GitHub_Trending/ru/rustdesk 在当今数字化工作环境中,远程桌面协助已…

作者头像 李华
网站建设 2026/6/8 6:21:58

如何快速掌握Lottie-web:提升开发效率的完整指南

如何快速掌握Lottie-web:提升开发效率的完整指南 【免费下载链接】lottie-web 项目地址: https://gitcode.com/gh_mirrors/lot/lottie-web 你是否曾经为网页动画效果而苦恼?手动编写复杂的CSS动画代码,调试各种浏览器兼容性问题&…

作者头像 李华
网站建设 2026/6/7 12:52:22

AI崛起,月薪5万的码农面临失业?未来职业何去何从?

AI工具崛起使基础编程工作被替代,初级程序员岗位需求断崖式下跌,薪资缩水20%。程序员职业分化为高端人才与普通使用者,转行成为常态。然而,技能虽会过时,编程思维永不过时。掌握大模型技能,提升核心竞争力&…

作者头像 李华