部分主控化下Schur凹函数差值的紧致上界及其应用-Seo优化-塔城地区网站建设公司

1. 项目概述：从主控化到部分主控化，我们为何需要更精细的工具？

在量子信息论和经典概率论里，我们经常需要比较两个系统哪个“更混乱”，或者哪个状态包含的“不确定性”更大。一个非常强大的数学工具叫做主控化。简单来说，给定两个概率分布或者两个量子态的谱（特征值），如果一个分布比另一个更“集中”在头部（即最大的几个概率值更大），我们就说前者主控后者。一个函数如果在主控关系下保持单调（即更集中的分布函数值更小），我们就称它为Schur凹函数。冯·诺依曼熵、Rényi熵、Tsallis熵这些衡量不确定性的核心指标，都是Schur凹函数。

然而，经典的主控化要求太强了。它需要比较两个分布所有前k项的部分和。对于无限维系统，或者我们只关心系统最主要的几个特征模式时，这个条件过于苛刻。这就引出了部分主控化的概念：我们只要求前m个部分和满足主控关系。这显然是一个弱得多的条件，但更贴合许多实际场景，比如我们只关心一个量子信道对系统前几个能级的影响，或者一个压缩算法只保留信号最主要的几个成分。

那么，一个自然的问题就来了：如果一个状态σ只是被ρ部分主控（即ρ m≻ σ），而不是完全主控，那么对于一个Schur凹函数f（比如熵），f(ρ)和f(σ)的差距最大能有多大？更进一步，如果我们还知道σ就在ρ的附近（用迹范数距离度量），这个差距的上界又能被压缩到多少？这就是本文要解决的核心问题。我们为这个差距找到了一个紧致的上界，也就是说，这个上界是可以被取到的，因而是最优的。这个结果不仅具有理论上的美感，更直接应用于分析熵的连续性，以及刻画量子态谱的衰减行为。

2. 核心概念与数学框架的深度解析

2.1 主控化与Schur凹函数：秩序的数学语言

让我们先夯实基础。假设我们有两个概率分布 (\bar{p} = (p_1, p_2, ...)) 和 (\bar{q} = (q_1, q_2, ...))，这里我们按非递增顺序排列，即 (p_1 \ge p_2 \ge ... \ge 0)，并且 (\sum_i p_i = 1)，对 (q_i) 同理。

定义（主控化）：我们说分布 (\bar{p})主控(\bar{q})，记作 (\bar{p} \succ \bar{q})，如果对于所有的 (k = 1, 2, ...)，都有： [ \sum_{i=1}^k p_i \ge \sum_{i=1}^k q_i ] 并且当所有项求和时取等号：(\sum_i p_i = \sum_i q_i = 1)。

直观理解：(\bar{p}) 的“质量”比 (\bar{q}) 更集中在前面（更大的概率值上）。例如，分布 (0.6, 0.4, 0, ...) 就主控 (0.5, 0.3, 0.2, ...)，因为前1项0.6>0.5，前两项和1.0>0.8。

定义（Schur凹函数）：一个函数 (f) 在概率分布集合上被称为Schur凹的，如果每当 (\bar{p} \succ \bar{q}) 时，都有 (f(\bar{p}) \le f(\bar{q}))。换句话说，更集中的分布，其函数值更小。

注意：这里“凹”的定义与通常的Jensen凹函数不同，它依赖于主控化这一偏序关系。许多重要的熵函数是Schur凹的，但不一定是通常意义上的凹函数，例如阶数α>1的Rényi熵。

量子版本的推广：对于一个量子态（密度矩阵）(\rho)，我们考虑它的谱，即特征值序列 ({p_i})。两个量子态之间的主控化关系，就定义为它们谱（按非递增排列）之间的主控化关系。那么，一个作用于量子态的函数 (f) 是Schur凹的，当且仅当 (\rho \succ \sigma) 蕴含 (f(\rho) \le f(\sigma))。冯·诺依曼熵 (S(\rho) = -\text{Tr}(\rho \ln \rho)) 就是最著名的量子Schur凹函数。

2.2 部分主控化：放宽条件的现实考量

经典主控化要求检查所有的前k项部分和。对于无限维系统，这需要验证无穷多个不等式，在实际操作和理论分析中都非常困难。更重要的是，在很多应用中，我们可能只关心系统最主要的那些成分。

定义（m-部分主控化）：我们称状态 (\rho)m-部分主控状态 (\sigma)，记作 (\rho \stackrel{m}{\succ} \sigma)，如果只要求前m个不等式成立： [ \sum_{i=1}^k p_i \ge \sum_{i=1}^k q_i, \quad \forall k = 1, 2, ..., m ] 这里 (p_i, q_i) 分别是 (\rho) 和 (\sigma) 的谱（非递增排列）。

显然，如果 (\rho \succ \sigma)，那么对任意m，都有 (\rho \stackrel{m}{\succ} \sigma)。反之则不成立。部分主控化是一个更弱、更灵活的条件。

关键问题：如果只知道 (\rho \stackrel{m}{\succ} \sigma)，我们无法再保证 (f(\rho) \le f(\sigma)) 对于Schur凹函数f成立。那么，(f(\rho) - f(\sigma)) 这个“违背量”最大能是多少？我们能否给出一个仅依赖于 (\rho), m，以及可能还有 (\rho) 与 (\sigma) 之间距离 (\varepsilon = \frac{1}{2} |\rho - \sigma|_1) 的上界？

这就是本文工作的起点。我们不仅想定性地知道部分主控化弱于完全主控化，更想定量地刻画它到底“弱”了多少。

2.3 技术核心：构造一个“最坏情况”状态 (\rho_{m,\varepsilon})

解决上述定量问题的核心技巧，是巧妙地构造一个特定的状态 (\rho_{m,\varepsilon})。这个构造是本文的主要技术贡献之一，它统一并推广了文献中已有的某些特例。

给定一个状态 (\rho)，其谱为 ({p_i}{i=1}^n) (n可以是无穷大)，按非递增排列 (p_1 \ge p_2 \ge ... > 0)。定义部分和余量 (d_k = 1 - \sum{i=1}^k p_i)。

对于给定的参数 (m) (部分主控的阶数) 和 (\varepsilon) (距离约束)，我们按以下规则构造一个新状态 (\rho_{m,\varepsilon}) 的谱 ({p_i^{m,\varepsilon}})：

情况A (宽松距离约束)：如果 (\varepsilon \ge d_{m+1})，即允许的距离大于等于第m+1项之后所有小概率的总和。那么构造非常简单：保留前m个大特征值不变，将剩余的所有概率质量 (d_m) 全部堆到第m+1个位置上，后面的项全部置零。 [ p_i^{m,\varepsilon} = \begin{cases} p_i, & i \le m \ d_m, & i = m+1 \ 0, & i > m+1 \end{cases} ] 这个状态极度“集中”，它是在给定部分主控条件（前m项与ρ相同）和距离约束下，能构造出的熵最小的状态之一。
情况B (严格距离约束，有限维且ε很小)：如果系统是有限维的（n < ∞）且 (\varepsilon \le p_n)（即允许的距离小于最小特征值）。那么我们在保持前m项不变的前提下，对第m+1项和最后一项进行微调：从最后一项“借”一点概率(\varepsilon)加到第m+1项上。 [ p_i^{m,\varepsilon} = \begin{cases} p_i, & i \le m \text{ 或 } m+1 < i < n \ p_{m+1} + \varepsilon, & i = m+1 \ p_n - \varepsilon, & i = n \end{cases} ] 这个操作在谱的“中间”和“尾部”进行了一次小的概率转移，使得状态在满足距离约束的同时，尽可能降低其熵。
情况C (一般情况)：这是最复杂也最一般的情形，适用于无限维系统或ε介于中间值时。我们找到一个关键的索引 (\ell_\varepsilon = \min{ k \in \mathbb{N} \mid d_k \le \varepsilon })。这个(\ell_\varepsilon)的意义是：从第1项到第(\ell_\varepsilon)项的概率总和已经占据了 (1 - d_{\ell_\varepsilon} \ge 1 - \varepsilon)。构造如下： [ p_i^{m,\varepsilon} = \begin{cases} p_i, & i \le m \text{ 或 } m+1 < i < \ell_\varepsilon \ p_{m+1} + \varepsilon, & i = m+1 \ p_{\ell_\varepsilon} - \varepsilon + d_{\ell_\varepsilon}, & i = \ell_\varepsilon \ 0, & i > \ell_\varepsilon \end{cases} ] 这个构造可以理解为：在保持前m项和从m+2到(\ell_\varepsilon-1)项不变的基础上，将允许的“扰动预算”(\varepsilon)全部加到第m+1项上，同时为了保持总概率为1，需要对第(\ell_\varepsilon)项进行补偿，并将(\ell_\varepsilon)之后的所有小尾巴截断（置零）。

这个构造的精妙之处在于：可以证明，对于任意满足 (\sigma \stackrel{m}{\prec} \rho) 且 (\frac{1}{2}|\rho-\sigma|1 \le \varepsilon) 的状态 (\sigma)，都有 (\sigma \prec \rho{m,\varepsilon})。也就是说，(\rho_{m,\varepsilon}) 在完全主控的意义下，控制了所有满足我们部分主控和距离约束的“竞争者” (\sigma)。由于Schur凹函数在完全主控下单调，那么对于任意这样的(\sigma)，必有 (f(\sigma) \ge f(\rho_{m,\varepsilon}))。因此，(f(\rho) - f(\sigma) \le f(\rho) - f(\rho_{m,\varepsilon}))。这就给出了我们想要的上界。

3. 主要定理及其证明思路拆解

基于上述构造，我们可以陈述本文的核心定理。

定理1（Schur凹函数的部分主控上界）：设 (f) 是量子态集合上的一个Schur凹函数，(\rho) 是一个谱为 ({p_i}) 的状态，且 (f(\rho) < +\infty)。那么，对于任意自然数 (m) 和 (\varepsilon \in [0,1])，有： [ \sup \left{ f(\rho) - f(\sigma) , \middle| , \sigma \stackrel{m}{\prec} \rho, \frac{1}{2}|\rho-\sigma|1 \le \varepsilon \right} \le f(\rho) - f(\rho{m,\varepsilon}) ] 其中 (\rho_{m,\varepsilon}) 就是上一节定义的那个构造态。

这个定理有以下几个关键点：

紧致性（最优性）：这个上界是紧的。也就是说，对于任意给定的 (m) 和 (\varepsilon)，我们总可以找到一个具体的状态 (\rho)（其谱满足特定条件），使得存在某个 (\sigma = \rho_{m,\varepsilon}) 满足 (\sigma \stackrel{m}{\prec} \rho)，并且上述不等式取等号。这意味着我们找到的上界是最好的，不可能再改进了。
单调性：上界 (f(\rho) - f(\rho_{m,\varepsilon})) 关于 (\varepsilon) 是非减的（允许的距离越大，函数值差异的上界也越大），关于 (m) 是非增的（部分主控的阶数越高，约束越强，差异上界越小）。这完全符合直觉。
渐近行为：当 (\min{\varepsilon, 1/m} \to 0) 时，只要函数 (f) 满足一定的下半连续性条件（冯·诺依曼熵、Rényi熵、Tsallis熵都满足），这个上界就会趋于0。这意味着，要么距离约束非常紧（(\varepsilon \to 0)），要么部分主控的阶数非常高（(m \to \infty)），都能迫使 (f(\sigma)) 逼近 (f(\rho))。

证明思路的核心步骤：

简化问题（命题1）：首先证明，在寻找上确界时，我们可以把搜索范围从所有满足条件的 (\sigma)，缩小到一组结构更简单的态 (T_m(\rho) \cap U_\varepsilon(\rho))。集合 (T_m(\rho)) 中的态与 (\rho) 共享前m个特征向量，并且其第m+1个特征值不小于 (\rho) 的第m+1个特征值。集合 (U_\varepsilon(\rho)) 是迹范数球。这个步骤通过一个引理实现，该引理表明，对于任意符合条件的 (\sigma)，都能在 (T_m(\rho) \cap U_\varepsilon(\rho)) 中找到一个 (\sigma^)，使得 (\sigma^\succ \sigma) 且距离不增加。由于 (f) 是Schur凹的，(f(\sigma^*) \le f(\sigma))，所以上确界不会减小。
寻找“最小元”（引理2）：接下来证明，在我们缩小后的集合 (T_m(\rho) \cap U_\varepsilon(\rho)) 中，构造态 (\rho_{m,\varepsilon}) 是“最小元”在完全主控意义下。即，对于该集合中的任意 (\sigma)，都有 (\rho_{m,\varepsilon} \succ \sigma)。这部分的证明需要精细地分析概率分布的部分和，并利用距离约束 (|\rho-\sigma|_1 \le 2\varepsilon) 所施加的限制。
应用Schur凹性：既然 (\rho_{m,\varepsilon} \succ \sigma) 对所有目标 (\sigma) 成立，那么由Schur凹性，有 (f(\rho_{m,\varepsilon}) \le f(\sigma))。因此，(f(\rho) - f(\sigma) \le f(\rho) - f(\rho_{m,\varepsilon}))。上确界自然也不超过这个值。
紧致性证明：通过精心选择 (\rho) 的谱（例如，让 (p_1 + ... + p_m \ge 1 - p_m)），可以使得构造出的 (\rho_{m,\varepsilon}) 本身满足 (\rho_{m,\varepsilon} \stackrel{m}{\prec} \rho)，从而使得上界可以被取到。

这个证明框架清晰有力，将复杂的优化问题转化为了一个构造性问题，并且所构造的对象 (\rho_{m,\varepsilon}) 具有明确的物理和概率意义。

4. 在冯·诺依曼熵上的具体应用与计算

理论的美感需要落在具体的应用上才有价值。我们将主定理应用于量子信息中最重要的Schur凹函数——冯·诺依曼熵 (S(\rho) = -\text{Tr}(\rho \ln \rho))。

4.1 一般结果与边界公式

将定理1中的 (f) 具体化为 (S)，并利用熵函数的性质进行化简，我们可以得到一个更具体的上界表达式。

命题3（冯·诺依曼熵的紧致上界）：设 (\rho) 的谱为 ({p_i})，定义 (d_k = 1 - \sum_{i=1}^k p_i)，(\ell_\varepsilon = \min{k \mid d_k \le \varepsilon})。定义熵的齐次延拓 (\hat{S}(\rho) = \text{Tr}[\eta(\rho)] - \eta(\text{Tr}\rho))，其中 (\eta(x) = -x \ln x)。定义截断算子 (\rho_{[m]} = \sum_{i=m+1}^\infty p_i |\phi_i\rangle\langle\phi_i|)，即去掉前m个最大特征值对应的部分。

那么，上界 (B(\rho, m, \varepsilon) = S(\rho) - S(\rho_{m,\varepsilon})) 可以具体写为： [ B(\rho, m, \varepsilon) = \begin{cases} \hat{S}(\rho_{[m]}), & \text{if } \varepsilon \ge d_{m+1} \ \Delta(\rho, m, \varepsilon) + \hat{S}(\rho_{[\ell_\varepsilon - 1]}), & \text{if } \varepsilon < d_{m+1} \end{cases} ] 其中，(\Delta(\rho, m, \varepsilon) = \eta(p_{m+1}) + \eta(d_{\ell_\varepsilon - 1}) - \eta(p_{m+1} + \varepsilon) - \eta(d_{\ell_\varepsilon - 1} - \varepsilon))。

公式解读：

情况一 ((\varepsilon \ge d_{m+1}))：当允许的距离足够大，大于等于第m+1项之后的所有概率和时，上界简化为 (\hat{S}(\rho_{[m]}))。这恰好是去掉前m个最大特征值后剩余部分的“未归一化熵”。这很直观：在最坏情况下，对手状态(\sigma)可以把(\rho)尾部所有的小概率集中起来，形成一个概率为 (d_m) 的项，从而最大化熵减。
情况二 ((\varepsilon < d_{m+1}))：当距离约束较紧时，上界由两部分构成。第一部分 (\Delta) 来源于对第 (m+1) 项和某个临界项 (\ell_\varepsilon) 的概率调整所引发的熵变，这是一个局部调整项。第二部分 (\hat{S}(\rho_{[\ell_\varepsilon - 1]})) 则是将 (\ell_\varepsilon) 之后的所有小尾巴截断（置零）所“节省”下来的熵。这反映了在有限扰动下，最坏情况是扰动集中在谱的特定位置，并截断长尾。

4.2 示例：量子谐振子的吉布斯态

为了更直观地理解这个上界，我们考虑一个物理上重要的例子：量子谐振子的吉布斯态（热态）。其谱是一个几何分布： [ \rho_N = (1-q) \sum_{i=0}^\infty q^i |i\rangle\langle i|, \quad q = \frac{N}{N+1} ] 其中 (N) 是平均光子数（或量子数），(|i\rangle) 是福克态。这个态在量子光学和连续变量量子信息中无处不在。

对于这个具体的态，计算变得相对简单：

(d_k = q^k) （几何分布的部分和余项）。
(\hat{S}(\rho_{[m]}) = q^m S(\rho_N))，其中 (S(\rho_N) = g(N) = (N+1)\ln(N+1) - N\ln N) 是谐振子热态的熵。
临界索引 (\ell_\varepsilon) 满足 (q^{\ell_\varepsilon} \le \varepsilon)，即 (\ell_\varepsilon = \lceil \log_{1/q} (1/\varepsilon) \rceil)。

代入命题3的公式，我们可以得到明确的上界表达式 (B(\rho_N, m, \varepsilon))，并绘制其随 (\varepsilon) 和 (m) 变化的图像。图像显示：

对于固定的 (m)，(B) 随 (\varepsilon) 增大而单调递增。
对于固定的 (\varepsilon)，(B) 随 (m) 增大而单调递减。
当 (m=0) 时，(B(\rho_N, 0, \varepsilon)) 给出了在没有部分主控约束（仅距离约束）下，熵可能减少的最大值，这与已有文献中的连续性界一致。
函数 (B) 相对于 (\varepsilon) 的图像呈现一种“波浪形”的非光滑结构，这是由于几何分布离散性导致的临界索引 (\ell_\varepsilon) 的跳跃变化。

4.3 ε-充分主控化秩：一个刻画谱衰减的新工具

基于部分主控化的上界，我们可以引入一个非常有用的量，用于刻画一个有限熵量子态的谱衰减速度。

定义（ε-充分主控化秩）：对于一个熵有限的混合态 (\rho)，定义： [ \text{mr}\varepsilon(\rho) = \inf \left{ m \in \mathbb{N} , \middle| , \sup{\sigma \stackrel{m}{\prec} \rho} \frac{S(\rho) - S(\sigma)}{S(\rho)} \le \varepsilon \right} + 1 ] 直观理解：我们需要多大的部分主控阶数 (m)，才能保证所有被 (\rho) m-部分主控的态 (\sigma)，其熵的相对损失不超过 (\varepsilon)？这个 (m)（加1后）就是 (\text{mr}_\varepsilon(\rho))。

为什么加1？这样定义可以使 (\text{mr}_0(\rho)) 恰好等于态的秩 (\text{rank}(\rho))（对于有限秩态）。对于无限秩态，(\text{mr}_0(\rho) = +\infty)。

利用推论2（定理1在 (\varepsilon=1) 时的特例，即无距离约束），我们可以得到一个可计算的上界： [ \text{mr}\varepsilon(\rho) \le \min { m \in \mathbb{N} \mid \hat{S}(\rho{[m]}) \le \varepsilon S(\rho) } + 1 \triangleq \widehat{\text{mr}}\varepsilon(\rho) ] 这个上界 (\widehat{\text{mr}}\varepsilon(\rho)) 完全由 (\rho) 的谱和 (\varepsilon) 决定。

在谐振子热态上的应用：对于 (\rho_N)，我们有 (\hat{S}(\rho_{[m]}) = q^m S(\rho_N))。因此， [ \widehat{\text{mr}}\varepsilon(\rho_N) = \min { m \mid q^m \le \varepsilon } + 1 = \lfloor \log{1/q} (1/\varepsilon) \rfloor + 2 ] 这个结果非常干净。它告诉我们，对于平均光子数为 (N) 的热态，要保证熵的相对损失小于 (\varepsilon)，所需的部分主控阶数大约以 (\log(1/\varepsilon)) 的速度增长，并且比例系数与 (\ln(N+1) - \ln N) 有关。(N) 越大（温度越高，态越混），谱衰减越慢，需要的 (m) 就越大，这与物理直觉一致。

实操心得：在分析具体量子系统的信息处理能力时，例如在量子热机或噪声信道编码中，(\widehat{\text{mr}}\varepsilon(\rho)) 可以作为一个有效的“有效维数”或“信息承载维度”的度量。它比简单的秩更精细，考虑了熵的视角和误差容忍度 (\varepsilon)。计算时，关键就是计算截断后部分的熵 (\hat{S}(\rho{[m]}))，这通常比直接优化 (\sup [S(\rho)-S(\sigma)]) 要容易得多。

5. 从量子到经典：概率分布上的推广

量子态上的理论可以几乎平行地推广到经典概率分布上，这体现了该数学框架的普适性。

设 (P_n) 是长度为 (n)（可为无穷）的概率分布集合，赋予全变差距离 (TV(\bar{p}, \bar{q}) = \frac{1}{2} \sum_i |p_i - q_i|)。概率分布的主控化 (\bar{p} \succ \bar{q}) 和 (m)-部分主控化 (\bar{p} \stackrel{m}{\succ} \bar{q}) 的定义与量子谱的情况完全类似。

推广方法：对于一个概率分布 (\bar{p} = (p_1, ..., p_n))，我们可以将其对应到一个对角密度矩阵 (\rho(\bar{p}) = \sum_i p_i |i\rangle\langle i|)。这是一个从 (P_n) 到对角态集合的一一对应。在这个对应下：

(TV(\bar{p}, \bar{q}) = \frac{1}{2} |\rho(\bar{p}) - \rho(\bar{q})|_1)
(\bar{p} \succ \bar{q} \iff \rho(\bar{p}) \succ \rho(\bar{q}))
(\bar{p} \stackrel{m}{\succ} \bar{q} \iff \rho(\bar{p}) \stackrel{m}{\succ} \rho(\bar{q}))

因此，本文所有关于量子态和Schur凹函数 (f) 的定理，只需将 (f) 理解为定义在概率分布上的Schur凹函数（例如香农熵、Rényi熵），将迹范数距离替换为全变差距离，将量子态 (\rho) 替换为其对应的对角矩阵 (\rho(\bar{p}))，那么所有结论——包括定理1、命题3、关于熵的界以及 (\varepsilon)-充分主控化秩的概念——都完全适用于经典概率分布。

经典意义下的应用：这为分析离散随机变量的信息度量提供了新工具。例如，我们可以问：对于一个服从分布 (P_X) 的随机变量 (X)，所有在 (m)-部分主控意义上“更集中”且全变差距离在 (\varepsilon) 以内的分布 (Q_X)，其香农熵 (H(Q_X)) 最多能比 (H(P_X)) 大多少？我们的定理给出了紧致的上界。这在信息论、统计学和机器学习中可能有应用，例如在考虑近似计算或鲁棒性时，需要量化分布微小扰动对熵的影响。

6. 理论价值、应用前景与操作指南

6.1 理论价值总结

统一框架：本文提出的通过构造 (\rho_{m,\varepsilon}) 来获取上界的技术，提供了一个统一且强大的框架。它不仅能够推导本文的新结果，还可以用来简洁地证明已知的关于冯·诺依曼熵的连续性界。
紧致性：所有给出的上界都被证明是紧的，这意味着理论结果是完备的，无法再改进。这在数学物理和信息论中是非常可贵的性质。
连接不同概念：该工作巧妙地将部分主控化（一种偏序松弛）、距离约束（拓扑/度量概念）和Schur凹函数值（信息度量）三者联系起来，给出了它们之间相互制约的定量关系。
引入新工具：(\varepsilon)-充分主控化秩 (\text{mr}_\varepsilon(\rho)) 是一个新颖的概念，它用一个数来量化一个态在容忍一定熵损失下的“有效复杂度”或“谱集中度”，可能成为分析量子态资源的新描述符。

6.2 潜在应用方向

量子资源理论：在诸如相干性、纠缠、纯度等资源理论中，资源量化函数常常是Schur凹或Schur凸的。本文的结论可以直接用来分析在部分主控或近似操作下，资源量的最大可能变化。
信道容量分析：在计算信道经典容量或量子容量时，常常需要优化输入态的熵函数。部分主控化条件可能对应于某种物理约束（如能量约束只影响前几个能级），本文的界可以帮助估计在这种约束下容量的上界。
量子算法与复杂度：某些量子算法（如基于量子主成分分析的算法）的性能依赖于输入态主要特征值的集中程度。(\text{mr}_\varepsilon(\rho)) 可以作为一个严格的指标，来判断需要处理多少主要成分才能捕获绝大部分（1-ε比例）的信息。
误差分析：在量子态制备、量子门实现或量子测量中存在误差时，实际态与目标态之间存在距离ε。如果还能知道实际态在部分主控意义上不如目标态纯（例如由于噪声），那么可以用本文的界来估计熵等关键信息量的最大偏差。

6.3 实际操作与计算指南

当需要应用本文结论解决具体问题时，可以遵循以下步骤：

明确对象和函数：确定你要研究的系统是量子态还是经典概率分布。明确你关心的Schur凹函数 (f) 是什么（如冯·诺依曼熵、香农熵、Rényi熵等）。
确定参数：根据你的问题背景，确定部分主控的阶数 (m) 和允许的距离（或全变差）(\varepsilon)。(m) 可能由你关心的能级数、主成分数决定；(\varepsilon) 可能由实验精度、噪声水平或近似要求决定。
计算或估计谱：获得目标态 (\rho) 或分布 (\bar{p}) 的谱 ({p_i})（按非递增排列）。对于无限维系统，可能需要截断或利用其解析形式。
计算关键量：
- 计算部分和余量 (d_k = 1 - \sum_{i=1}^k p_i)。
- 根据 (\varepsilon) 和 (d_{m+1}) 的大小关系，判断属于定理中的哪种情况。
- 计算临界索引 (\ell_\varepsilon = \min{k \mid d_k \le \varepsilon})（如果属于情况二或三）。
- 根据公式计算构造分布 ({p_i^{m,\varepsilon}}) 或直接计算上界 (B(\rho, m, \varepsilon))。
应用定理：将计算得到的上界 (f(\rho) - f(\rho_{m,\varepsilon})) 或 (B(\rho, m, \varepsilon)) 作为你问题中 (f(\rho) - f(\sigma)) 的最大可能值的估计。
利用 (\text{mr}_\varepsilon(\rho))：如果你想反过来，给定一个容许的熵损失比例 (\varepsilon)，想知道需要控制到多少阶的部分主控，那么就计算 (\widehat{\text{mr}}\varepsilon(\rho) = \min{ m \mid \hat{S}(\rho{[m]}) \le \varepsilon S(\rho) } + 1)。

注意事项：在实际的数值计算中，对于无限维系统，需要对谱进行截断。一个稳妥的做法是，先计算到足够多项使得剩余概率质量 (d_K) 远小于 (\varepsilon) 和所关心的精度，然后将 (K) 项之后的谱视为0。这样引入的误差是可控的。此外，对于像谐振子热态这样谱衰减很快的态，解析计算往往是可行的。

本文的理论虽然抽象，但其提供的工具是具体且可计算的。它将“部分主控化”这一略显晦涩的概念，转化为了可用于实际分析和计算的紧致不等式，为在更宽松、更现实的条件下进行量子信息和经典信息的信息量化分析，铺平了道路。