条件数模拟器 — 矩阵恶条件性·误差放大的可视化

条件数模拟器 — 矩阵恶条件性

2×2矩阵 A 的条件数 κ(A) 计算工具，将恶条件性可视化。拖动矩阵成分的滑块，奇异值、行列式、解的误差放大率会实时变化，通过单位圆变成椭圆的线性映射，直观确认线性方程组 A·x=b 的数值解会因数据微小误差而产生多大的偏离。

参数设置

矩阵成分 a11

矩阵 A 的第1行第1列（左上）元素

矩阵成分 a12

矩阵 A 的第1行第2列（右上）元素

矩阵成分 a21

矩阵 A 的第2行第1列（左下）元素

矩阵成分 a22

矩阵 A 的第2行第2列（右下）元素

输入 b 的扰动大小 δ

右边向量 b 的微小误差。观察此误差被放大到解 x 时的程度

计算结果

—

条件数 κ(A)

—

最大奇异值 σ_max

—

最小奇异值 σ_min

—

行列式 det(A)

—

解的误差放大率

—

条件判定

—

线性映射 — 单位圆变成椭圆

矩阵 A 将单位圆映射为椭圆。椭圆的长半轴和短半轴长度恰好是 σ_max 和 σ_min。椭圆接近圆形表示良条件，细长针状的椭圆表示恶条件。

奇异值与条件数

误差放大 — 输入误差对解的影响

理论·主要公式

$$\kappa(A)=\lVert A\rVert\,\lVert A^{-1}\rVert=\frac{\sigma_{max}}{\sigma_{min}}$$

2范数条件数 κ(A)。σ_max·σ_min 是矩阵 A 的最大、最小奇异值，表示 A 作用下「伸长最多的方向」和「缩小最多的方向」的倍率。

$$\frac{\lVert\Delta x\rVert}{\lVert x\rVert}\le\kappa(A)\,\frac{\lVert\Delta b\rVert}{\lVert b\rVert}$$

误差边界。右边 b 的相对误差最坏会被放大 κ(A) 倍成为解 x 的相对误差。κ=1 最理想（误差不被放大），κ≫1 则恶条件，数值上很危险。

$$M=A^{\mathsf T}A,\quad \sigma=\sqrt{\lambda(M)}$$

奇异值的求法。对称矩阵 M=AᵀA 的特征值 λ 的平方根就是 A 的奇异值。2×2 情形下特征值可由迹和行列式解析求得。

什么是条件数

🙋

「条件数」这个概念在数值计算课上听过，但到底是什么意思啊？

🎓

简单说，就是测量「这个问题对数据误差有多敏感」的一个数字。比如解线性方程组 A·x=b，右边的 b 是测量值，必然会有点误差。条件数 κ(A) 就是表示 b 的相对误差最坏会被放大多少倍来影响答案 x 的相对误差。κ=1 的话误差就原样不变，κ=1000 的话最坏会被放大1000倍，明白吗？

🙋

哎呀，最坏放大1000倍…。左边的滑块默认就已经显示 κ 大约399了。这是怎么算出来的？

🎓

2范数条件数 κ(A)=σ_max/σ_min，就是最大奇异值除以最小奇异值。奇异值表示矩阵 A 对空间的「拉伸·压缩」程度。上面的画布就很直观——A 把单位圆映射成椭圆，椭圆的长半轴是 σ_max，短半轴是 σ_min。你看，默认矩阵的椭圆被压得特别扁，像根雪茄。σ_max≈3.99 但 σ_min≈0.01，比一下就是约399。

🙋

明白了，椭圆越扁平说明矩阵越坏。但我记得学过行列式（det）小的话就是接近奇异吧。det 不行吗？

🎓

好问题，这是个很常见的误解。行列式的问题是它依赖尺度。比如矩阵全部乘以1000，det 就会被乘以100万，但坏条件性并没有变。条件数是比值 σ_max/σ_min，所以尺度不变，这才是正确的指标。默认矩阵的 det 确实很小（约0.0399），但真正起作用的是 κ≈399。「det 小＝接近奇异」只是个提示，判断要用 κ。

🙋

下面有个「解的误差放大率」的卡片，这和 κ 是不一样的东西吗？

🎓

那是「实测值」。固定一个右边向量 b，然后加上 δ 大小的扰动，实际解两次方程，测量解 x 改变了多少。理论上，这个放大率必然不超过 κ ——有个不等式保证 ‖Δx‖/‖x‖ ≤ κ·‖Δb‖/‖b‖。κ 是「最坏保证」，放大率是「这一次的实测」。因为问题是线性的，所以即使你拉动 δ 滑块，放大率也基本不变。看下面的误差放大图，κ 就是上界的「天花板」。

🙋

那要是遇到恶条件矩阵怎么办呢？

🎓

第一步最重要是「早点发现」。如果蒙着眼睛直接解，信了答案，那就完蛋了。实际工作中，可以先缩放一下行和列，有时候能改善表面的 κ。如果本质上还是坏的，就用稳定的算法——带部分主元的LU分解、QR分解。最小二乘问题要避免正规方程（那会让条件数平方），改用QR或SVD。如果还是坏，可以加正则化（岭回归、Tikhonov正则化）来稳定解。关键是「先算出 κ，再选择相应的办法」。

常见问题解答

条件数 κ(A) 表示在求解线性方程组 A·x=b 时，数据 b（或矩阵 A、舍入误差）中包含的相对误差，作为解 x 的相对误差最坏可能放大的倍数。在2范数中定义为 κ(A)=σ_max/σ_min（最大奇异值÷最小奇异值）。κ≈1 表示完全的良条件（正交矩阵是代表例），κ 越大行矩阵越接近奇异，数值解越不可靠。

误差边界 ‖Δx‖/‖x‖ ≤ κ(A)·‖Δb‖/‖b‖ 说明，κ 越大输入的微小误差在解中被放大越多。例如 κ=10^6 时，数据的相对误差 10^-7 会在解中被放大到 10^-1（10%）。双精度浮点运算的舍入误差约为10^-16，当 κ 超过10^14 时有效数字几乎完全丧失。条件数是测量线性方程组「数值可信度」的指标。

行列式 det(A) 较小时被称为「接近奇异」，但 det 依赖于尺度，因此不是恶条件的合适指标。例如将矩阵全部缩放1000倍，det 会增大10^6倍，但条件数不变。条件数是 σ_max 和 σ_min 的比值，因此尺度不变，能正确表示恶条件性。det≈0 可作为奇异性的提示，但判断是否恶条件应该使用 κ。

首先重新审视问题的定式。缩放（行列标准化）有时可以改善条件数。如果本质上仍是恶条件，使用稳定算法（带部分主元的LU分解、QR分解），对最小二乘问题使用QR或SVD而非正规方程。可以使用正则化（岭回归、Tikhonov正则化）来稳定解。关键是「事先评估条件数，选择相应的方法」。

实际应用

有限元法（FEM）的刚度矩阵：结构分析的刚度矩阵在薄单元、极端长宽比的网格、混合不同材料刚度时，条件数会恶化。条件数坏会导致迭代求解器（共轭梯度法等）收敛极其缓慢，直接求解器中舍入误差会使位移和应力无法信任。CAE实践中严格检查网格质量，一个重要原因就是保持刚度矩阵的健康条件数。

最小二乘法·回归分析：多项式回归或解释变量高度相关的数据中，正规方程 AᵀA·x=Aᵀb 的矩阵会接近奇异。AᵀA 的条件数是 A 条件数的平方，所以坏条件会加剧。这就是「多重共线性」的本质，导致回归系数因测量噪声大幅波动。实际中用QR分解或SVD，或采用岭回归来处理。

逆问题·图像复原：CT重建、反卷积、地球物理反演等逆问题本质上是恶条件的（往往条件数趋于无穷的「不适定问题」）。观测数据的微小噪声会在复原结果中造成巨大波动，因此用Tikhonov正则化或截断SVD等方法，通过加入「光滑性」和「先验知识」来稳定解。条件数是选择正则化参数的指南。

控制论·数值优化：状态空间模型的可控可观测性Gram矩阵、最优化二次型的Hessian矩阵都用条件数评估。Hessian条件数大时最速下降法会在「长谷」中来回折返，收敛很慢。这就是为什么需要牛顿法或预处理梯度法，条件数是选择数值方法的共同语言。

常见误区与注意事项

最大的误解是「行列式小就是恶条件，大就是良条件」。行列式完全依赖尺度。比如2×2单位矩阵缩小0.001倍得到的矩阵，det=10^-6 非常小，但条件数 κ=1（完美的良条件）。反过来，det 很大的矩阵也可能极度恶条件。条件数 σ_max/σ_min 是比值，尺度不变，是衡量恶条件的正确指标。det 顶多是「奇异性的提示」而已。

其次，「条件数大是矩阵或算法的问题」这个想法也不对。条件数是问题本身固有的性质，与解法无关。κ=10^10 的问题，无论用多好的算法，输入误差都可能被放大10^10倍，这是避不开的。好算法（后向稳定算法）只能保证「算法本身不增加额外误差」，但问题固有的条件数导致的放大是改不了的。只有改变问题的定式才能改善。

最后，「残差小就说明解准确」也是常见陷阱。对于线性方程组的数值解 x̂，残差 ‖b−A·x̂‖ 很小不代表真实解的误差 ‖x−x̂‖ 小。在恶条件矩阵下，残差接近零的解和真解可能相差很远——«‖Δx‖ 可以大到残差乘以条件数」。反过来，离真解不远的 x 可能残差很大。不能只看残差，必须配合条件数一起评估解的精度。

条件数模拟器 — 矩阵恶条件性

什么是条件数

常见问题解答

实际应用

常见误区与注意事项

使用指南

具体计算示例

工程实践注意