中心极限定理模拟器 返回
確率/統計

中心极限定理模拟器

反复从均匀分布、指数分布、双峰分布或偏态分布中抽样。改变样本量n,观察无论母体分布如何,样本均值都收敛于正态分布的过程。

参数设置

预设

计算结果
样本均值的均值
母平均 μ
観測 SE(実績)
理論 SE = σ/√n
等待计算
Main

蓝色柱:样本均值直方图;红色曲线:理论正态分布

Pop

所选母分布的形状(10,000个样本的直方图)

Se

理论 SE = σ/√n(绿色线)与各 n 的实测 SE(蓝点)。可观察 n 增大时 SE 减小。

理论与主要公式

$\bar{X}_n = \dfrac{1}{n}\sum_{i=1}^n X_i \xrightarrow{d} \mathcal{N}\!\left(\mu,\,\dfrac{\sigma^2}{n}\right)$

標準误差(SE):$\text{SE} = \dfrac{\sigma}{\sqrt{n}}$

Berry-Esseen 误差上界:$\sup_x |F_n(x) - \Phi(x)| \leq \dfrac{C\rho}{\sigma^3\sqrt{n}}$

🙋 中心极限定理真的那么重要吗?

🙋
中心极限定理就是“样本量增加时分布变成正态”对吧?但是像指数分布这种非常不对称的分布,真的也能变成正态吗?
🎓
能啊,这就是定理厉害的地方。你试试在这个模拟器里选“指数分布”,把 n 设为 5。直方图应该是右偏的。然后把 n 调到 50……就会变得很像钟形了。不管原始形状如何都能收敛,这就是 CLT 的核心。
🙋
真的!n=5 的时候确实偏得很厉害,但 n=50 就变得很漂亮了。不过怎么判断“n 要多大”呢?
🎓
经验上常用“n ≥ 30”。但严格来说有 Berry-Esseen 定理,保证正态近似的误差不超过 Cρ/(σ³√n)。ρ 是三阶绝对矩,包含了分布的偏度。像双峰分布这种偏度大的情况,就需要更大的 n。
🙋
有个公式是“标准误 = σ/√n”。n=100 时比 n=25 时精度差多少?
🎓
√100 = 10,√25 = 5,所以 SE 减半。看“SE vs n”标签页能直观看到,但 n 要变成 4 倍精度才能提高 2 倍。这也是统计调查中增加样本量成本高的原因。
🙋
制造业现场的质量管理也会用到吗?
🎓
正是。X̄-R 控制图就是典型例子,从生产线每次取 n 个样本,监控“其均值是否在 μ ± 3σ/√n 范围内”。这就是异常检测的控制界限线。多亏 CLT,无论原始尺寸分布如何,均值的分布都可以视为正态,从而设定控制界限。
🙋
我听说像柯西分布这种“方差无穷大”的分布,CLT 不成立。实际会怎样?
🎓
从柯西分布取 n=1000 的样本均值,结果还是柯西分布。因为均值和方差不存在,CLT 的前提就崩溃了。实际上金融中的肥尾(厚尾)分布也通常难以直接使用 CLT,需要改用“α-稳定分布收敛”这种推广定理。重要的是不要以为现实都能用正态近似。

常见问题

对于具有有限均值 μ 和方差 σ² 的独立同分布(i.i.d.)随机变量成立。像柯西分布这种方差无穷大的分布是例外。此外,当独立性不成立时(如时间序列数据),需要其他推广定理。
从正态近似精度来说是的,但需要权衡成本。SE = σ/√n,所以 n 要变成 4 倍精度(SE)才能提高 2 倍。统计学上“足够大的 n”取决于分布形状,对称分布时 n = 30,偏度大时 n = 50~100 是实务中的参考值。
标准差 σ 表示单个数据的离散程度,标准误 SE = σ/√n 表示样本均值的离散程度。置信区间的计算使用 SE。两者常被混淆,但 SE 随 n 增大而减小,σ 与 n 无关。
给出了 CLT 正态近似误差的定量上界。具体表示为 |F_n(x) - Φ(x)| ≤ Cρ/(σ³√n),最佳常数 C ≈ 0.4748(Shevtsova 2010)。分布的三阶矩 ρ 越大(偏度越强),相同 n 下近似精度越低。
从生产线取 n 个样本,持续计算其均值 X̄。由于 CLT,X̄ 的分布可近似为正态分布 N(μ, σ²/n),因此可设定控制界限 UCL/LCL = μ ± 3σ/√n。超出此界限的概率理论上可量化为 0.27%,成为异常检测的判断标准(X̄-R 控制图)。

什么是中心极限定理模拟器?

中心极限定理模拟器是CAE和应用物理中的重要基础课题。本交互式模拟器允许您直接调节参数并观察实时结果,从而理解关键规律和变量之间的关系。

通过将数值计算与可视化反馈相结合,本模拟器有效地弥合了抽象理论与物理直觉之间的鸿沟,既是学生的高效学习工具,也是工程师进行快速验算的实用手段。

物理模型与关键公式

本模拟器基于中心极限定理模拟器的核心控制方程构建。理解这些方程有助于正确解读计算结果,并判断参数变化对系统行为的影响。

方程中的每个参数都对应控制面板中的一个滑块。移动滑块时,方程的解会实时更新,帮助您直观建立数学表达式与物理行为之间的对应关系。

实际应用场景

工程设计:中心极限定理模拟器相关概念可用于工程初步估算、参数灵敏度分析和教学演示。在开展更完整的CAE分析之前,可借助本工具快速把握主要物理量级与趋势。

教育与科研:在工程教学中,本工具可将理论与数值计算有效结合。在科研阶段,也可作为假设验证的第一步工具使用。

CAE工作流集成:在运行有限元(FEM)或计算流体力学(CFD)仿真之前,工程师通常先用简化模型评估物理量级、识别主导参数,并确定合理的边界条件,本工具正是为此目的而设计。

常见误解与注意事项

模型假设:本模拟器所用数学模型基于线性、均质、各向同性等简化假设。在将计算结果直接用于设计决策之前,务必确认实际系统是否满足这些假设。

单位与量纲:许多计算错误源于单位换算错误或数量级判断失误。请时刻注意各参数输入框旁标注的单位。

结果验证:始终将模拟器输出结果与物理直觉或手算结果进行核对。若结果出乎意料,请检查输入参数或采用独立方法进行验证。