正态分布计算器 返回
Statistics Tool

正态分布计算器 · 可视化

设置均值μ和标准差σ,实时绘制PDF·CDF曲线。即时计算区间概率、Z分数和百分位数。

参数设置
预设
均值 μ
标准差 σ
概率查询模式
Z分数计算器
Z = 0.000
P(X<x) = 50.00%
计算结果
概率 P
Z分数(a)
百分位数
68.27%
±1σ范围
概率密度函数 (PDF)
累积分布函数 (CDF)
±1σ = 68.27% ±2σ = 95.45% ±3σ = 99.73%
理论与主要公式

概率密度函数(PDF):

$$f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$

标准化(Z分数):$Z=\dfrac{x-\mu}{\sigma}$

累积分布函数(CDF):$\Phi(x)=\dfrac{1}{2}\left[1+\mathrm{erf}\!\left(\dfrac{x-\mu}{\sigma\sqrt{2}}\right)\right]$

P(a < X < b) = Φ(b) − Φ(a)

什么是正态分布可视化

🙋
“正态分布”是什么?听起来好复杂啊。
🎓
简单来说,它描述了很多自然和社会现象中数据的分布规律,比如人的身高、考试成绩或者零件的尺寸。它的图形是一个对称的“钟形曲线”。你试着在模拟器里把标准差σ调小,比如从2调到0.5,看看曲线会怎么变化?
🙋
诶,真的吗?我调了!曲线变得又高又瘦了。那旁边的概率数字也变了,68.27%这个数字是什么意思?
🎓
这就是正态分布最神奇的地方之一。无论曲线是胖是瘦,只要数据服从正态分布,大约有68.27%的数据会落在“均值±1个标准差”的范围内。在实际工程中,比如生产一批螺栓,我们设定目标直径是均值,允许的误差范围就是标准差。你试着拖动均值μ的滑块,整个曲线会平移,但那个68.27%的概率区间会跟着一起动。
🙋
原来是这样!那下面这个计算P(a
🎓
完全正确!比如在汽车零件质量管理中,活塞直径要求是$50.00 \pm 0.05$毫米。如果已知生产过程服从正态分布,均值μ=50.00,标准差σ=0.02,你就可以用这个工具,设置a=49.95, b=50.05,立刻算出Pass品的概率。改变参数后你会看到概率和阴影面积实时变化,非常直观。

物理模型与关键公式

正态分布的核心是它的概率密度函数(PDF),它决定了钟形曲线的具体形状。公式中的指数项决定了数据点远离均值时概率密度如何急速下降。

$$f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$$

这里,$x$是随机变量的取值,$\mu$是均值(决定曲线中心位置),$\sigma$是标准差(决定曲线的“胖瘦”或离散程度),$\pi$和$e$是数学常数。

为了比较不同正态分布下的数据,或者计算概率,我们经常使用标准化,也就是计算Z分数。它将任何正态分布转化为标准的“标准正态分布”(μ=0, σ=1)。

$$Z=\dfrac{x-\mu}{\sigma}$$

$Z$分数表示观测值$x$距离均值$\mu$有多少个标准差。$Z=1.5$意味着该值比均值高1.5个标准差。累积分布函数(CDF)$\Phi(z)$则给出了$Z$分数小于等于某个值的概率,即$P(X \le x)$。

现实世界中的应用

质量管理与六西格玛:在制造业中,零件的尺寸、重量等特性通常服从正态分布。工程师通过计算过程能力指数(如Cpk),利用$±3\sigma$(99.73%)或$±6\sigma$的范围来监控和控制生产质量,减少缺陷。

统计假设检验:在科学研究或A/B测试中,研究者通过计算样本数据的Z分数,得到p值。这个p值(对应分布尾部的面积)帮助判断实验结果是偶然发生的还是具有统计显著性。

可靠性工程:许多产品(如轴承、电子元项)的寿命在一定条件下可以近似为正态分布。通过分析寿命数据的均值和标准差,可以预测产品的失效概率和制定保修策略。

教育测评与心理测量:像SAT、IQ测试等标准化考试,会将原始分数通过正态分布原理转换为标准分(Z分数或其变形),使得不同年份、不同版本的考试成绩可以公平比较。

常见误解与注意事项

开始使用此工具时,尤其是从CAE领域转来的用户需要注意几点。首先,要始终质疑“数据服从正态分布”这一前提。仿真结果的应力集中值或流量最大值往往更接近对数正态分布。不要因为工具能画出漂亮的钟形曲线,就试图将所有数据都拟合为正态分布,否则可能会误判罕见重大故障的发生概率。

其次,在参数设置时切勿混淆“标准差σ”与“方差σ²”。工具需要输入的是“标准差”。例如,即使公差指定为±0.1mm,也需确认它指的是标准差还是范围。多数情况下,公差意味着±3σ(99.7%的零件落在此范围内)。因此,若直接将公差0.1mm输入为σ=0.1,就会假设出比实际更宽的分布。正确的做法通常是估算为σ = 0.1 / 3 ≈ 0.033。

最后是关于“异常值”的处理。分析实际数据时,平均值和标准差对异常值极为敏感。在工具中确定μ和σ之前,务必通过直方图等方式确认数据全貌。若存在一个极端大值,会拉高平均值并放大标准差,导致对实际波动的评估过高。这样计算出的“不良率0.1%”等结果可能与实际情况相差甚远。