概率分布计算器 返回
统计与可靠性

概率分布计算器

选择分布类型并调整参数,实时绘制PDF/PMF和CDF曲线。计算百分位数、均值和方差,用于可靠性工程和统计分析。

分布设置

μ =
σ =

矩与百分位数

计算结果
0.00
均值
1.00
方差
P5(第5百分位)
P95(第95百分位)
PDF(概率密度函数)与 CDF(累积分布函数)
蒙特卡洛直方图 vs 理论PDF
理论与主要公式

$$f(x;\mu,\sigma) = \frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$$

正規分布 PDF:\(\mu\) 平均、\(\sigma\) 標準偏差。68-95-99.7則が成立

$$f(x;\lambda) = \lambda e^{-\lambda x}, \quad f(x;a,b) = \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)}x^{a-1}(1-x)^{b-1}$$

指数分布(左)とベータ分布(右):信頼区間・ベイズ統計に利用

什么是概率分布

🙋
“概率分布”是什么?听起来好抽象啊。
🎓
简单来说,它就像一个“可能性地图”。比如,你想知道一根新设计的汽车弹簧,它的使用寿命是多少小时。我们不可能测试每一根,但通过概率分布,就能预测“大部分弹簧寿命在10万到12万小时之间,极少部分会低于8万小时”。试着在模拟器里选择“正态分布”,然后拖动“均值μ”和“标准差σ”的滑块,你会看到那条钟形曲线在变化,它描绘的就是这种可能性。
🙋
诶,真的吗?那旁边那个“二项分布”和“泊松分布”又是干嘛的?好像和“试验次数n”、“成功概率p”有关?
🎓
问得好!这两种是处理“计数”问题的。比如,工厂生产100个零件(这就是n),每个零件有1%的次品率(p=0.01)。你想知道这批货里恰好有3个次品的概率是多少?这就用二项分布。工程现场更常见的是,当n很大、p很小时,比如预测一个大型风力发电场在一年内发生罕见故障的次数,这时用泊松分布(参数是平均故障率λ)更方便。你可以在模拟器里切换分布类型,分别调整n、p和λ,看看概率图是怎么跳变的。
🙋
原来是这样!那“卡方分布”和“CDF曲线”又是怎么回事?感觉更复杂了。
🎓
别怕,我们一步步来。CDF(累积分布函数)曲线非常实用!它直接告诉你“不超过某个值的概率”。比如在汽车碰撞试验中,我们模拟了1000次,发现车头最大变形量不超过200mm的概率是95%,这个95%就是从CDF曲线上读出来的。至于卡方分布,它经常用来检验你的模拟数据跟实际测试数据是否“吻合得好”。改变参数“自由度k”,你会看到曲线从陡峭变得平缓。这在验证CAE模型精度时特别有用。

物理模型与关键公式

正态分布(高斯分布):描述连续变量(如尺寸、强度、寿命)围绕均值随机波动的经典模型。

$$f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$$

其中,$\mu$是均值(分布的中心),$\sigma$是标准差(衡量数据的分散程度)。$f(x)$是概率密度函数(PDF),表示$x$附近取值的可能性大小。

泊松分布:描述在固定时间或空间内,稀有事件发生次数的概率分布。

$$P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$$

其中,$\lambda$是单位时间内事件发生的平均速率,$k$是我们观察到的实际发生次数(0, 1, 2...)。$P(X=k)$是概率质量函数(PMF),给出恰好发生$k$次事件的概率。

现实世界中的应用

可靠性工程与风险评估:在CAE中,材料的疲劳强度、零件的寿命并非固定值,而是服从正态分布。通过分布计算,可以预测产品的失效概率,从而设计出满足99.9%可靠性的部件,避免过度设计或设计不足。

生产质量与过程控制:生产线上零件的关键尺寸(如孔径)通常服从正态分布。通过监控分布参数(μ, σ),可以判断生产过程是否稳定,并计算产品Pass率,为六西格玛管理提供数据基础。

罕见故障事件预测:对于航天器或核电站在特定任务周期内的微小部件故障,可以使用泊松分布进行建模。通过历史数据估计平均故障率λ,从而规划备件库存和制定维护策略。

仿真数据验证与置信度分析:将CAE仿真结果(如应力值)与少量物理测试结果进行对比时,使用卡方分布进行“拟合优度检验”,可以定量评估仿真模型的可信度,为模型修正提供统计依据。

常见误解与注意事项

首先,要明确“PDF的高度并非概率本身”。例如,均值为0、标准差为0.5的正态分布PDF在x=0处取值约为0.8。这表示“0是最可能出现的值”,但并不意味着“X=0的概率为0.8”。因为连续分布中单点的概率始终为0。若想了解概率,必须指定区间并计算PDF下方的面积。你可以在工具中选择“正态分布”,通过PDF视图目测x=0到0.5之间的区域。该面积即对应随机变量落入该区间的概率。

其次,注意分布参数设置中量纲的统一。二项分布的试验次数n与成功概率p、泊松分布的平均发生次数λ,都需要根据实际数据仔细考量单位。例如,用泊松分布对“每小时平均到达3名顾客”建模时,若分析的时间窗口为30分钟,则需设定λ=1.5。在工具中将λ从3改为1.5,可观察到分布峰值向左移动。此类设置错误会严重扭曲预测结果,需格外留意。

最后,蒙特卡洛采样中“N值并非越大越好”这一实际陷阱。虽然N=10000比N=2000能生成更接近理论PDF的直方图,但需权衡计算成本与精度。尤其在评估罕见“尾部风险”时,与其单纯增加N,不如采用重要性采样等高级方法。在工具中选择“t分布(自由度3)”,用N=1000多次点击“采样”按钮,可观察到直方图两端(尾部)形状每次运行都有较大波动。这正是稀有事件模拟困难的原因之一。

使用指南

  1. 选择分布类型:正态分布(输入μ=100、σ=15)、指数分布(输入λ=0.05)或威布尔分布(输入形状参数α=1.8、尺度参数β=500)
  2. 在对应输入框中填入参数值,系统自动绘制PDF/CDF曲线
  3. 查询百分位数:输入概率值0.95,得出对应的分位点;计算均值E(X)和方差D(X)
  4. 导出数据表格,对比不同参数下的分布特征

具体计算示例

轴承寿命评估:设疲劳强度服从正态分布,μ=8000小时,σ=1200小时。输入这两个参数后,计算器显示:P(X≤6400)=0.0668(即6.68%的轴承在6400小时前失效),95%分位数=9974小时。对比指数分布(λ=1/8000=0.000125),MTTF均值为8000小时,但可靠度函数R(t)=e^(-0.000125t)下降更陡峭,说明正态分布更适合此场景。

实务注意事项

  1. 参数量纲需一致:若σ=15与μ=100的单位为MPa,则百分位数结果也为MPa,避免应力-应变混淆
  2. 威布尔分布中α=1时退化为指数分布,α=3.6时近似正态分布,用于磨损失效模式判断
  3. 可靠性设计中,99.7%分位数对应正态分布的μ±3σ范围,用于确定安全系数
  4. 大样本数据(n>30)优先用正态分布近似;小样本需检验拟合优度(K-S检验)