分布设置
矩与百分位数
理论与主要公式
$$f(x;\mu,\sigma) = \frac{1}{\sigma\sqrt{2\pi}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$$
正規分布 PDF:\(\mu\) 平均、\(\sigma\) 標準偏差。68-95-99.7則が成立
$$f(x;\lambda) = \lambda e^{-\lambda x}, \quad f(x;a,b) = \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)}x^{a-1}(1-x)^{b-1}$$
指数分布(左)とベータ分布(右):信頼区間・ベイズ統計に利用
什么是概率分布
🎓
简单来说,它就像一个“可能性地图”。比如,你想知道一根新设计的汽车弹簧,它的使用寿命是多少小时。我们不可能测试每一根,但通过概率分布,就能预测“大部分弹簧寿命在10万到12万小时之间,极少部分会低于8万小时”。试着在模拟器里选择“正态分布”,然后拖动“均值μ”和“标准差σ”的滑块,你会看到那条钟形曲线在变化,它描绘的就是这种可能性。
🙋
诶,真的吗?那旁边那个“二项分布”和“泊松分布”又是干嘛的?好像和“试验次数n”、“成功概率p”有关?
🎓
问得好!这两种是处理“计数”问题的。比如,工厂生产100个零件(这就是n),每个零件有1%的次品率(p=0.01)。你想知道这批货里恰好有3个次品的概率是多少?这就用二项分布。工程现场更常见的是,当n很大、p很小时,比如预测一个大型风力发电场在一年内发生罕见故障的次数,这时用泊松分布(参数是平均故障率λ)更方便。你可以在模拟器里切换分布类型,分别调整n、p和λ,看看概率图是怎么跳变的。
🙋
原来是这样!那“卡方分布”和“CDF曲线”又是怎么回事?感觉更复杂了。
🎓
别怕,我们一步步来。CDF(累积分布函数)曲线非常实用!它直接告诉你“不超过某个值的概率”。比如在汽车碰撞试验中,我们模拟了1000次,发现车头最大变形量不超过200mm的概率是95%,这个95%就是从CDF曲线上读出来的。至于卡方分布,它经常用来检验你的模拟数据跟实际测试数据是否“吻合得好”。改变参数“自由度k”,你会看到曲线从陡峭变得平缓。这在验证CAE模型精度时特别有用。
物理模型与关键公式
正态分布(高斯分布):描述连续变量(如尺寸、强度、寿命)围绕均值随机波动的经典模型。
$$f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$$
其中,$\mu$是均值(分布的中心),$\sigma$是标准差(衡量数据的分散程度)。$f(x)$是概率密度函数(PDF),表示$x$附近取值的可能性大小。
泊松分布:描述在固定时间或空间内,稀有事件发生次数的概率分布。
$$P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$$
其中,$\lambda$是单位时间内事件发生的平均速率,$k$是我们观察到的实际发生次数(0, 1, 2...)。$P(X=k)$是概率质量函数(PMF),给出恰好发生$k$次事件的概率。
现实世界中的应用
可靠性工程与风险评估:在CAE中,材料的疲劳强度、零件的寿命并非固定值,而是服从正态分布。通过分布计算,可以预测产品的失效概率,从而设计出满足99.9%可靠性的部件,避免过度设计或设计不足。
生产质量与过程控制:生产线上零件的关键尺寸(如孔径)通常服从正态分布。通过监控分布参数(μ, σ),可以判断生产过程是否稳定,并计算产品Pass率,为六西格玛管理提供数据基础。
罕见故障事件预测:对于航天器或核电站在特定任务周期内的微小部件故障,可以使用泊松分布进行建模。通过历史数据估计平均故障率λ,从而规划备件库存和制定维护策略。
仿真数据验证与置信度分析:将CAE仿真结果(如应力值)与少量物理测试结果进行对比时,使用卡方分布进行“拟合优度检验”,可以定量评估仿真模型的可信度,为模型修正提供统计依据。
常见误解与注意事项
首先,要明确“PDF的高度并非概率本身”。例如,均值为0、标准差为0.5的正态分布PDF在x=0处取值约为0.8。这表示“0是最可能出现的值”,但并不意味着“X=0的概率为0.8”。因为连续分布中单点的概率始终为0。若想了解概率,必须指定区间并计算PDF下方的面积。你可以在工具中选择“正态分布”,通过PDF视图目测x=0到0.5之间的区域。该面积即对应随机变量落入该区间的概率。
其次,注意分布参数设置中量纲的统一。二项分布的试验次数n与成功概率p、泊松分布的平均发生次数λ,都需要根据实际数据仔细考量单位。例如,用泊松分布对“每小时平均到达3名顾客”建模时,若分析的时间窗口为30分钟,则需设定λ=1.5。在工具中将λ从3改为1.5,可观察到分布峰值向左移动。此类设置错误会严重扭曲预测结果,需格外留意。
最后,蒙特卡洛采样中“N值并非越大越好”这一实际陷阱。虽然N=10000比N=2000能生成更接近理论PDF的直方图,但需权衡计算成本与精度。尤其在评估罕见“尾部风险”时,与其单纯增加N,不如采用重要性采样等高级方法。在工具中选择“t分布(自由度3)”,用N=1000多次点击“采样”按钮,可观察到直方图两端(尾部)形状每次运行都有较大波动。这正是稀有事件模拟困难的原因之一。