二项分布可视化计算器 返回
確率/統計

二项分布可视化计算器

调节试验次数 n 与成功概率 p,实时可视化二项分布 B(n,p) 的 PMF、CDF 与区间概率,并同步比较泊松近似与正态近似的逼近效果。

参数

P(k ) =

预设

计算结果
平均 μ = np
標準偏差 σ
歪度 γ₁
众数(模)
Pmf

蓝色柱:P(X=k) 红线:查询的 k 位置

Cdf

累积分布函数 F(k) = P(X ≤ k)。阶梯状是离散分布的特征。

Approx

蓝色:二项分布(真值) 绿色:正态近似 橙色:Poisson 近似。调整 n/p 以确认近似精度。

理论与主要公式

$P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}$

平均:$\mu = np$

分散:$\sigma^2 = np(1-p)$

歪度:$\gamma_1 = \dfrac{1-2p}{\sqrt{np(1-p)}}$

正規近似:$X \approx \mathcal{N}(np,\,np(1-p))$

Poisson近似(p小):$X \approx \text{Poi}(np)$

🙋 抛硬币20次,正面出现的次数怎么算?

🙋
抛硬币20次,只有正面和反面,而且每次都是独立的对吧?这种情况下,正面恰好出现 k 次的概率怎么算呢?
🎓
这就是二项分布。P(X=k) = C(n,k) × p^k × (1-p)^(n-k)。例如硬币(p=0.5)抛 n=20 次,恰好出现10次正面的概率是 C(20,10)×0.5^20 ≈ 17.6%。在这个模拟器里设置 n=20、p=0.5,然后查看 k=10,答案一下就出来了。
🙋
在“近似比较”选项卡里出现了“正态近似”和“泊松近似”,它们什么时候用呢?
🎓
正态近似在 n 较大且 p 接近0.5时有效,判断标准是 np≥5 且 n(1-p)≥5。比如 n=100、p=0.3 时,二项分布的柱状图几乎呈正态分布的钟形。泊松近似则相反,适用于 n 较大而 p 非常小的情况——比如工厂的次品率(p=0.01 之类)这类稀有事件。用“次品预设”试一下,会发现泊松近似几乎完全吻合。
🙋
像“P(k ≤ 6) = ?”这样,想求某个范围的概率时,要用累积分布 CDF 对吧?
🎓
没错。CDF F(k) = P(X ≤ k) 是 k 以下所有概率的总和。在这个工具的“查询”栏里把运算符设为“≤”,k=6,就能直接得到 P(X≤6)。像 P(3≤X≤8) 这样的区间概率,可以用 F(8) − F(2) 来计算。这在质量管理中直接对应实际问题,比如“次品数不超过5个的概率是多少?”。
🙋
显示了一个叫“偏度”的指标,p=0.5 和 p=0.1 的时候差别很大啊。
🎓
偏度 γ₁ = (1-2p)/√(np(1-p)),当 p=0.5 时 γ₁=0(完全对称)。p 接近0时呈正偏(右尾较长),接近1时呈负偏(左尾较长)。这对应了“稀有事件分布更偏斜”的直觉。n 增大时,分母中的 √n 起作用,偏度会变小——这又与中心极限定理联系起来了。
🙋
选举的出口民调经常说“误差 ±3%”,这和二项分布有关系吗?
🎓
直接相关。对 n 个人问是或否时,“是”的人数服从二项分布 B(n, p)。标准误差是 σ/√n = √(p(1-p)/n)。95%置信区间是 p̂ ± 1.96√(p̂(1-p̂)/n)。计算“n=1000, p̂=0.5”的情况,得到 ±3.1%,这说明常见的“±3%误差”的出口民调大约对应 n=1000 的调查。在这个模拟器里设置 n=1000、p=0.5,可以看到 σ 变得非常小。

常见问题

①每次试验相互独立;②每次试验只有“成功”或“失败”两种结果;③每次试验的成功概率 p 恒定(伯努利试验);④试验次数 n 固定。如果抽牌后不放回(无放回抽样),则不独立,此时应使用超几何分布而非二项分布。
当 n 较大且 p 较小(λ = np 适中)时,可用 B(n,p) ≈ Poisson(λ) 近似。实用判断标准为 n≥20 且 p≤0.05(或 np≤10)。例如:工厂次品率 p=0.01,检验数 n=100 时,可用 λ=1 的泊松近似。若 n 较小或 p 较大,请直接使用二项分布。
用正态分布(连续)近似二项分布(离散)时,采用 P(X=k) ≈ P(k-0.5 ≤ Y ≤ k+0.5) 的 ±0.5 宽度修正。相比无连续修正,精度更高。例如:近似 P(X≤5) 时,有连续修正则计算 P(Y≤5.5)。样本量越小,连续修正的效果越明显。
检验总体比例 p₀ 的原假设 H₀: p = p₀ 时,根据观测到的成功次数 k,计算 B(n, p₀) 下的 P 值。例如:判断硬币是否公平(p=0.5),n=100 次中 k=60 次正面,则通过 CDF 计算 p值 = P(X≥60|p=0.5),若小于0.05则拒绝 p=0.5。在本模拟器的累积分布选项卡中可查看 P(X≥k)。
二项分布用于有放回抽样(试验独立,p 恒定),超几何分布用于无放回抽样(每次试验成功概率变化)。例如:N 张卡片中有 K 张中奖卡,抽取 n 张,中奖张数服从超几何分布 HG(N,K,n)。当 n 相对于 N 足够小(n/N < 0.05)时,可用二项分布近似。

什么是二项分布可视化计算器?

二项分布可视化计算器是CAE和应用物理中的重要基础课题。本交互式模拟器允许您直接调节参数并观察实时结果,从而理解关键规律和变量之间的关系。

通过将数值计算与可视化反馈相结合,本模拟器有效地弥合了抽象理论与物理直觉之间的鸿沟,既是学生的高效学习工具,也是工程师进行快速验算的实用手段。

物理模型与关键公式

本模拟器基于二项分布可视化计算器的核心控制方程构建。理解这些方程有助于正确解读计算结果,并判断参数变化对系统行为的影响。

方程中的每个参数都对应控制面板中的一个滑块。移动滑块时,方程的解会实时更新,帮助您直观建立数学表达式与物理行为之间的对应关系。

实际应用场景

工程设计:二项分布可视化计算器相关概念可用于工程初步估算、参数灵敏度分析和教学演示。在开展更完整的CAE分析之前,可借助本工具快速把握主要物理量级与趋势。

教育与科研:在工程教学中,本工具可将理论与数值计算有效结合。在科研阶段,也可作为假设验证的第一步工具使用。

CAE工作流集成:在运行有限元(FEM)或计算流体力学(CFD)仿真之前,工程师通常先用简化模型评估物理量级、识别主导参数,并确定合理的边界条件,本工具正是为此目的而设计。

常见误解与注意事项

模型假设:本模拟器所用数学模型基于线性、均质、各向同性等简化假设。在将计算结果直接用于设计决策之前,务必确认实际系统是否满足这些假设。

单位与量纲:许多计算错误源于单位换算错误或数量级判断失误。请时刻注意各参数输入框旁标注的单位。

结果验证:始终将模拟器输出结果与物理直觉或手算结果进行核对。若结果出乎意料,请检查输入参数或采用独立方法进行验证。