随机数由固定种子 seed=42 的 LCG 与 Box-Muller 法生成,相同参数下结果可重现。
上半:蓝=目标 N(0,1)/绿=提议 q(x)/红虚线=阈值 t/红色填充=尾部 x>t 下半:蓝=朴素 MC 估计/红=IS 估计/绿虚线=真值
目标分布 $p$ 下的期望可由提议分布 $q$ 的加权样本来评估:
$$I = \mathbb{E}_p[h(X)] = \int h(x)\,p(x)\,dx = \mathbb{E}_q\!\left[h(X)\,\frac{p(X)}{q(X)}\right]$$从 $q$ 抽取 $N$ 个样本 $X_i$,并使用权重 $w(X_i)=p(X_i)/q(X_i)$ 进行修正,得到重要性采样估计量:
$$\hat I_{\text{IS}} = \frac{1}{N}\sum_{i=1}^{N} h(X_i)\,w(X_i),\quad X_i \sim q$$对于尾部概率 $P(X>t)$,取 $h(x)=\mathbf 1(x>t)$,$p=\mathcal N(0,1)$,$q=\mathcal N(\mu,\sigma^2)$,权重为
$$w(x)=\frac{\sigma\exp(-x^2/2)}{\exp(-(x-\mu)^2/(2\sigma^2))}$$取 $\mu\approx t$ 时几乎所有样本都落在尾部,方差缩减比 $\operatorname{Var}(\hat I_{\text{MC}})/\operatorname{Var}(\hat I_{\text{IS}})$ 可达数倍乃至上千倍。