点群沿着相关系数 ρ 的方向伸展。橙色直线是回归直线(斜率 c)。右侧的柱子比较了普通MC(左)和控制变量法(右)推定量的波动幅度。
$$\hat\theta_{cv}=\bar Y-c\,(\bar X-\mathbb{E}[X]),\qquad c^{*}=\frac{\operatorname{Cov}(X,Y)}{\operatorname{Var}(X)}$$
控制变量推定量 θ_cv 与最优系数 c*。Ȳ、X̄ 是样本平均,E[X] 是已知的控制变量的期望值。
$$\operatorname{Var}(\hat\theta_{cv})=\operatorname{Var}(\hat\theta)\,(1-\rho^2)$$
使用最优的 c* 时,控制变量推定量的方差是普通推定的 (1−ρ²) 倍。ρ 是 X 与 Y 的相关系数。
方差降低率与样本数 n 无关,由 ρ² 决定;效率提升倍率为 1/(1−ρ²)。标准误差缩小到 √(1−ρ²) 倍。