蓝点:观测值 (x_i, y_i),红线:OLS 直线拟合,蓝阶跃:等渗回归输出。池化区间用浅青色带突出显示。
$$\hat f = \arg\min_{f\,\uparrow} \sum_{i=1}^{N} (y_i - f(x_i))^2$$
f↑ 为单调递增(或递减)约束。PAV 在 O(N) 时间内提供最优解。
$$\hat f_{\text{block}}(x) = \frac{1}{|B|}\sum_{i\in B} y_i, \quad B\text{:保持单调性的最大池}$$
各块 B 的预测值为其平均值。相邻块如果破坏顺序则合并再平均。
$$\mathrm{MSE}_{\text{iso}} \sim \frac{\sigma^2}{N^{2/3}}, \qquad \mathrm{MSE}_{\text{OLS}} \sim \frac{\sigma^2}{N}$$
等渗回归的收敛速度为 N^(-2/3),比线性模型的 N^(-1) 较慢。但当形式假设偏离时无偏差。