二维系数空间 (β₁,β₂) 上 Lasso 菱形 L1 约束与 Ridge 圆形 L2 约束的混合。α 控制混合比,λ 控制大小,从 OLS 最小点到弹性网络解的轨迹。
$$\hat\beta_{\text{EN}} \;=\; \arg\min_{\beta}\;\frac{1}{2N}\|y - X\beta\|_{2}^{2} \;+\; \lambda\left(\alpha\,\|\beta\|_{1} + \frac{1-\alpha}{2}\,\|\beta\|_{2}^{2}\right)$$
弹性网络的目的函数(Zou & Hastie 2005)。α=L1/L2 混合比,λ=正则化强度。α=1 时为 Lasso,α=0 时为 Ridge,0<α<1 时兼具两者优点。
$$\text{MSE} \;=\; \underbrace{\left(\frac{\lambda}{\lambda+1}\right)^{2}\!\cdot 0.5\,s/p}_{\text{偏差}^{2}} \;+\; \underbrace{\frac{\sigma^{2}}{N}\,k_{\text{sel}}\,(1+\rho)}_{\text{方差}}$$
估计误差的近似。k_sel 为选择的特征数,ρ 越大方差越大。α·λ 的选择通常通过 CV 进行(典型 α=0.5)。