横軸が元の重み w₀、縦軸が正則化後の重み。L1は[−λ,λ]の帯(脈動部分)で重みを0にし、L2は原点を通る傾き 1/(1+λ) の直線です。点A・B・Cが現在の3重みです。
$$w_{L2}=\frac{w_0}{1+\lambda}\qquad\text{(Ridge: 比例縮小)}$$
L2正則化は元の重み w₀ を係数 1/(1+λ) で一律に縮小する。λ がどれだけ大きくても 0 には達しない。
$$w_{L1}=\operatorname{sign}(w_0)\max(|w_0|-\lambda,\,0)\qquad\text{(Lasso: 軟しきい値)}$$
L1正則化は軟しきい値関数で重みを縮める。|w₀| ≤ λ の重みはちょうど 0 になり、スパース(疎)なモデルが得られる。L2にこの厳密なゼロ化は起こらない。
$$\hat{w}=\arg\min_w\;\tfrac12(w-w_0)^2+\lambda\,R(w),\quad R_{L1}=|w|,\;R_{L2}=\tfrac12 w^2$$
いずれも「元の推定値 w₀ への近さ」と「ペナルティ R(w)」のバランスを取る最適化。直交設計ではこの解が上の2式に閉じた形で書ける。