赤い点が SGD(最尤推定に直行)、青い点が SGLD(Brownian 雑音で事後分布の輪郭を探索)。同心の薄い円が事後分布 p(θ|D) の等高線。η と雑音強度を変えると軌跡の広がりが変化します。
$$\theta_{t+1} = \theta_t - \frac{\eta_t}{2}\sum_{i\in B_t} \nabla L_i(\theta_t) + \sqrt{\eta_t}\,\xi_t,\quad \xi_t \sim \mathcal{N}(0,I)$$
SGLD 更新則(Welling & Teh 2011)。η_t はステップサイズ、B_t はミニバッチ、ξ_t は Brownian 雑音。η→0 の極限で正確な事後分布サンプリング、有限 η では bias を伴う近似。
$$\mathrm{Bias} \;\propto\; \eta\,\sigma_g^2\,\frac{N}{B}, \qquad \mathrm{Var} \;\propto\; \eta, \qquad \tau_{\mathrm{mix}} \approx \frac{1}{\eta}$$
確率的バイアスは η と勾配分散 σ²_g に比例、混合時間 τ_mix は η の逆数。Brownian 雑音は √(2η) スケールで支配的になり、KSD(Kernel Stein Discrepancy)も η の関数として上界がついている(Chen-Ding-Carin 2015)。