2D 散布データに K 個のガウス楕円をフィッティングする様子。楕円は共分散行列の主軸(1σ)を表し、EM 反復ごとに位置・形状・向きが更新されます。色は成分ごとの所属確率を表します。
$$Q(\theta|\theta^{old}) = E_{Z|X,\theta^{old}}[\log p(X,Z|\theta)],\quad BIC = -2\log L + k\log N$$
Q は完全データ対数尤度の期待値。E-step で事後確率 γ(z) を計算し、M-step で Q を最大化するパラメータ θ を求める。Q は単調非減少で収束が保証される。
$$p(x) = \sum_{k=1}^{K} \pi_k\,\mathcal{N}(x|\mu_k,\Sigma_k),\quad \sum_k \pi_k = 1$$
GMM の確率密度。π_k は混合比、μ_k は平均、Σ_k は共分散行列。K-means は Σ_k=σ²I かつハード割り当ての特殊ケース。
$$AIC = -2\log L + 2k,\quad \mathrm{ARI} \in [-1, 1]$$
AIC はパラメータ数 k によるペナルティ、BIC はサンプル数 N による厳しいペナルティ。ARI (Adjusted Rand Index) は 1 で完全一致、0 で偶然レベル。