2D 散布数据拟合 K 个高斯椭圆的过程。椭圆代表协方差矩阵的主轴(1σ),在 EM 迭代中位置、形状和方向不断更新。颜色表示各成分的所属概率。
$$Q(\theta|\theta^{old}) = E_{Z|X,\theta^{old}}[\log p(X,Z|\theta)],\quad BIC = -2\log L + k\log N$$
Q 是完全数据对数似然的期望值。E-step 计算后验概率 γ(z),M-step 求最大化 Q 的参数 θ。Q 单调非递减且收敛得到保证。
$$p(x) = \sum_{k=1}^{K} \pi_k\,\mathcal{N}(x|\mu_k,\Sigma_k),\quad \sum_k \pi_k = 1$$
GMM 的概率密度。π_k 是混合比,μ_k 是均值,Σ_k 是协方差矩阵。K-means 是 Σ_k=σ²I 且硬分配的特殊情况。
$$AIC = -2\log L + 2k,\quad \mathrm{ARI} \in [-1, 1]$$
AIC 根据参数数 k 施加惩罚,BIC 根据样本数 N 施加更严格的惩罚。ARI (调整兰德指数) 在值为 1 时表示完全一致,0 表示偶然水平。