点:数据样本,灰线:k-NN 图边,色:谱聚类分割(与 k-means 不同,能分离非凸形状)。
$$L = D^{-1/2}\,(D - W)\,D^{-1/2},\qquad y_k = \text{特征向量}(L,\,k) \to \text{k-means}$$
W:N×N 亲和矩阵(RBF、k-NN、余弦等),D:对角度矩阵 D_ii=Σ_j W_ij,L:对称正规化图拉普拉斯算子。将 L 的最小 k 个特征值对应的特征向量排列成 N×k 矩阵,按行正规化后用 k-means 聚类(Ng-Jordan-Weiss 2001)。
$$W_{ij}^{\text{RBF}} = \exp\!\left(-\frac{\|x_i-x_j\|^2}{2\sigma^2}\right),\qquad \text{特征值间隙} = \lambda_{K+1} - \lambda_K$$
RBF 亲和由 σ 控制带宽。特征值间隙(eigengap)是判断最优簇数 K 的指标,间隙最大处为谱上的自然分割点。