从二变量正态分布(μ=0, σ=1,相关 ρ)生成的样本散布及各轴边际直方图。改变相关系数 ρ 时点群的倾斜度和 MI 都会变化。
$$I(X;Y) = \int\!\!\int p(x,y) \log\frac{p(x,y)}{p(x)\,p(y)} \, dx\,dy, \qquad I_{\text{Gauss}} = -\tfrac{1}{2}\log(1-\rho^{2})$$
互信息量 I(X;Y) 的定义(连续变量)及二变量高斯的解析解。bits 时用 log₂,nats 时用 ln。I=0 ⟺ X,Y 独立,I→∞ 为完全依赖。
$$I(X;Y) = H(X) + H(Y) - H(X,Y), \qquad H_{\mathcal{N}(0,1)} = \tfrac{1}{2}\log(2\pi e)$$
通过熵 H 的分解(等价形式)。标准高斯的微分熵为 ½·log(2πe) ≈ 1.4189 nats。
$$\widehat{I}_{\text{KSG}} = \psi(k) - \langle \psi(n_x+1) + \psi(n_y+1) \rangle + \psi(N)$$
Kraskov-Stögbauer-Grassberger (2004) 的 k-NN 估计式。ψ 是二伽玛函数,n_x, n_y 是边际近邻点数。本工具采用基于高斯的简化偏差和方差模型。