汉明码模拟器

参数设置

数据位 1

进入码字第3位(0 或 1)

数据位 2

进入码字第5位(0 或 1)

数据位 3

进入码字第6位(0 或 1)

数据位 4

进入码字第7位(0 或 1)

误差注入位置

0 = 无误，1~7 = 反转该位

计算结果

—

码字(7位)

—

奇偶位 p1·p2·p4

—

伴随式

—

检测到的错误位置

—

纠正后数据

—

纠正成功

—

码字与伴随式 — 误差检测动画

7位码字用第1~7位的单元格表示。奇偶位(位置1·2·4)与数据位用不同颜色标记，注入的误差位用红色闪烁。下方3条弧线表示各奇偶校验的覆盖范围，箭头指向伴随式指出的误差位置。

编码率与冗余性的比较

奇偶校验的覆盖范围

理论·主要公式

$$p_1=d_1\oplus d_2\oplus d_4,\quad p_2=d_1\oplus d_3\oplus d_4,\quad p_4=d_2\oplus d_3\oplus d_4$$

编码(偶奇偶校验)。奇偶位位于2的幂次位置 1·2·4，数据位 d1~d4 位于位置 3·5·6·7。$\oplus$ 表示异或(XOR)。

$$s_1=r_1\oplus r_3\oplus r_5\oplus r_7,\quad s_2=r_2\oplus r_3\oplus r_6\oplus r_7,\quad s_4=r_4\oplus r_5\oplus r_6\oplus r_7$$

解码。从接收码字 r(位置 r1~r7)计算3个伴随式位。

$$\text{伴随式}=4\,s_4+2\,s_2+s_1$$

伴随式(s4 s2 s1)作为二进制数的值直接对应错误位位置(0表示无误)。反转该位即可完成纠正。

什么是汉明码

🙋

我学过用"奇偶位"检查数据错误。但这个工具说能"纠正"错误。检查和纠正有区别吗？

🎓

这正是今天的关键。普通奇偶位只有1个——它只能告诉你"发生了错误"，却无法指出7位中的哪一位坏了，所以没法修复。汉明码用3个奇偶位，每个都故意重叠地监控不同的位集合。当误差发生时，"哪些检查失败"这个模式(伴随式)会直接用二进制数告诉你是第几位出错。就反转那一位，错误就消失了。

🙋

位置号从失败的奇偶位推出来？怎么做到的？

🎓

简单说：3个奇偶检查的成功/失败排成一行，就是一个3位二进制数，能表示0到7。汉明的天才想法是，让"位置1的奇偶位负责地址第1位为1的位置，位置2负责第2位，位置4负责第4位"。所以当出错时，失败检查的组合正好拼出了出错位的二进制地址。试试在左边设"误差注入位置"为5，伴随式应该显示101，就是2进制的5。

🙋

真的！显示101了。那没有错误时呢？

🎓

设"误差注入位置"为0试试。伴随式变成000，代表位置0——这是"无误"的特殊值。无误时全部奇偶检查都通过，伴随式全为0。反过来，只要1位翻转，伴随式就必定变成1到7中的某个数，指向出错位。接收端反转那一位就完成了纠正。再传一遍都省了。

🙋

太神奇了。那2位错误时也能用这个方法修复吗？

🎓

遗憾的是不行。汉明(7,4)码最多修1位错。2位错时伴随式会碰巧匹配上某个"单位错"的模式，你就反转了错误的位置，反而加重了问题。所以实务中常用扩展汉明(8,4)——再加1个总体奇偶位——做到"1位纠正+2位检测"。或者选择距离更大的码，比如RS码，能同时修多位。但汉明码仍然是现代所有纠错码的源头。

🙋

这么古老的码，现在还有用吗？

🎓

不仅有用，而且此刻就在工作。服务器的ECC内存就是这样。DRAM的位会因宇宙射线或噪声随机翻转——叫"软错误"。ECC内存里的汉明码电路实时无声地修正这些翻转，操作系统和用户毫无察觉，计算继续正确进行。1950年理查德·汉明想出来的这个方法，70多年后还在全球数据中心忙碌呢。

常见问题

普通奇偶校验仅用1个奇偶位，只能检测是否发生1位误差，无法确定哪一位错误，因此无法纠正。汉明(7,4)码使用3个奇偶位，每个校验不同的位集合。误差发生时，失败的校验组合（伴随式）的模式直接指出了错误位的二进制位置。接收端只需反转该位即可纠正。这就是"检测"和"纠正"的本质区别。

伴随式是对接收码字重新进行3个奇偶检查的结果。s1 = r1⊕r3⊕r5⊕r7、s2 = r2⊕r3⊕r6⊕r7、s4 = r4⊕r5⊕r6⊕r7，将3个伴随位(s4 s2 s1)作为二进制数读取，其值直接对应错误位的位置(1~7)。0表示无误。每个奇偶校验检验其范围内是否有偶数个1，失败的组合组合出位置的地址——这正是汉明码的精妙设计。

不能。汉明(7,4)码的最小汉明距离为3，仅能纠正1位误差。2位误差可以检测但无法纠正——伴随式会匹配另一个单位误差的模式，导致"纠正"了错误的位置，使情况更糟。若需要2位纠正能力，需要使用更高距离的码（扩展汉明码、BCH码、RS码等）。扩展汉明(8,4)码在添加1个总体奇偶位后可实现"1位纠正+2位检测"(SECDED)。

最常见的应用是ECC(纠错码)内存。服务器和工作站的DRAM会因宇宙射线或电噪声发生比特翻转。汉明码系统电路实时静默纠正这些错误，用户毫无感知。其他应用包括NAND闪存控制器、早期调制解调器通信、卫星遥测等。在1950年由理查德·汉明提出以来，这种码已成为所有现代纠错码的基础。

现实世界的应用

ECC内存(纠错内存)：汉明码最常见也最重要的应用。服务器、工作站和关键系统的DRAM中，宇宙射线(中子)碰撞或电噪声会导致内存单元比特随意翻转，即"软错误"。ECC内存为64位数据配备8位检查位，用汉明码系列的SECDED方案实现1位纠正、2位检测。用户和操作系统毫无察觉，计算静悄悄地继续进行。

NAND闪存与SSD：闪存因多次读写而单元退化，比特误差增加。SSD和USB闪存的控制器内置纠错电路，早期用汉明码，现在用更强的BCH或LDPC码。汉明码因原理简洁、电路小、速度快，在误差率低的应用中仍在工作。

通信与数据传输：早期调制解调器、卫星和航天器遥测、工业串行通信等需要"单向传输、无法重发"的场景中，汉明码用于纠错。只有接收端需纠正，省去往返通信的时间——对超远距离的深空探测尤其宝贵。航天器常把汉明码与更强的码级联使用。

信息论与编码理论教材：汉明码是全球大学教授"什么是纠错码"时的首选例题。最小汉明距离、伴随式解码、生成矩阵、检查矩阵、编码率与纠错能力的权衡——这些编码论基础概念在这个紧凑的(7,4)例子里应有尽有。本模拟器就是为了让这些概念可感知、可体验而设计的教学工具。

常见误解与注意事项

最常见的误解是"汉明码能纠正任何多个错误"。实际上汉明(7,4)码严格地只能纠正1位。这源于码字间的最小汉明距离为3。距离3的码只能做"1位纠正"或"2位检测"二选一。当2位同时出错时，伴随式的值无法与"单位错"区分开，系统会"纠正"不存在的位置，结果反而有3位错了。高误差率的信道需要选择距离更大的码，或多层码级联。

其次，"伴随式为0就绝对没有错"这个想法也不对。伴随式为0确实表示"无误或这个错误碰巧与某个正确码字重合"。后者叫"检测漏洞"，在3位或以上同时出错时会发生——那些错误的组合恰好算出了另一个合法码字。1~2位错不会这样，但3位以上就无法保证。伴随式0只表示"1~2位内无错"，不是"完全无损"的保证。

最后，"冗余位越少越好"的过度简化也有问题。汉明(7,4)的编码率是4/7 ≈ 0.57，约40%的数据用于检查，看似浪费。但汉明(15,11)达到11/15 ≈ 0.73，汉明(31,26)达26/31 ≈ 0.84，码字越长冗余率越低。但代价是码字长时1码字内出现2位以上错的概率上升，纠正能力(仍是1位)相对下降。码长的选择需要在"编码效率"与"抗错能力"间权衡，根据信道真实误差率来设计。

什么是汉明码

常见问题

现实世界的应用

常见误解与注意事项

使用指南

具体计算例

实务注意事项