人工耳蜗电极通道设计模拟器 返回
医工学·听觉学

人工耳蜗电极通道设计模拟器 — 语音清晰度

为重度感音性听力损失患者设计的工具,通过直接电刺激听神经激活人工耳蜗(耳蜗植入体)。改变电极通道数、脉冲速率、编码方式、耳蜗插入角度时,语句清晰度(安静·噪声中)和耳蜗覆盖率可实时计算,帮助比较和检验最适合植入者的调节策略。

参数设置
有效电极数 N
ch
程序中实际用于刺激的电极数量
脉冲速率
Hz/ch
单个电极的单位时间脉冲刺激数量
刺激水平
dB SPL
编码策略
音频到电极的映射方式
电极插入角度
°
电极到达的耳蜗角度范围(总共540°)
频率下限
Hz
频率上限
Hz
计算结果
有效电极数 (ch)
全刺激速率 (pps)
通道带宽 (Hz)
语句清晰度 安静 (%)
语句清晰度 噪声中 (%)
耳蜗覆盖 (%)
耳蜗横截面 — 电极阵列与频率映射

耳蜗(540°螺旋)内置的电极阵列。各电极通过Greenwood函数的位置-频率映射关联到对应的频率带宽。电刺激脉冲在时间上交错。

语句清晰度 vs 通道数(安静·噪声中)
各电极的担当频率带宽 (Hz)
理论·主要公式

$$f(d) = 165.4\left(10^{\,2.1\,d/L} - 1\right), \qquad P_{\text{sentence}} \approx 1 - e^{-N/4}$$

f:Greenwood频率-距离关系式 (Hz),d:耳蜗基底到某点的距离 (mm),L:耳蜗总长度 (≈35 mm),N:独立谱通道数。根据Friesen & Shannon (2001),语句清晰度在N=8附近达到70%,N=16时约90%,之后趋于饱和。

$$\text{StimRate}_{\text{total}} = N \cdot R_{\text{pulse}}, \qquad \text{BW}_{ch} = \frac{f_{\text{high}} - f_{\text{low}}}{N}, \qquad \text{Cov} = \frac{\theta_{\text{ins}}}{540°}$$

全刺激速率(pps)、通道带宽、耳蜗覆盖率的基本公式。真实设备的电学动态范围约15 dB,与正常人的120 dB相比极其狭窄。

人工耳蜗电极通道设计与语音清晰度

🙋
听说人工耳蜗和助听器完全不同。实际工作原理是什么?
🎓
助听器只是一个将"大音量"传送到鼓膜的放大器,而人工耳蜗是为那些毛细胞完全不工作的人设计的,通过直接电刺激听神经来实现。在耳后皮下植入一个接收器,然后在耳蜗(蜗牛形状的内耳)内放入一个硅质电极阵列,通常包含12~22条电极。外部的声音处理器用麦克风拾取声音并进行频率分解,然后向对应位置的电极发送脉冲。耳蜗有一个"音调拓扑"特性——基底侧(入口)处理高频,顶部侧(深处)处理低频——可用Greenwood公式f=165.4(10^(2.1d/L)−1)来建模。这就是为什么工具左边把频率范围设为250~8000 Hz。
🙋
电极越多应该越好吧?我把滑块拖到32后,以为清晰度会达到100%,但它平稳了……
🎓
这是人工耳蜗设计中最大的谜团和难点。Friesen & Shannon在2001年发表了一篇著名论文,表明语句清晰度遵循1−exp(−N/4)这样的饱和曲线,其中N是通道数。在N=8时已经达到70%,N=16时达到90%,之后继续增加电极数也没有提高。原因是"电学相互作用(channel interaction)"——邻近电极发出的电流在体液中扩散并重叠,实际上独立的通道数只有8~10条。所以各制造商不是在电极数上竞争,而是通过编码策略(CIS/ACE/HiRes)和插入位置来进行差异化。
🙋
我看到编码策略的下拉菜单改变了清晰度。CIS、ACE和HiRes分别有什么区别?
🎓
CIS (Continuous Interleaved Sampling)是北卡罗来纳州的Wilson等人在1991年提出的革命性方法,通过错开时序依次刺激所有电极来抑制电学干扰。它仍然是几乎所有CI的基础。ACE (Advanced Combination Encoders)是Cochlear公司的"n-of-m"策略,每帧只选择幅度最大的n条电极进行刺激,以提高噪声鲁棒性。HiRes Fidelity 120是Advanced Bionics的"虚拟通道"技术,同时向两条电极发送电流来伪造中间位置的刺激,最多可创建120个谱带。本工具经验上使用CIS=1.0、ACE=1.10、HiRes=1.15的效率系数进行修正。
🙋
我把插入角度降到270°,覆盖率下降到50%,出现了警告。实际手术中怎样才能深部插入?
🎓
观察得很仔细!耳蜗是一个约2.5圈=540°的螺旋,插入太浅会导致电极无法到达低频区域(顶部)。这样500 Hz以下的元音和基本频率就会丢失,导致"音乐听起来很刺耳""难以分辨男性嗓音"等问题。为了进行深部插入,需要选择柔软的硅胶"周围神经电极"(Cochlear公司的Contour Advance)或长型的"直电极"(MED-EL Standard 31.5mm)。最近的技术甚至包括手术中用荧光透视确认电极先端位置,以及用机器人以每秒0.1mm的超低速进行插入来保护残留听力。现代临床标准是450°插入(覆盖83%)。
🙋
噪声中的清晰度比安静时低20%。这在实际生活中会如何影响?
🎓
这是CI使用者最大的烦恼。人工耳蜗无法传递时间精细结构(temporal fine structure),只能重现每个通道的包络线(envelope)。健聴人利用双耳间的相位差和基本频率来使用"鸡尾酒会效应"从噪声中分离目标声音,但CI使用者失去了这些线索。即使一个静室中有95%清晰度的人,在餐厅或会议室(SNR ~10 dB)也常常下降到50~70%。此外,对于汉语这样的声调语言,音调辨别的时间精细结构决定了声音的含义本身,所以CI中的声调识别率不到正常人的一半。双耳植入(bilateral CI)和FM辅助系统是现代主要的对策。

常见问题

根据Friesen-Shannon (2001)的实验,语句清晰度遵循P_sentence ≈ 1 − exp(−N/4),在N=8附近达到70%,N=16时达到90%,之后趋于平稳。即使将电极增加到22条,相邻电极的电场重叠也会产生"电学相互作用(channel interaction)",导致实际的独立通道数通常仅限于8~10条。本工具也重现了这种饱和现象。
CIS (Continuous Interleaved Sampling, Wilson 1991)是通过时间错开依次刺激所有电极来抑制电学干扰的基本方法。ACE (Advanced Combination Encoders)是Cochlear公司的n-of-m方式,每个时间框仅选择幅度最大的n条进行刺激,以提高噪声鲁棒性。HiRes Fidelity 120 (Advanced Bionics)使用虚拟通道技术在电极对之间创建额外的频率带,实现最多120个谱带。本工具经验上使用CIS=1.0、ACE=1.10、HiRes=1.15的效率系数进行清晰度修正。
耳蜗呈约540°的螺旋结构,插入角度越大,电极越能到达低频区域(顶部螺旋)。在360°插入时只能刺激基底至中螺旋,导致500 Hz以下的元音信息丧失,造成"音乐听起来很刺耳""难以分辨男性嗓音"等现象。本工具从插入角度计算覆盖率(=角度/540°),推荐450°(覆盖83%)及以上。MED-EL长电极(31.5mm)是深部插入的典型代表。
人工耳蜗无法传递时间精细结构(temporal fine structure),只能再现每个通道的包络线(envelope)。健聴人使用双耳相位差和基本频率从噪声中分离目标声音,但CI使用者失去了这一线索。在10 dB SNR环境下,清晰度大约下降到80%,声调语言(如汉语声调)和音乐欣赏的影响更为严重。本工具将噪声中的得分近似表示为安静时的80%。

实际应用

临床调节(配图): 听觉学专家对植入儿童和成人的音图进行T水平(能听到的电流量)和C/M水平(舒适最大电流)的个别调整。像本工具这样的通道数、脉冲速率、编码方式组合评估在SoundWave (AB)、Custom Sound (Cochlear)、Maestro (MED-EL)等临床调节软件中日常进行。调节通常需要2~3年的时间来逐步优化。

新生儿筛查和早期植入: 先天性聋儿童如在12个月前植入,可期待与正常儿童相同的语言发展(Niparko 2010)。全球新生儿听觉筛查(NHS)已成为标准,日本也约90%的新生儿通过ABR/OAE进行检查,双侧重度聋诊断后约在1岁前进行人工耳蜗手术。本工具也可用于预测此类低龄植入病例的长期预后。

双侧植入(Bilateral CI)和双模式: 与单侧植入相比,双侧CI在噪声中将语句清晰度提高15~25%,并恢复声源定位能力(双耳时间差ITD·音压差ILD)。若对侧耳有残留听力,也可考虑与助听器联合使用的双模式。CI的电刺激和助听器的声学刺激在脑内融合,特别是对低频音乐欣赏有很大帮助。

研究和新技术: 光遗传学人工耳蜗(optogenetic CI, Moser 2020)有望用光纤刺激代替电刺激,空间分辨率可能提高数个数量级。基于AI的噪声抑制(Forward-Focus、DeepFilter)开始应用于声音处理器,与本工具的"编码策略"等选项相比,未来的选择将大幅增加。

常见误解和注意事项

首先最大的误解是"电极越多听得越自然"。前面提到的Friesen-Shannon曲线表明,现代经皮型CI的实效通道数在8~10处饱和。Cochlear Nucleus的22条电极和AB HiRes的16条电极在噪声中的语句清晰度上没有明显差异,许多研究都证实了这一点。真正有效的因素是插入深度、残留听力保护、编码策略、双侧化,电极数量是次要因素。本工具也清楚地表明N=16和N=22的清晰度几乎相同。

其次是"Greenwood函数的频率映射是绝对的"这种误解。Greenwood公式描述的是正常听者的听觉位置,在CI植入者的耳蜗中,由于插入位置、神经存活率、神经变性等因素,会产生很大的偏差。特别是在小儿中,大脑可塑性会在6个月左右时间内对新的频率映射进行适应性学习(知觉学习),初期可能会出现"米老鼠声"的感觉。请使用本工具的频率映射作为设计的起点,术后进行允许映射偏移的调节。

最后是"脉冲速率越高时间分辨率越好"这种误解也要当心。从500 pps提高到1500 pps确实会改善包络线追踪性能,但超过3000 pps时会接近神经的不应期(refractory period,约1ms),活动电位会以概率性方式发生。Vandali (2000)报告800~1200 pps最优,现有设备的标准(约900 pps)就是基于此。电池消耗也会急剧增加,不建议盲目提速。本工具也以900 pps作为默认值。

使用指南

  1. 选择有效电极数(8~22ch)。MED-EL Combian 40+有22个通道,Cochlear Nucleus 7有24个通道,通常激活8~16个通道进行计算
  2. 设置全刺激速率(500~3500 pps)。Nucleus ACE为500 pps,HiRes Optics为3500 pps。速率越高,同步去极化增加,频率辨别越好
  3. 输入耳蜗插入角度(360~720度)。360度是耳蜗一圈,720度是两圈。Greenwood函数自动计算每条电极的频率映射
  4. 模拟器实时计算安静时的语句清晰度(CID句子,平均85~95%)和噪声中的清晰度(S/N=10dB时,平均60~75%)
  5. 检查通道带宽和耳蜗覆盖率,判断电极配置的合理性

具体计算示例

MED-EL Combian 40+激活12个通道、刺激速率2400 pps、插入角度450度(1.25圈)的情况下:最低频率188 Hz到最高频率8500 Hz完全覆盖,每通道带宽700 Hz。安静时语句清晰度91%,S/N=10dB噪声环境下68%。同条件下将电极数减少到8条时,带宽扩大到1050 Hz,安静时87%,噪声中58%,这反映了通道间串扰增加的影响

实际操作注意事项