语言传输指数 STI 模拟器 返回
建筑声学

语言传输指数 STI 模拟器

语言传输指数 STI(Speech Transmission Index)通过调制传递函数(MTF)定量评价混响与背景噪声对语音可懂度的破坏,是 IEC 60268-16 的国际标准指标。调整混响时间 T60、信噪比、距离、房间体积与指向性,即可实时评估教室、剧院、PA 与应急广播的语音清晰度。

参数设置
混响时间 T60
s
声源停止后声压衰减 60 dB 所需的时间
信号电平
dB
说话人或扬声器在 1 m 处的声压级
背景噪声
dB
空调、人群嘈杂等背景噪声(A 计权参考)
声源-听者距离
m
房间体积 V
教室≈200,报告厅≈3000,体育馆≈10000,机场大厅≈30000
声源指向性 Q
无指向=1,人声≈2,号筒≈10,柱形扬声器≈20
计算结果
混响时间 T60 (s)
临界距离 (m)
听者位置 SNR (dB)
混响调制系数 m_rev
STI 值
清晰度等级
室内声场动画 — 直达声、反射声与 SNR 分区

黄色为声源、白色为听者。直达声线与天花板/地面反射声叠加显示,背景按听者位置 SNR 分为绿(≥10 dB)/黄(0~10 dB)/红(<0 dB)三色。

MTF — 调制频率 vs m(混响 + SNR)
STI vs 混响时间 T60(当前 SNR 条件)
理论与主要公式

$$m_{rev}(F) = \frac{1}{\sqrt{1+\bigl(\frac{2\pi F\,T_{60}}{13.8}\bigr)^{2}}},\quad m_{snr} = \frac{1}{1+10^{-\mathrm{SNR}/10}}$$

调制传递函数(MTF)。F 为调制频率 [Hz],T60 为混响时间 [s],SNR 为听者位置信噪比 [dB]。混响与 SNR 作为两个独立的调制衰减因子合成。

$$m_{k} = m_{rev,k}\cdot m_{snr,k},\quad \mathrm{SNR}_{eff} = 10\log_{10}\!\frac{\bar{m}}{1-\bar{m}}$$

分带合成 m 及对应的视在有效 SNR。本工具采用 0.63~12.5 Hz 的 14 个调制频率求平均,作为一倍频带近似。

$$\mathrm{STI} = \frac{\mathrm{SNR}_{eff,\,clip} + 15}{30}\in[0,1]$$

STI 是将 SNR_eff 限幅在 ±15 dB 后的线性映射。低于 0.45=Poor,0.60~0.75=Good,0.75 以上=Excellent(IEC 60268-16)。

用 STI 评估语音清晰度

🙋
在大厅里听广播经常「啥也听不清」,调大音量不就能解决吗?
🎓
有意思的是,调大音量往往无效,反而让反射声更多,混响会把前后音节糊在一起,辅音被"叠掉"。量化这一现象的就是 STI(语言传输指数),由 IEC 60268-16 定义为 0~1 的分数。低于 0.45 词识别率断崖式下降,应急广播 EVAC 法规要求 STI≥0.50。
🙋
STI 是怎么算出来的?它和信噪比不是一回事吗?
🎓
STI 的核心是调制传递函数 MTF。人声的音节节律约 4 Hz、重音节奏 1~2 Hz,这些"慢速包络"承载了意义。混响会把它抹平、噪声会把它埋住。公式上 m_rev = 1/√(1+(2πF·T60/13.8)²),T60 越长低频调制就越被压平;再乘以 m_snr = 1/(1+10^(-SNR/10)),反推出视在 SNR,最终 STI=(SNR_eff+15)/30。
🙋
所以混响与噪声都要看。默认值(T60=1.2 s,信号 70 dB,噪声 50 dB)下 STI=0.45 是 Poor。这是普通教室的水平?
🎓
恰恰是问题所在。中小学教室设计上应做到 T60≈0.7 s,但实测往往 1.0~1.5 s,坐在后排的学生其实是在"Poor"清晰度下听课的。ANSI S12.60 对学校空间要求 STI≥0.65、背景噪声≤35 dB(A)。试着把左侧 T60 改到 0.7 s、噪声改到 40 dB,STI 一下子就能跳到 0.7 多。
🙋
真的,STI 0.73 变成 Good 了!所以加吸声材料压混响就是必杀技?
🎓
大方向是对,但吸声不是越多越好。T60 压到 0.3 s 以下房间会"死掉",音乐与歌声就立不起来。多用途厅常采用可动吸声体在不同节目间切换混响。另一个隐蔽陷阱是临界距离——直达声等于反射声的距离。默认条件下只有 1.65 m,8 m 远的听者基本只听反射声。提高指向性 Q(柱形扬声器)能拉长临界距离,让直达声在更远位置仍占优势。
🙋
原来机场广播用柱形扬声器就是这个道理!应急广播原来这么有讲究。
🎓
没错。中国《消防应急广播系统》以及国际的 IEC 60849 / EN 54-16,都把"每个座位 STI≥0.50"作为强制要求。机场航站楼、地下商业街等空间要靠分散布置、延时校准与指向性控制综合实现。STI 不只是一个数字,对生命安全系统来说,它直接关系到危急时刻疏散指令能否清楚传达。

常见问题

STI(Speech Transmission Index)是 IEC 60268-16 规定的完整指标,需要测量 7 个倍频带 × 14 个调制频率,共 98 个 MTF 值。RASTI 是仅取 2 个倍频带的简化版本,主要面向户外,现行标准已不推荐使用。%ALcons(辅音听损率)是 PA 行业长期使用的百分比指标,大致上 STI≈0.5 对应 %ALcons=10%。建筑声学领域以 STI 为国际标准,本工具采用的也是 STI。
推荐目标值如下:办公室与会议室 STI≥0.60(Good);教室、报告厅 STI≥0.65(儿童注意力储备约为成人一半,标准更严);剧院与音乐厅的台词部分 STI≥0.55;EVAC 紧急广播(IEC 60849)STI≥0.50 为法定要求。STI 低于 0.45 时单词识别率急剧下降,听者只能感觉有人在说话,无法理解具体内容。
增加吸声以压低 T60 是最有效的手段,此外还有:(1) 提高信号电平以提升信噪比(超过 80 dB 会刺耳);(2) 让扬声器靠近听者,增加直达声占比(分散式吊顶布置);(3) 使用指向性较强的柱形扬声器抑制反射;(4) 通过暖通改造降低背景噪声。在本工具中改变指向性 Q 或距离,可以看到临界距离与直达/混响声比例的变化。
人的语音中,音节节律约 4~8 Hz、重音模式约 1~2 Hz,是承载语义的主要包络成分。Steeneken 与 Houtgast 证明:用 0.63~12.5 Hz 共 14 个调制频率的 MTF 即可较好再现元音、辅音的可懂程度。混响时间 T60 越长,低频调制越被压平,其中 2~4 Hz 音节段的劣化对了解度损害最大。

实际工程应用

学校与教育设施:ANSI S12.60 与中国 GB/T 50121 等标准对教室提出 T60≤0.6 s、背景噪声≤35 dB(A) 的儿童使用要求,对应 STI 约 0.65 以上。达不到的教室会扩大低年级学生、听障儿童、第二语言学习者之间的成绩差距。设计阶段应用本工具一类的 STI 推算,确定吸声吊顶、地毯与书架布置。

EVAC 紧急广播系统:IEC 60849 / EN 54-16 与中国国家标准均要求紧急广播在所有座位达到 STI≥0.50。在机场航站楼、地下商街、大型购物中心、体育场等强反射空间,必须采用柱形扬声器的分散布置加上 DSP 延时校准,让每个听者位置的直达声与反射声同相叠加。

剧院、音乐厅与宗教场所:音乐需要适度混响(T60=1.6~2.2 s),台词与朗诵则需要 STI≥0.55,两者本身矛盾。现代多用途厅以可动吸声幕、可转动混响仓与主动电声增强解决——根据节目切换混响时间。教堂、清真寺等场所也以同样方式平衡"音乐性祷告"与"清晰说教"。

开放式办公与呼叫中心:近年 WELL 建筑标准要求会议室、电话亭 STI≥0.65。开放工位区反向使用 STI:通过粉噪声"声学掩蔽"将 STI 主动压低到 0.30 左右,使邻座对话不可懂以保护谈话隐私——同一个指标在两个方向上使用。

常见误区与注意事项

最大的误区是只用单一平均 T60 评判 STI。STI 本质上是 7 个倍频带(125 Hz~8 kHz)MTF 的加权和。如果只有低频段(125~250 Hz)T60 偏长,房间会"嗡嗡作响"、辅音被低频掩蔽。本工具为了清晰只取代表性单一 T60,但实际测量中各频带 T60 差异可能很大,低频吸声不足必须重点关注。详细评估需要 B&K 2270 等测量仪或 ODEON、OPENSTAGES 等声场仿真。

其次是"只要拉高 SNR 就能弥补长混响"的想法。SNR 与混响在 MTF 中作为独立相乘项出现,一方差另一方再好也撑不起来。例如 T60=2.5 s 时 m_rev 上限只有 0.35 左右,SNR 提到 30 dB,STI 也只能勉强达到 0.5。混响大的空间应当按吸声、SNR、指向性的顺序投入改造。

最后是"多装几台喇叭明瞭度就会提升"的误解。增加扬声器固然能补充直达声,但每台到达听者的路径不同,时间差形成的回声反而会拉低 STI。解决办法是根据扬声器间距与听者距离计算延时,用 DSP 做时间对齐。机场吊顶以等间距小型扬声器排布,正是为了让每位听者由最近一台主导,与下一台之间的时间差落在听觉融合窗口内。

使用指南

  1. 在"混响时间 T60"输入栏中设置房间实测参数,范围 0.4~3.0 秒(教室 0.6s,剧院 1.2s)
  2. 输入"信号电平"(50~100 dB)与"背景噪声"(30~70 dB),系统自动计算听者位置信噪比 SNR
  3. 设定"距离"(0.5~50 m)与房间体积,模拟器按 IEC 60268-16 标准计算临界距离、混响调制系数 m_rev,最终输出 STI 值与语音清晰度等级(优秀/良好/可接受/差)

具体计算示例

某学校教室:混响 T60=0.8s,信号源 85 dB,背景噪声 50 dB,讲台至听众距离 8 m,房间 200 m³。系统计算临界距离 d_c≈2.5 m,听者 SNR=35 dB,混响调制系数 m_rev=0.62。代入 IEC 标准模型得 STI=0.72,评定为"良好",语音可理解度 94%。若增加 T60 至 1.2s(未做吸音处理),STI 下降至 0.58("可接受"),理解度降至 82%。

实务注意事项

  1. 紧急广播系统需 STI ≥ 0.50(GB 50116),影院与音乐厅须 ≥ 0.70;教室 ≥ 0.60 确保教学效果
  2. 混响时间过长(>1.5s)导致单词重叠,优先安装吸音棉或纤维板降低 T60
  3. 背景噪声超过 60 dB 时,即使提升扬声器功率也难改善 STI;需先治理 HVAC、交通噪声源
  4. 距离加倍,由直达声占优转向混响占优,STI 通常下降 0.15~0.25;宜在 3×临界距离内布置主听域