完全正确,这就是「用回归看分布形状」的感觉。试试把噪声分布改为「异方差」。τ 越大,斜率应该越陡。这表示 X 越大,数据的波动越大,OLS 只画一条线,看不出这个结构。但如果用 QR 在 τ=0.1~0.9 间改动,就能看清整个分布的形状。在教育研究中,要问「学习成效在不同学力层学生中是否有差异」,这种分析已经成了标准做法。
🙋
我调大「异常值比例」的滑块,OLS 的斜率从 1.5 越来越远,但 QR 几乎没动…
🎓
这就是 QR 的稳健性。OLS 用平方误差,远点的影响力平方倍增长。一个异常值就能大幅扭曲斜率。但中位数回归(τ=0.5)用绝对误差和,一个异常值的影响只算「一个点份量」。数据有 30% 变得离谱,中位数照样纹丝不动,这个道理是一样的。金融的 VaR、保险的尾部推定,都需要这种抗性,所以 QR 是标配。
🙋
那 QR 是不是比 OLS 更好呢?这样不就全用 QR 了?
🎓
没这么简单,这就有意思了。把噪声改回「正态分布」,看看「效率比 OLS/QR」,应该是 0.8 左右,也就是 QR 的 SE 更大。正态噪声下,OLS 的渐近效率 100%,而中位数回归只有约 64%(= 2/π)。意思是「QR 要花 1.57 倍的样本量才能达到 OLS 同样的精度」。实际用法是这样分的:干净的正态数据→OLS,重尾或异常值→QR,想看整个分布→用多个 τ 的 QR。
🙋
改为「柯西(重尾)」时效率比反过来了,这也是因为这个原因吗?下面的损失函数图是 V 形,这是 Pin-ball loss 吗?
(1) 需要直接看分布尾部时。如所得差距的 90/10 比率或住房价格高价位建模。(2) 重尾分布或包含异常值的数据。金融风险(VaR、Expected Shortfall)中 τ=0.95~0.99 的 QR 是标准方法。(3) 存在异方差时。OLS 只看平均值,容易忽略方差结构,但 QR 可对每个 τ 估计不同斜率,揭示整个分布形状。(4) 气候极值分析、生存时间分析也常用。
当噪声为正态分布时,中位数回归(τ=0.5)相对 OLS 的渐近效率约为 64%(=2/π)。本工具中的「效率比 OLS/QR = SE_OLS/SE_QR」也显示约 0.8,说明在正态误差下 OLS 更优。但当误差为重尾(柯西分布等)时,OLS 的 SE 发散,而 QR 保持有限。混入异常值时,OLS 斜率大幅偏离,而 QR 几乎不受影响。这种稳健性是 QR 的最大优势。
实际应用
所得分布·不平等分析(经济学):经合组织和世界银行按国家比较所得分布的「90/10 比率(上 10% 所得÷下 10% 所得)」。用教育程度、年龄、性别作为共变量跑 QR,就可以分别看每个属性对「平均所得」和「贫困层、富裕层所得」的效果,而不只看平均值。Buchinsky(1994)的经典研究用 QR 证明了美国教育的回报在高分位更大。
金融风险管理(VaR·Expected Shortfall):银行交易部门每天计算投资组合损失的 τ=0.99 或 τ=0.995 分位点作为「风险价值」。Engle & Manganelli 的 CAViaR(条件自回归 VaR)将 QR 扩展到时间序列,在 Basel 市场风险资本计算中成了标准做法。OLS 看不清尾部行为,风险管理中 QR 系方法必不可少。