声音为什么会有立体感？声音的立体感是基于人类对音源定位的能力。定位音源对大脑是一个挑战定位一个物体的位置对于视觉系统来说轻而易举，物体通过眼睛的光学系统聚焦在视网膜上特定的位置，之 ...音乐制作飞鱼音乐在线

Espone 发表于 2026-2-15 17:16:14

声音为什么会有立体感？

声音的立体感是基于人类对音源定位的能力。定位音源对大脑是一个挑战
定位一个物体的位置对于视觉系统来说轻而易举，物体通过眼睛的光学系统聚焦在视网膜上特定的位置，之后视网膜将带有空间位置结构的图像传递给大脑，而大脑皮层和视网膜、外界空间位置有着一一对应位置的关系（topography），这就是视觉定位的原理，简单直接。
而定位一个音源对大脑来说是一件很挑战的事情，因为听觉系统没有视觉系统的光学成像系统以及拓扑结构，并且声音又会跟头部、耳廓和身体发生复杂的衍射。那么大脑采取什么策略定位音源位置呢？
视觉定位和听觉定位

定义空间坐标
我们需要先来定义一下空间。
以头部为中心，固定半径(不考虑距离)的球面上任意一个位置都可以由水平面内的方位角和垂直面内的仰角（高度）来表示。水平面大致可以理解为两耳和鼻尖这三点构成的平面，垂直面是把人从中间分成左右两半的平面。所以，空间位置可以分解为水平面和垂直面的角度位置。
水平面Azimuth和垂直面elevation

音源定位是靠人类的双耳听觉系统（水平面内定位）和耳廓(pinna)（垂直面内定位）
1. 水平方向定位
声音的水平方位判定主要靠人类是双耳系统。大脑可以根据到达左耳和右耳声音的强度不同或相位不同来判断声音的水平位置。
通过强度差定位对于左边的声音，因为头部的遮挡，左耳强度要大于右耳的强度，反之亦然。但这种定位方式只局限于高频声音（约大于1000Hz），因为低频的声音波长几倍于脑袋大小，声音绕过脑袋到达远端耳朵，声音强度不会发生很明显的衰减。
通过相位差定位对于低频的声音，我们知道，双耳无法再通过声音强度差来精确定位。低频声波长，几倍于脑袋大小，声音几乎不受影响，两只耳朵接收声音会有相位差。这时听觉系统就主要通过声波在左右耳相位不同（时间差）来定位。想象一下这样一个例子，左耳朵在声波的波谷，右耳朵在声波的波峰。
低高频声音经过脑袋时的模拟

2. 垂直方向定位
垂直面内的声源因为位于两耳中间，两耳接收到的声音强度和时间都相等，所以无法通过双耳的信息的不对称来定位。这种情况下大脑主要通过耳廓完成定位。耳廓的反射会改变原始声音的频谱。并且，和原始声音相比，传入耳道的时间会延迟上几毫秒。因此最终传入耳道的声音是原始声音和有几毫秒延迟的耳廓反射声音的叠加。因为不同高度的声音经过耳廓反射这条路时路径长度不一样，时间延迟不一样，这就导致最终传入耳道的叠加结果的频谱特征也不一样。简单点说，不同高度的声音会因为耳廓的反射产生不同的频谱特征，大脑靠此来判断声源的高度。
耳麦记录到的不同高度声音的频谱

音源定位总结
总结一下，水平面内的声音方位低频通过双耳时间（或相位）差，高频通过双耳的声强差来确定。垂直面内高度通过耳廓的作用来定位。
立体声
立体声录制时通常是有两个（或多个）麦克风，从声源的不同角度录制声音。根据上面的原理，可以知道多声道播放时人们能感知到乐器或人声的水平方位，但是无法感知声音的高度。
为了更好的哄骗人的声音定位系统，生成更逼真的立体声，人们开发了头部相关传递函数(Head-related transfer function)。一个特定位置的声音在到达双耳耳膜之前会有强度差，时间差，会跟头部，耳廓，身体发生作用，频谱发生变化。头部相关传递函数就是描述不同位置声音是怎么受这一过程影响的。当然每个人身体的形状密度都不同，需要大量样本来建立一个普适的模型。有了这个函数，就可以合成一个来自特定空间位置传来的声音，制造出任意想要的立体声。

页: [1]

飞鱼音乐在线's Archiver

声音为什么会有立体感？