声源定位技术原理和应用

什么是声源定位技术？

噪声和异响在日常生活和工业生产中很常见，例如，汽车行驶过程中的异常啸叫声。要解决这些噪声问题，首先需要识别噪声并定位噪声是从哪里发出来的，是由什么设备或部件造成的，这就是声源定位问题。声源定位技术是确定一个声音在空间来源位置的技术。声源定位技术可以用于噪声声源定位，也可以用于其他声音定位，例如会议室中说话人位置的确定。

在日常生活中，我们的耳朵会听到各种声音并进行识别定位，即所谓的“听声辨位”。有人发出声音的时候，人耳可以轻易知道喊的人在什么方位；人耳也可轻易判断出一辆从身边驶过的汽车的来车方向，甚至能大致知道汽车有多远；经过专业训练，人耳还可以挑战一些难度比较高的声源定位要求，例如盲人也可以踢足球。

然而，人耳的原始声音定位功能毕竟只是为了解决生活和生存的问题，定位精度非常有限。现代工业化社会的生产生活中，很多场景的声源定位问题，人耳已经无法满足要求。例如，道路上有车辆密集排队时，人耳无法区分是哪一辆汽车按喇叭；人耳也无法判断一台压缩机的啸叫声是轴承发出的，还是齿轮发出的；人耳更无办法区分100米高的风力发电机组哪一个叶片的风噪更大些。

人耳的声音定位功能

为了提高声源定位分辨力，需要借助技术手段。常用的声源定位解决方案有麦克风阵列和声强探头。可以近似认为，这两种声音定位解决方案和技术都是人耳声音定位机理的扩展，是仿生技术。麦克风阵列模仿人类的两个耳朵，麦克风阵列使用几个到几千个麦克风，相当于人长了很多个耳朵，因此达到远远高于人耳的定位精度。声强探头则可以简单认为是在模仿单个耳朵靠近声源听，用手包住耳廓使得耳朵少受远处声音的干扰，移动头部在被听物体附近移动以确定声源位置。

总之，噪声识别与声源定位技术是传感器、数据采集、信号处理等技术进步的综合应用，模拟人耳对声音的定位机理，实现比人耳更高的定位精度，更宽的频率范围，更大的声音强度大小范围。

声源定位技术的应用

声音，尤其是噪声和异响，通常意味着产品不合格、有故障、环境突发或出乎意料。要解决这些质量、故障、事故等问题，首先需要进行噪声检测，通过噪声源定位技术，确定产生这些问题的位置。声源定位在很多行业都有应用需求，例如汽车、家电、航空航天等。

汽车的异响/噪声源定位

以汽车行业为例，汽车研发过程是一个逐渐适配优化的过程，当第一台样车上路行驶测试时，极有可能发出各种异响，例如，仪表盘材料不合格或固定方式欠佳，仪表盘在颠簸路段就有可能产生共振噪声（Rattle, Squeeze）；内饰和密封不好，发动机噪声或轮胎噪声就会泄露到车内，造成车内NVH（Noise, Vibration and Harshness）指标不符合研发设计目标；底盘或动力系统，工作过程中也可能产生摩擦（Rub and Buzz）、敲击等异响。
汽车车内空间比较狭小，噪声源位置又是四面八方都有可能，靠人耳和经验已经无法精确定位噪声源位置，这时就需要专业的声学照相机仪器，对声音进行可视化，从而直观快速地确定噪声源位置。

例如，以下视频是其高声学照相机对汽车仪表盘异响定位的声音视频。

和汽车行业类似，需要使用声学照相机的行业还有很多，如家电、航空航天、消费电子、重型装备等。简单来讲，只要产品里有能动或发声的部件，如风扇、轴承、喇叭等，声源定位技术的应用就很重要。在这类产品的研发过程中，使用声学照相机能够大大提高工作效率，快速定位噪声源或异响位置，从而帮助工程师快速有针对性地解决问题。

声源定位技术应用的另外一个分支，是对语音或其他声音方位和位置的定位。例如，安防机器人、服务机器人、远程会议系统，在工作过程中，需要对声音进行响应。安防机器人听到某个方向的声音比较大时，需要将摄像头对准该方向进行录像；服务机器人需要确定说话人的方位，以便面对服务对象进行对话；远程会议系统需要确定参会发言者位置，以便控制摄像头对发言者进行特写，将其近景视频传输至远程端，达到更好的直播效果。

机器人声音定位

声源定位技术用于机器人行业

声源定位系统在军工领域也有很多应用。例如，根据子弹飞行声音，可以定位狙击手位置；根据炮弹爆炸声音，可以确定炮弹落点坐标；潜艇和军舰使用声呐，根据敌方舰艇或武器在水中发出的声音，定位目标位置和轨迹。

声源定位的算法原理

声源定位技术可以分为两大类，即声阵列（也叫传声器阵列或麦克风阵列）声源定位和声强探头声场测试。

麦克风阵列由几个到上千个麦克风，按照一定规则排列组成。多个麦克风同步采集声音信号，利用多个麦克风之间的信号相位差，求得噪声源信号的发出位置。声强探头由两个传声器面对面组成一个联合体，可以测量空间每一点的声压、声波振速大小和方向，在被测物体表面或包络面附近扫描测试，可以得到被测物体附近的声场分布情况，从而掌握噪声源位置和分布。

由多个麦克风组成的声阵列

声阵列和多声强探头声源定位系统

麦克风阵列一般用于距离相对较远的声源定位，噪声源大小相对于麦克风阵列距离来说较小。声强探头一般用在复杂目标和环境中的声源定位，例如，一个车间里的压缩机噪声量级和混响都很大，噪声源头也很复杂，适合使用声强探头进行声源定位。当然，麦克风阵列也可以用于距离较近的声源定位应用。

麦克风阵列的声源定位算法主要有以下几大类：

1) 时间到达差（TDOA, Time Difference of Arrival）

TDOA原理简单，使用麦克风数量少，计算量小，易于实现。TDOA主要核心是计算声源到达各个麦克风的时间差，这要求系统的采样率足够高；此外，该方法通常通过互相关或广义互相关算法计算时间差，可能不适合用于对周期性信号进行定位。

时间到达查TDOA的原理

TDOA原理

例如，上图红点是噪声源位置，黑点是麦克风测量位置，根据麦1和麦3之间的时间差，我们可以画出黑色的双曲线，麦1和麦3是双曲线的两个焦点（双曲线的性质之一：双曲线上的点到两个焦点的距离之差为常数）。同样地，我们根据麦3和麦2之间的时间差可以画出绿色曲线，两条曲线的交点即是噪声源的位置。

2) 波束形成（Beamforming）

Beamforming方法通过将阵列中各个传感器所采集到的信号进行滤波、加权叠加后形成波束，扫描整个接收空间，对一个平面的声压分布进行成像可视化。波束形成方法鲁棒性较强，不需要先验知识，使用简单直观，因此这类设备也被形象的称为声学照相机。Beamforming在有些文献中也被翻译成“波束成形”。

波束形成技术用于噪声检测

基于波束形成的声学相机用于各种噪声检测中

3) 声全息（Holography）

麦克风阵列声全息算法能够重构被测物周围的整个声场，从而可以获得任何面上的声压大小分布。假设被测物周围符合一定的声场数学模型，麦克风阵列采集到声场中多点的声压值，从而可以解出数学模型中的未知参数，得到整个声场信息。声全息算法与波束形成算法比较，优势是对于低频声源，也能保持很好的分辨力。

最早商业化的声全息算法是STSF（Spatial Transformation of Sound Fields），在被测物周围布置均匀麦克风分布的麦克风阵列，通过2D FFT等算法计算声场，从而可以获得平行于麦克风阵列测量面各个平面上的声压大小分布。STSF要求麦克风阵列包住被测物，实际操作一般要求麦克风阵列的面积是被测物面积的至少4倍以上，这在实际用于中很难满足要求，因此STSF的直接应用非常少。SONAH（Statistically Optimized Near Field Holography）是STSF算法的进一步改进，对麦克风阵列的大小和麦克风排布没有任何要求。SONAH更加适合实际应用，并且可以和Beamforming算法使用同一个麦克风阵列。

目前，声学照相机的主流算法使用波束形成Beamforming算法，其高声学照相机除了支持波束形成Beamforming算法，也同时支持SONAH算法，对于低频声源，也可以进行准确定位。另外，其高声学照相机也支持多种Beamforming算法的改进算法，如DAMAS（Deconvolution Approach for the Mapping of Acoustic Sources）。

声源定位设备与产品

声源定位设备与产品，市场上有声强探头、声波质点振速（Particle Velocity）扫描探头和声阵列。

声源定位主要包括声阵列,声强探头和声波指点振速

声源定位产品分类

声强探头历史悠久，其原理在20世纪30年代就已提出。国内外的传声器供应商均有成熟的声强探头产品。比较常见的产品是双传声器探头，由两个传声器面对面组成一个一体化传感器。也有由四个传声器组成的三维声强探头。用于同一个声学探头的传声器需要进行配对，即传声器之间的幅频响应和相频响应差异小于一定的误差范围。

声强探头的用途主要有两个：声源定位和声功率测量。用于声源定位时，一般在接近被测目标附近一个平面上划分网格点，在每个网格点上测量声强。其高SignalPad测控软件支持声强测量，可导入图片，将测量到的每个网格点的声强与图片进行叠加显示，方便比较大小，直观定位噪声源。包络面的声强积分即可得到声功率，因此可以通过测量被测目标一个包络面上的声强，之后经过计算即可得到声功率。使用声强法测量声功率不受环境噪声影响，因此可以在普通环境中进行测试，无需在消声室中进行。其高SignalPad测控软件同时也支持声功率测量，包括声强法、十点法声压法或二十点声压法。其高科技提供包括声功率支架、传声器、数据采集系统、软件等在内的全套声功率测量解决方案。

其高声强测量

其高SignalPad测控软件支持声强测量

声波质点振速传感器是一种特殊的传感器，由两根铂丝组成，声波经过铂丝时，由于温度差铂丝的电阻值有差异，电阻差与声波振速成正比，因此，该类传感器可以测量声波质点振速。声波质点振速扫描探头一般也会集成有传声器，可以同时测量声压和质点速度,每个测点输出一个矢量。通过声压和质点速度，可以计算出声强，因此声波质点振速扫描探头也可以得到声强分布。

声阵列产品近二十年来发展迅速，已成为声源定位的较为常用仪器设备。

声阵列由几个到上千个传声器按照一定的规则排布组成，全部传声器同步采集声音信号，使用算法计算感兴趣区域的声压等声学参数的空间分布值。

由于声阵列使用大量的传声器，传声器通俗来讲也常被称为麦克风，因此声阵列更为常见地被叫做麦克风阵列。

麦克风阵列产品的分类，可以按照不同的角度进行。

1）按照使用的传感器类型，可以分为MEMS麦克风阵列和工业电容式传声器阵列。

MEMS麦克风小巧、集成度高、相位一致性好，常被用在小型麦克风阵列上，几个到几百个MEMS麦克风集成在一块PCB电路板上即可实现麦克风阵列。智能音箱、笔记本电脑、手机上的微型麦克风阵列都是使用MEMS麦克风构建。工业用的便携式声学照相机大都也使用MEMS麦克风实现。

工业便携式声学相机用的MEMS麦克风

MEMS麦克风

工业电容式传声器一般用来构建中大型麦克风阵列，用于一些性能要求比较高的场合，尤其对测量绝对量值有要求的场合，例如声源定位同时计算声压级和声功率。另外，电容式传声器可以做到灵敏度很高，适合用于一些特殊的测试场景；与数据采集系统结合，各方面技术也相对更加成熟一些，适合构建物理尺寸比较大的麦克风阵列。当然，MEMS麦克风技术也在不断地更新换代中，电容式传声器的优势将越来越小，很多应用场景可用MEMS麦克风替代。

2）按照传声器之间的空间维度关系，麦克风阵列可以分为一维阵列、二维阵列和三维阵列。

一维阵列，即所有传声器在一条线上，可以用来确定声音入射麦克风阵列的方位角度。一维阵列也用来给汽车或者高铁做通过噪声扫描测试，利用目标移动的特征，通过算法一维阵列也可实现对汽车或高铁运行过程各部分的噪声分布测量。一维阵列的应用场景相对比较少，产品化程度不高，一般都需要进行定制化服务。

二维麦克风阵列，即所有传声器布置在同一个平面上，可以通过波束成形（Beamforming）算法，可实现对一个平面上的声压分布进行测量，与照片叠加形成直观的“声音云图”或“声成像图”。

声成像图

声音云图

二维阵列是目前应用较多的麦克风阵列，尤其是基于MEMS的便携式麦克风阵列，实时性强，同时配备摄像头，可以做到即开即用，就如打开照相机拍照一样，因此也被称为“声学照相机”或“声音照相机”，有时也被称为“声像仪”，都是一个意思，即这样的麦克风阵列可以把声音可视化。

麦克风阵列,声学成像仪

其高自主研发的便携式二维麦克风阵列

三维麦克风阵列比较常见的是球形声阵列，它的算法是波束形成Beamforming在球坐标上的变化，基本原理一样。球形麦克风阵列的好处是，对各个方向的声源均可同时进行定位。球形阵列一般也会配备多个摄像头，对多个方向同时拍摄照片，因此，在一些较小的封闭空间内使用球形麦克风阵列，可以一次性获得整个空间以阵列为中心各个的声音云图，例如在汽车车内异响定位、飞机舱内噪声源定位均可使用。麦克风阵列的空间分辨力与阵列的大小有直接的关系，而球形阵列一般都不可能做的很大，因此，球形阵列也有其弱点，即空间分辨力和动态范围指标一般都不高。在实际使用中，反而是采用平面阵的麦克风阵列更加实用一些，在封闭空间内定位声源，也可以通过多次测试或多个阵列同时工作，得到比球形阵列更好的声源定位应用效果。

麦克风阵列的关键指标有：空间分辨力（或空间分辨率）、动态范围、工作频率范围。空间分辨力是指麦克风阵列对同时存在的多个声源的定位区分能力，用两个可分辨的点声源的最小距离来表征。

声音云图

两个声源分开距离足够大，声音云图可分辨；两个声源距离较近，声源云图无法分辨

动态范围指麦克风阵列可以成像的两个声源之间的声压级差值，动态范围可用最大旁瓣水平MSL（Maximum Sidelobe Level）来表征。当有多个声源存在时，如果麦克风阵列的动态范围太小，则只能定位到声压级较大的声源。麦克风阵列的分辨力和动态范围均是频率的函数。一般来说，频率越低，分辨力越差。动态范围则与阵型有关系。工作频率范围是指麦克风阵列的分辨力均达到要求的声音频率区间。

3）按麦克风排列形状，平面声阵列可以分为均匀阵、圆形阵、螺旋阵和随机阵。

平面麦克风阵列中麦克风的排列形状对其性能指标有影响。对于物理尺寸大小、麦克风个数接近的麦克风阵列，从理论性能指标来讲，随机阵的性能指标应该是有愿意的。然而，由于麦克风个数有限，麦克风位置不可能是真正的随机，因此，它的性能指标也不一定是最优，需要通过仿真进行优化。麦克风阵列的实际设计中，更加常用的是螺旋阵，它的各方面指标都比较好，实现起来也有可行性，外观有科技感。螺旋阵的主要优点是各频率分辨力接近、鬼影少。均匀阵列的构建简单，使用简单工具（如铝型材）即可搭建，适合高校教学研究中使用。均匀阵列的典型问题是鬼影较多。圆形阵列则在对旋转部件进行声源定位时有利，如定位螺旋桨叶片旋转过程中的噪声分布。

均匀阵列成像

均匀阵列及其成像仿真和螺旋形阵列及其成像仿真

4）按照麦克风阵列的麦克风个数和尺寸大小，可以分为微型阵列、便携式小型阵列、中型阵列、大型阵列和分布式阵列。

微型阵列包含2-8个麦克风，一般应用在消费类电子，例如笔记本电脑、手机、平板电脑中内置了几个麦克风组成麦克风阵列，提高采集声音的方向性和信噪比，另外，智能音箱中也使用微型麦克风阵列，一般是4-6个麦克风组成。小型阵列一般使用几十个到上百个MEMS麦克风，主要用在便携式声学照相机，易用性、便携性、实时性、性能等各方面指标都得到比较好的均衡，是目前麦克风阵列技术在工业领域应用较多的产品。

麦克风阵列技术用于智能音箱

智能音箱（图片源于网络）和便携式小型阵列

中型阵列和大型阵列一般使用电容式传声器和同步数据采集系统构建。在消声室对声源进行测试，一般采样中型阵列，阵列尺寸一般也比便携式声学照相机要大，因此低频性能会比较好。大型阵列使用几百上千个传声器，主要的应用常见是被测目标大且距离远，例如飞机起飞飞跃噪声、风力发电机组工作噪声。

噪声源定位测试

消声室中采用中型阵列进行噪声源定位测试和大型阵列用于风力发电中的噪声监测

分布式阵列由多个小型麦克风阵列联合工作，可取得比单个阵列更优化的性能指标。例如，在森林里布置大量小型麦克风阵列，可以对动物声进行识别、定位和跟踪，与摄像机联动，当发现有目标动物声音时，可控制摄像机对其进行拍照录像。在重要建筑物和场所周边，布置分布式麦克风阵列，可根据声音检测是否有无人机入侵，并对无人机进行声学定位跟踪。

多个小型麦克风阵列组成的分布式阵列