首页 > 解决方案 > 声源定位 > 异响检测与声音定位 > 语音定位跟踪解决方案

语音定位跟踪解决方案

应用背景


语音定位跟踪系统可用于判断非固定声源的具体位置,例如在智能远程会议系统中,摄像头会随着声波向任何方向摆动,并铺抓来自声源角度的画面,从而实时定位会议中的讲话人员;或者在安防监控系统中,摄像头可以根据声音声波振动,灵敏的记录监控环境中的一切变化;又或是作为引导移动机器人的指向声源,协助其完成相关指定智能动作等。
其高科技在声源定位领域积累里了非常丰富的经验,可根据用户的实际需求,开发定制专业用途的语音定位跟踪系统。

 

系统组成


语音定位跟踪声源系统由小型麦克风阵列、数据采集设备、以及基于 FPGA 的数据分析模块组成:

 

 
 

方案概述


语音定位跟踪系统基于可控波束成形技术,相比于基于时延的声源定位方法(TDOA),波束成形技术的抗干扰能力更强,可以在背景噪声较为复杂的环境中声源进行准确定位。并且能根据具客户的需求,对一些场景进行区分。比如识别到有人拍手,不仅可以获取拍手的位置,还能够准确识别拍手的次数,做出指定的操作。
本系统可使用硬件内部接口的信息传输方式,或通过 wifi 网络与主控程序进行通信。便捷、简单的数据传输方式,使其可以完美的与现有的智能家居或机器人产品进行整合,增加这些产品的智能度
语音定位跟踪声源系统中,麦克风将按照进行语音定位时的空间位置进行排布。由于这些麦克风的空间位置不同(如图 1),故麦克风拾取到的声源的信号直接存在时间的延迟(如图 2),(注:忽略了幅值的差异)。被动语音定位跟踪系统使用的波束成形算法将各路信号进行时延后相加,获取合成信号的总能量。当信号的时延被部分抵消,获取的合成信号能量较小(如图 3),当所有信号的时延均被抵消后,获取的合成信号的总能量最大(如图 4)。获取遍历空间各个位置所对应的合成信号的总能量,当信号总能量最大时,其所对应的空间位置,即为声源的真实位置。