基于听觉滤波器波束形成的声源定位|江阴雨辰互联

2024年4月22日发(作者：三星i929刷机)

２０１０年４月　

三明学院学报　

Ａｐｒ．２０１０　

第２７卷第２期　

Ｊ０ＵＲＮＡＬ　ＯＦ　ＳＡＮＭＩＮＧ　ＵＮＩＶＥＲｓ１　ｒＹ　

Ｖｏ１．２７　Ｎ０．２　

基于听觉滤波器波束形成的声源定位　

廖逢钗　

（三明学院数学与计算机科学系，福建三明３６５００４）　

摘要：提出基于听觉滤波器波束形成的声源定位方法。利用听觉滤波器把每个通道接收的宽带音频信号分解为若干个　

窄带频率通道信号，分别估计每个频率通道的“空间谱”。根据各个频率通道的信噪比对所有频率通道的“空间谱”进行二值　

加权累积求“总空间谱”，由“总空问谱”可得声源的波达方向。实验结果表明提出的算法是有效的。与经典的算法相比具有　

更高的精度　

关键词：听觉滤波器；波束形成；二值加权；频率通道；传声器阵列　

中图分类号：ＴＮ６４１．Ｏ２　文献标识码：Ａ　文章编号：１６７３－４３４３（２０１０）０２—０１５２－０４　

Ｓｏｕｎｄ　Ｓｏｕｒｃｅ　Ｌｏｃａｌｉｚａｔｉｏｎ　Ｂａｓｅｄ　ｏｎ　Ａｕｄｉｏ　Ｆｉｌｔｅｒ　ＢｅａｍｆｏＩｒｍｅｒ　

ＬＩＡ０　Ｆｅｎｇ—ｃｈａｉ　

（Ｄｅｐａｒｔｍｅｎｔ　ｏｆＭａｔｈｅｍａｔｉｃｓ　ａｎｄ　Ｃｏｍｐｕｔｅｒ　Ｓｃ＆ｎｃｅ，Ｓａｎｍｉｎｇ　Ｕｎ＆ｅ￣ｉｔｙ，Ｓａｎｍｉｎｇ　３６５００４，Ｃｈｉｎａ）　

Ａｂｓｔｒａｃｔ：Ｔｈｅ　ｍｅｔｈｏｄ　ｏｆ　ｓｏｕｎｄ　ｓｏｕｒｃｅ　ｌｏｃａｌｉｚａｔｉｏｎ　ｂａｓｅｄ　ｏｎ　Ａｕｄｉｏ　Ｆｉｌｔｅｒ　ｂｅａｍｆｏｒｍｅｒ　ｉｓ　ｐｒｏｐｏｓｅｄ．Ｂｒｏａｄｂａｎｄ　ｓｏｕｎｄ　ｓｉｇｎａｌ　

ｒｅｃｅｉｖｅｄ　ｂｙ　ｅｖｅｒｙ　ｃｈａｎｎｅｌ　ｉｓ　ｄｅｃｏｍｐｏｓｅｄ　ｉｎｔｏ　ｓｏｍｅ　ｎａｒｒｏｗｂａｎｄ　ｆｒｅｑｕｅｎｃｙ　ｃｈａｎｎｅｌｓ　ｓｉｎｇａｌ　ｗｉｔｈ　ａｕｄｉｏ　ｆｉｌｔｅｒ，ａｎｄ　ｓｐａｃｅ　ｓｐｅｃｔｒｕｍ　ｏｆ　

ｅｖｅｒｙ　ｆｒｅｑｕｅｎｃｙ　ｃｈａｎｎｅｌ　ｉｓ　ｅｓｔｉｍａｔｅｄ　ｒｅｓｐｅｃｔｉｖｅｌｙ．Ａｌｌ　ｓｐａｃｅ　ｓｐｅｃｔｒｕｍ　ｏｆ　ｒｆｅｑｕｅｎｃｙ　ｃｈａｎｎｅｌ　ｉｓ　ｐｅｒｆｏｒｍｅｄ　ｂｉｎａｒｙ　ｗｅｉｇｈｔ　ｂａｓｉｎｇ　

ＳＮＲ　ｏｆ　ｅｖｅｒｙ　ｆｒｅｑｕｅｎｃｙ　ｃｈａｎｎｅｌ，ａｎｄ“ｔｏｔａｌ　ｓｐａｃｅ　ｓｐｅｃｔｒｕｍ”ｉｓ　ｇｏｔ　ｂｙ　ｃｕｍｕｌａｔｉｎｇ　ｍｅｔｈｏｄ．Ｔｈｅ　ｅｘｐｅｒｉｍｅｎｔ　ｒｅｓｕｌｔ　ｓｈｏｗｓ　ｈｔａｔ　ｔｈｅ　

ｐｒｏｐｏｓｅｄ　ａｒｉｔｈｍｅｔｉｃ　ｉｓ　ｅｆｆｅｃｔｉｖｅ　ａｎｄ　ｍｏｒｅ　ａｃｃｕｒａｔｅ　ｔｈａｎ　ｃｌａｓｓｉｃａｌ　ａｒｉｔｈｍｅｔｉｃ．　

Ｋｅｙ　ｗｏｒｄｓ：ａｕｄｉｏ　ｉｆｌｔｅｒ；ｂｅａｍｆｏｒｍｅｒ；ｂｉｎａｒｙ　ｗｅｉｇｈｔ；ｆｒｅｑｕｅｎｃｙ　ｃｈａｎｎｅｌ；ｍｉｃｒｏｐｈｏｎｅ　ａｒｍｙ　

０引言　

ｂｅａｍｆｏｒｍｅｒ，ＤＡＳＢＦ）方法的基础上。提出基于听觉　

滤波器的波束形成（ａｕｄｉｏ　ｆｉｌｔｅｒ　ｂａｓｅｄ　ｂｅａｍｆｏｒｍｅｒ，　

传声器阵列声源定位是用多个传声器拾取音　

简称ＡＦＢＢＦ）声源定位算法，相比于ＤＡＳＢＦ算法，　

频信号．通过对多路音频信号进行分析与处理，在　

ＡＦＢＢＦ算法具有更高的分辨率和精度。　

空间域中定出声源的坐标或估计声源的波达方向　

ｆＤｉｒｅｃｔｉｏｎ　ｏｆ　Ａｒｒｉｖａｌ，简称Ｄ０Ａ１　

１　ＡＦＢＢＦ算法描述　

声源定位有广阔的应用．在视频会议中控制　

１．１基本思路　

摄像头和传声器阵列波束方向对准正在说话的　

ＡＦＢＢＦ算法的基本构架如图１所示，其基本　

人、麦克风阵列语音增强、助听装置、鲁棒语音识　

思想是：首先．把传声器阵列接收的信号用听觉　

别、智能机器人的听觉系统、电子监控、军事试验　

滤波器进行窄带分解。得到若干个频率通道信　

中的弹着点自动测量等［１－５｝　

号：其次，用经典的波束形成方法分别估计各频　

声源定位大致可分为波速形成法、高分辨率　

率通道的“空间谱”：第三．根据各个频率通道的　

谱估计法、基于时延估计的方法等。这三种方法各　

信噪比对各个频率通道的“空问谱”进行二值加　

有优缺点．波速形成声源定位方法主要优点是结　

权，舍弃部分频率通道的“空间谱”；最后，把保留　

构简单、容易实现、运算量小，但抗噪性低，需要较　下来的所有频率通道的“空间谱”累积得到“总空　

多的传声器才有比较好的效果　本文在经典波束　

间谱”．搜索“总空问谱”的最大值位置即可获得　

形成ｆ也称为“延时相加波束形成”．ｄｅｌａｙ－ａｎｄ—ＳＨｍ　

声源的方位　

收稿日期：２０１０—０３—１８　

基金项目：福建省自然科学基金（２００９Ｊ０１２９６）　

作者简介：廖逢钗（１９６８一），男，福建尤溪人，副教授。　

第２期　廖逢钗：基于听觉滤波器波束形成的声源定位　—．１５３—－　

音频和背景噪声．ｔ表示时间．上标ｋ表示传声器　

双　

阵列通道编号　

接下来使用听觉滤波器组分别对每个通道的　

（ｃ｛　

｝ｌＪ｛１　

仪　

祟　

＿＿ｆ＿｝｛　

信号进行滤波。所使用的听觉滤波器组由６４个４　

阶的ＧａＩｎｌＴｌａｔｏｎｅ滤波器构成…．各个滤波器的中　

心频率在８０—５　０００　Ｈｚ之间准对数分布　其中，第ｉ　

求　

、，　

Ｉｊ】　

瞄　

１－２经典的波束形成方法　

延时～相加波束形成是最简单的ＤＯＡ估计技　

术．也被称为经典的波束形成方法【　。它的输出信　

号ｙ（　）是各阵元输出的线性加权和，即　

Ｙ（ｋ）＝ＷＨｉｌ（　）　（１）　

输出功率可以表示为　

ＥｆＩｙ（ｋ）ｌ　｝＝　｛１ｗＨｕ（ｋ）ｌ　ｌ　

＝ｗＨＥ（ｉｕ（ｋ）ＵＨ（　）ｊ　ｗ＝ｗ　Ｗ　（２）　

其中，Ｒ　：Ｅ｛ＩＵ（ｋ）Ｕ　（　））是阵列输入数据的自相　

关矩阵．Ｗ是权值向量　

假设一个信号入射角为０ｏ．则波束形成器的　

输出功率可以表示为　

Ｐ（０ｏ）＝Ｅ｛ｌＷ，＇／Ｄ（　）Ｉ　｝　

＝

Ｅ｛ＩＷｔｌ（ａ（　）ｓ（后）＋ｎ（ｋ））Ｉ　ｌ　

＝

１　ｗＨａ（０ｏ）Ｉ　（　２０ｒ　）　（３）　

（３）式中ａ（０ｏ）是方向　对应的方向向量，ｓ（ｋ）　

是目标音频信号，ｎ（ｋ）是噪声向量，Ｏ＇ｓ２＝Ｅ｛ｓ　（ｋ）｝　

是目标信号功率，ｏ－￣２＝Ｅ｛ｎｚ（　）】是噪声功率。　

从ｆ３１式可以看出．当权值向量Ｗ正比于信号　

方向向量ａ（０ｏ）时，一般取Ｗ＝ａ（０ｏ），输出功率最　

大。这是因为传声器各阵元信号分量经权值相移．　

产生同相相加　

上述表明：改变扫描方向　．对不同的　形成　

不同的权值ｗ：ａ（０ｏ），然后通过测量阵列的输出功　

率可以估计出Ｄ０Ａ。ＤＡＳＢＦ的输出功率和波达方　

向的关系为：　

Ｐ（　）＝ｗ　Ｒ　ｗ＝ａ　（０ｏ）Ｒ　（　）　（４）　

对于最大功率点的０值即是信号的波达方向　

１．３基于听觉滤波器的频带分解　

在传声器阵列中．假设第七个通道接收到的　

信号模型可以用下式表示：　

（￡）＝ｓ　（ｚ）＋　（￡）　ｆ５）　

这里，Ｓ　（ｔ）和ｎ　（ｔ）分别代表第　通道接收的目标　

个滤波器的冲击响应为：　

ｐ０（　咖　汀　。　

这里ｂ　是冲击响应的衰减率，与滤波器的带宽有　

关；

是滤波器的中心频率，　是相位（通常把　

．　

置为０）。传声器阵列信号经Ｇａｍｍａｔｏｎｅ滤波器滤　

波后的输出为：　

ｇｉｋ（ｔ）＝ｓｉｋ（ｔ）＋ｍｉｋ（ｔ）　（７）　

其中．上标ｋ表示传声器通道号．下标ｉ表示频率　

通道。　

１．４　ＡＦＢＢＦ算法　

所有物理通道信号用听觉滤波器滤波．第ｉ个　

频率通道的信号通过经典波束形成后．其输出功　

率与波达方向的关系为　

（０）＝ｗＯＲ　￣ｕＷ＝ｆｔ　（Ｏ）Ｒｉ＝ａ（Ｏ）　（８）　

其中，Ｒ　是传声器阵列第ｉ个频率通道的自相关　

矩阵．ａ是目标信号波达方向向量　

利用二值加权舍弃信噪比相对较低的Ｌ个频　

率通道的空间谱　

Ｐ　（　）＝　（　）　）　（９）　

这里，　）是二值权重　

ｆ１　ｆＳＮＲ￣＞ｅ１　

）　｛ｏ　ＳＮＲｉ～＜￣ｅ）　（　０）　

８是门限值。如果舍弃　个频率通道的空间谱．则　

ＳＮ　（　∈【０，　１］，Ｊ∈　）按升序排列后，第Ｌ个信　

噪比的值就是　，Ｎ是频率通道数。用近似估计法　

计算信噪ｔｇ（ＳＮＲ）：频率通道功率大的信噪比高…】。　

把保留下来的频率通道空间谱归一化后求累　

积（归一化的目的是为了避免累积运算时结果溢出）　

ｐ：Ｈｐｉ（Ｏ）／Ｄ　

，Ｅ　ｓ＇ｌ　

其中，兀表示累积，Ｄ是所有频率通道空间谱的最　

大值　

Ｄ＝ｉｎａｘ（Ｐｊ（Ｏ））Ｕ∈Ｑ，　∈［０，７ｒ】）　（１２）　

是信噪比大于　的频率通道的集合　

Ｓｑ＝｛ｍ１０≤ｍ≤Ａ，－ｌ，ｍ∈　，ＳＮＲｚ＞￣Ｊ　（１３）　

最后，户归一化后搜索总空间谱的最大值位置　

就是声源的波达方向　

—．

１５４—．　三明学院学报　第２７卷　

Ｐ＝Ｐ／ｍａｘ（Ｐ）　

（１４）　

形实例（“进士”），信噪比１０　ｄＢ。表１是ＤＡＳＢＦ和　

ＡＦＢＢＦ两种算法的定位结果．从表中的数据可以　

２实验评估　

２．１实验条件和评估数据　

看出ＡＦＢＢＦ算法的声源定位精度比ＤＡＳＢＦ算法　

高些。　

实验时．传声器阵列和声源放置如图２所示．　

图４是ＤＡＳＢＦ算法和ＡＦＢＢＦ算法估计结果　

的空问谱曲线，图４　ｆａ）是ＤＡＳＢＦ算法的估空问　

谱曲线，图４（ｂ）是图４（ａ１的谱峰局部放大。图４　

（ｃ）是ＡＦＢＢＦ算法的空间谱曲线。从图４可以看　

房间的长、宽、高分别是３　４９９、３　１００和２　６５０ｍｍ　

传声器阵列采用线性阵列．阵元间距７　ｍ．声源是　

一

个播放录制好音频信号的扬声器．传声器阵列　

和声源的高度１　２００　ｍｍ．声源的波达方向和传声　

出，ＡＦＢＢＦ算法谱峰尖锐．声源位置的估计值接近　

器所在直线的夹角　为４７ｏ，声源与传声器阵列中　

心的距离是３　４３０　ｍｍ　

图２传声器阵列和声源放置示意图　

音频数据采集设备是符合ＵＳＢ２．０总线规范　

的１４位８通道无相差并行采集模块．最高采样频　

率可达８０　ｋＨｚ／通道（周期１２．５　ｓ，通道间的时间　

误差小于±Ｏ．５　ｓ）。内置５１２　ｋＢ的ＤＦＩＦＯ缓冲，支　

持不问断全速实时采集　

采集模块的每个通道采用单端输入．输入电　

压范围：一５　Ｖ～＋５　Ｖ．通道输入阻抗１　ＭＱ。传声器　

的信号比较微弱．每个通道用一个独立的电压放　

大器放大信号。　

在程序中．同步数据采集器的采样频率设置　

为１６　ｋＨｚ，采样分辨率是１４　Ｂｉｔ。声源播放的内容　

有男女声语音、白噪声等　以上实验装置采集的数　

据构成实验评估的数据集　

２－２实验结果评估和比较　

图３是同步数据采集模块第一通道的语音波　

图３第一通道采集的语音波形实例（“进士”）　

声源的实际位置，定位比较精确。而ＡＦＢＢＦ算法　

其峰值明显扩展，较难辨别出最大值的位置．在搜　

索最大值时容易产生误差．因此导致定位误差明　

显大于ＡＦＢＢＦ算法。主要原因是大部分音频信号　

是宽带信号，直接把ＤＡＳＢＦ用于声源定位时效果　

波达方向　

（ａ）ＤＡＳＢＦ算法估计的空间谱　

４８　４９　ｓｏ　５２　５３　¨　

波达方向　）　

（ｂ）ＤＡＳＢＦ算法局部放大后的空问谱　

波达方向　

（Ｃ）ＡＦＢＢＦ算法估计的空间谱　

图４　ＤＡＳＢＦ算法和ＡＦＢＢＦ算法估计结果　

第２期　廖逢钗：基于听觉滤波器波束形成的声源定位　一１５５一　

差：ＡＦＢＢＦ算法利用听觉滤波器把宽带音频信号　

分解为许多窄带频率通道信号。然后再利用传统的　

波束形成和二值加权累积进行声源定位。所以效果　

较好。　

表１　ＤＡＳＢＦ和ＡＦＢＢＦ两种算法的定位结果（实际ＤＯＡ＝４７。）　

３结论　

提出基于听觉滤波器波束形成器的声源定位　

方法．并通过建立有效的实验系统进行了验证．得　

到了以下结论：　

ｆｌ１基于听觉滤波器波束形成的声源定位方法　

能够有效地重构空问谱：　

ｆ２１　ＡＦＢＢＦ算法比ＤＡＳＢＦ算法具有更高的精　

度和分辨率：　

ｆ３、ＡＦＢＢＦ使用“０—１”二值加权累积方法求　

“总空间谱”可以使波达方向处的谱峰更尖锐。　

参考文献：　

【１】ＢＲＡＮＤＳＴＥＩＮ　Ｍ，ＷＡＲＤ　Ｄ．Ｍｉｃｒｏｐｈｏｎｅ　ａｒｒａｙｓ：ｓｉｇｎａｌ　

ｐｒｏｃｅｓｓｉｎｇ　ｔｅｃｈｎｉｑｕｅｓ　ａｎｄ　ａｐｐｌｉｃａｔｉｏｎｓ［Ｍ】．Ｎｅｗ　Ｙｏｒｋ：　

Ｓｐｒｉｎｇｅｒ　Ｖｅｒｌａｇ，２００１．　

【２】邵林，杨殿阁，李兵，等．基于双目视觉和声阵列的声学　

摄像机的３ｔ－￣１３］．仪器仪表学报，２ｏ０９（４）：８２３～８２７．　

［３１刘红宁，李志尊．基于移动机器人的声源定位系统Ｕ】．四　

川兵工学报，２００９（４）：７７—７９．　

【４］金乃高，殷福亮，，陈糖．基于分层采样粒子滤波的麦克风　

阵列说话人跟踪方法Ｄ］．电子学报，２００８（１）：１９４－１９８．　

［５５１　ＭＡＳＡＹＡ　ＮＡＫ＾ＭＩＪＲ　Ａ，ＴＡＫＡＮＯＢＵ　ＮＩＳＨＩＵＲＡ，　

ＡＫｌＮ０ＢＵ　ＬＥＥ，ｅｔ　ａ１．Ｔａｌｋｅｒ】ｏｃａｌｉｚａｔｉｏｎ　ｏｎ　ａｕｔｏｎｏｍｏｕｓ　

ｍｏｂｉｌｅ　ｒｏｂｏｔ　ｕｓｉｎｇ　ａ　ｍｉｃｒｏｐｈｏｎｅ　ａｒｒａｙ［１］．雹子情赧通信　

学会技衍研究赧告，２００１，１【）１（３１）：２５—３２．　

【６］ＣＡＲＴＥＲ　Ｇ．Ｖａｒｉａｎｃｅ　ｂｏｕｎｄｓ　ｆｏｒ　ｐａｓｓｉｖｅｌｙ　ｌｏｃａｔｉｎｇ　ａｎ　

ａｃｏｕｓｔｉｃ　ｓｏｕｒｃｅ　ｗｉｔｈ　ａ　ｓｙｍｍｅｔｒｉｃ　ｌｉｎｅ　ａｒｒａｙ［１］Ｊｏｕｒｎａｌ　ｏｆ　

Ａｃｏｕｓｔｉｃａｌ　Ｓｏｃｉｅｔｙ＂ｏｆＡｍｅｒｉｃａ，１９７７，６２（４）：９２２—９２６．　

［７】ＨＡＨＮ　Ｗ，ＴＲＥＴＴＥＲ　ｓ．Ｏｐｔｉｍｕｍ　ｐｒｏｃｅｓｓｉｎｇ　ｆｏｒ　ｄｅｌａｙ　

ｖｅｃｔｏｒ　ｅｓｉｔｍａｔｉｏｎ　ｉｎ　ｐａｓｓｉｖｅ　ｓｉｇｎａｌ　ａｒｒａｙｓ叽ＩＥＥＥ　

Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｈｅｏｒｙ，１９７３，１９（１）：６０８—６１４．　

【８】ＷＡＸ　Ｍ　Ｔ，ＫＡＩＬＡ　ＴＨ．Ｏｐｔｉｍｕｍ　ｌｏｃａｌｉｚａｉｔｏｎ　ｏｆ　ｍｕｌｉｔｐｌｅ　

ｓｏｕｒｃｅｓ　ｂｙ　ｐａｓｓｉｖｅ　ａｒｒａｙｓ　Ｉ３］．１ＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　

Ａｃｏｕｓｔｉｃｓ，Ｓｐｅｅｅｈ　ａｎｄ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ，１９８３，３１（５）：１　２１０—　

１　２１７．　

［９】ＡＬＦＲＥＤＯ　ＣＩＣＡＤＡ，ＦＲＡＮＣＥＳＣＯ　ＲＩＰＡＭＯＮＴＩ，　

ＭＡＲＣＥＬＬＯ　ＶＡＮＡＬＩ．Ｔｈｅ　ｄｅｌａｙ　ａｎｄ　ｓｕｍ　ａｌｇｏｒｉｔｈｍ　

ａｐｐｈｅｄ　ｔｏ　ｍｉｃｒｏｐｈｏｎｅ　ａｒｒａｙ　ｍｅａｓｕｒｅｍｅｎｔｓ卟Ｍｅｃｈａｎｉｃａｌ　

Ｓｙｓｔｅｍｓ　ａｎｄ　Ｓｉｎｇａｌ　Ｐｒｏｃｅｓｓｉｎｇ，２００７（２１）：２　６４５—２　６６４．　

１　０】ＲＯＭＡＮ　Ｗ，ＷＡＮＧ　Ｄ　Ｌ．Ｓｐｅｅｃｈ　ｓｅｇｒｅｇａｔｉｏｎ　ｂａｓｅｄ　ｏｎ　

ｓｏｕｎｄ　ｌｏｃａｌｉｚａｔｉｏｎ［Ｊ］．Ｔｈｅ　Ｊｏｕｒｎａｌ　ｏｆ　ｔｈｅ　Ａｃｏｕｓｔｉｃｌａ　Ｓｏｃｉｅｔｙ　

ｏｆ　Ａｍｅｒｉｃａ，２００３，１１　４（４）：２　２３６－２　２５２．　

【１　１】ＰＯＴＡＭＩＴＩＳ　Ｉ，ＫｏＫｌ（ＪＮＡＫＩｓ　Ｇ．Ｓｐｅｅｃｈ　ｓｅｐａｒａｔｉｏｎ　ｏｆ　

ｍｕｌｔｉｐｌｅ　ｍｏｖｍｇ　ｓｐｅａｋｅｒｓ　ｕｓｉｎｇ　ｍｕｌｔｉｓｅｎｓｏｒ　ｍｕｌｔｉｔａｒｇｅｔ　

ｔｅｃｈｎｉｑｕｅｓⅡ】．ＩＥＥＥ　Ｔｒａｎｓａｃｉｔｏｎｓ　ｏｎ　Ｓｙｓｔｅｍｓ，Ｍａｎ，ａｎｄ　

Ｃｙｂｅｒｎｅｔｉｃｓ，２００７，３７（１）：７２—８１．　

（责任编辑：朱联九）　

发布者：admin，转转请注明出处：http://www.yc00.com/num/1713746456a2310324.html

基于听觉滤波器波束形成的声源定位

发表回复

评论列表（0条）

联系我们

400-800-8888

基于听觉滤波器波束形成的声源定位

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888