基于听觉滤波器波束形成的声源定位

基于听觉滤波器波束形成的声源定位


2024年4月22日发(作者:三星i929刷机)

2010年4月 

三明学院学报 

Apr.2010 

第27卷第2期 

J0URNAL OF SANMING UNIVERs1 rY 

Vo1.27 N0.2 

基于听觉滤波器波束形成的声源定位 

廖逢钗 

(三明学院数学与计算机科学系,福建三明365004) 

摘要:提出基于听觉滤波器波束形成的声源定位方法。利用听觉滤波器把每个通道接收的宽带音频信号分解为若干个 

窄带频率通道信号,分别估计每个频率通道的“空间谱”。根据各个频率通道的信噪比对所有频率通道的“空间谱”进行二值 

加权累积求“总空间谱”,由“总空问谱”可得声源的波达方向。实验结果表明提出的算法是有效的。与经典的算法相比具有 

更高的精度 

关键词:听觉滤波器;波束形成;二值加权;频率通道;传声器阵列 

中图分类号:TN641.O2 文献标识码:A 文章编号:1673-4343(2010)02—0152-04 

Sound Source Localization Based on Audio Filter BeamfoIrmer 

LIA0 Feng—chai 

(Department ofMathematics and Computer Sc&nce,Sanming Un&e ̄ity,Sanming 365004,China) 

Abstract:The method of sound source localization based on Audio Filter beamformer is proposed.Broadband sound signal 

received by every channel is decomposed into some narrowband frequency channels singal with audio filter,and space spectrum of 

every frequency channel is estimated respectively.All space spectrum of rfequency channel is performed binary weight basing 

SNR of every frequency channel,and“total space spectrum”is got by cumulating method.The experiment result shows htat the 

proposed arithmetic is effective and more accurate than classical arithmetic. 

Key words:audio iflter;beamformer;binary weight;frequency channel;microphone army 

0引言 

beamformer,DASBF)方法的基础上。提出基于听觉 

滤波器的波束形成(audio filter based beamformer, 

传声器阵列声源定位是用多个传声器拾取音 

简称AFBBF)声源定位算法,相比于DASBF算法, 

频信号.通过对多路音频信号进行分析与处理,在 

AFBBF算法具有更高的分辨率和精度。 

空间域中定出声源的坐标或估计声源的波达方向 

fDirection of Arrival,简称D0A1 

1 AFBBF算法描述 

声源定位有广阔的应用.在视频会议中控制 

1.1基本思路 

摄像头和传声器阵列波束方向对准正在说话的 

AFBBF算法的基本构架如图1所示,其基本 

人、麦克风阵列语音增强、助听装置、鲁棒语音识 

思想是:首先.把传声器阵列接收的信号用听觉 

别、智能机器人的听觉系统、电子监控、军事试验 

滤波器进行窄带分解。得到若干个频率通道信 

中的弹着点自动测量等[1-5} 

号:其次,用经典的波束形成方法分别估计各频 

声源定位大致可分为波速形成法、高分辨率 

率通道的“空间谱”:第三.根据各个频率通道的 

谱估计法、基于时延估计的方法等。这三种方法各 

信噪比对各个频率通道的“空问谱”进行二值加 

有优缺点.波速形成声源定位方法主要优点是结 

权,舍弃部分频率通道的“空间谱”;最后,把保留 

构简单、容易实现、运算量小,但抗噪性低,需要较 下来的所有频率通道的“空间谱”累积得到“总空 

多的传声器才有比较好的效果 本文在经典波束 

间谱”.搜索“总空问谱”的最大值位置即可获得 

形成f也称为“延时相加波束形成”.delay-and—SHm 

声源的方位 

收稿日期:2010—03—18 

基金项目:福建省自然科学基金(2009J01296) 

作者简介:廖逢钗(1968一),男,福建尤溪人,副教授。 

第2期 廖逢钗:基于听觉滤波器波束形成的声源定位 —.153—- 

音频和背景噪声.t表示时间.上标k表示传声器 

双 

阵列通道编号 

接下来使用听觉滤波器组分别对每个通道的 

(c{ 

}lJ{1 

仪 

祟 

__f_}{ 

信号进行滤波。所使用的听觉滤波器组由64个4 

阶的GaInlTlatone滤波器构成….各个滤波器的中 

心频率在80—5 000 Hz之间准对数分布 其中,第i 

求 

、, 

Ij】 

瞄 

1-2经典的波束形成方法 

延时~相加波束形成是最简单的DOA估计技 

术.也被称为经典的波束形成方法【 。它的输出信 

号y( )是各阵元输出的线性加权和,即 

Y(k)=WHil( ) (1) 

输出功率可以表示为 

EfIy(k)l }= {1wHu(k)l l 

=wHE(iu(k)UH( )j w=w W (2) 

其中,R :E{IU(k)U ( ))是阵列输入数据的自相 

关矩阵.W是权值向量 

假设一个信号入射角为0o.则波束形成器的 

输出功率可以表示为 

P(0o)=E{lW,'/D( )I } 

E{IWtl(a( )s(后)+n(k))I l 

1 wHa(0o)I ( 20r ) (3) 

(3)式中a(0o)是方向 对应的方向向量,s(k) 

是目标音频信号,n(k)是噪声向量,O's2=E{s (k)} 

是目标信号功率,o- ̄2=E{nz( )】是噪声功率。 

从f31式可以看出.当权值向量W正比于信号 

方向向量a(0o)时,一般取W=a(0o),输出功率最 

大。这是因为传声器各阵元信号分量经权值相移. 

产生同相相加 

上述表明:改变扫描方向 .对不同的 形成 

不同的权值w:a(0o),然后通过测量阵列的输出功 

率可以估计出D0A。DASBF的输出功率和波达方 

向的关系为: 

P( )=w R w=a (0o)R ( ) (4) 

对于最大功率点的0值即是信号的波达方向 

1.3基于听觉滤波器的频带分解 

在传声器阵列中.假设第七个通道接收到的 

信号模型可以用下式表示: 

(£)=s (z)+ (£) f5) 

这里,S (t)和n (t)分别代表第 通道接收的目标 

个滤波器的冲击响应为: 

p0( 咖 汀 。 

这里b 是冲击响应的衰减率,与滤波器的带宽有 

关;

是滤波器的中心频率, 是相位(通常把 

. 

置为0)。传声器阵列信号经Gammatone滤波器滤 

波后的输出为: 

gik(t)=sik(t)+mik(t) (7) 

其中.上标k表示传声器通道号.下标i表示频率 

通道。 

1.4 AFBBF算法 

所有物理通道信号用听觉滤波器滤波.第i个 

频率通道的信号通过经典波束形成后.其输出功 

率与波达方向的关系为 

(0)=wOR  ̄uW=ft (O)Ri=a(O) (8) 

其中,R 是传声器阵列第i个频率通道的自相关 

矩阵.a是目标信号波达方向向量 

利用二值加权舍弃信噪比相对较低的L个频 

率通道的空间谱 

P ( )= ( ) ) (9) 

这里, )是二值权重 

f1 fSNR ̄>e1 

) {o SNRi~< ̄e) ( 0) 

8是门限值。如果舍弃 个频率通道的空间谱.则 

SN ( ∈【0, 1],J∈ )按升序排列后,第L个信 

噪比的值就是 ,N是频率通道数。用近似估计法 

计算信噪tg(SNR):频率通道功率大的信噪比高…】。 

把保留下来的频率通道空间谱归一化后求累 

积(归一化的目的是为了避免累积运算时结果溢出) 

p:Hpi(O)/D 

,E s'l 

其中,兀表示累积,D是所有频率通道空间谱的最 

大值 

D=inax(Pj(O))U∈Q, ∈[0,7r】) (12) 

是信噪比大于 的频率通道的集合 

Sq={m10≤m≤A,-l,m∈ ,SNRz> ̄J (13) 

最后,户归一化后搜索总空间谱的最大值位置 

就是声源的波达方向 

—.

154—. 三明学院学报 第27卷 

P=P/max(P) 

(14) 

形实例(“进士”),信噪比10 dB。表1是DASBF和 

AFBBF两种算法的定位结果.从表中的数据可以 

2实验评估 

2.1实验条件和评估数据 

看出AFBBF算法的声源定位精度比DASBF算法 

高些。 

实验时.传声器阵列和声源放置如图2所示. 

图4是DASBF算法和AFBBF算法估计结果 

的空问谱曲线,图4 fa)是DASBF算法的估空问 

谱曲线,图4(b)是图4(a1的谱峰局部放大。图4 

(c)是AFBBF算法的空间谱曲线。从图4可以看 

房间的长、宽、高分别是3 499、3 100和2 650mm 

传声器阵列采用线性阵列.阵元间距7 m.声源是 

个播放录制好音频信号的扬声器.传声器阵列 

和声源的高度1 200 mm.声源的波达方向和传声 

出,AFBBF算法谱峰尖锐.声源位置的估计值接近 

器所在直线的夹角 为47o,声源与传声器阵列中 

心的距离是3 430 mm 

图2传声器阵列和声源放置示意图 

音频数据采集设备是符合USB2.0总线规范 

的14位8通道无相差并行采集模块.最高采样频 

率可达80 kHz/通道(周期12.5 s,通道间的时间 

误差小于±O.5 s)。内置512 kB的DFIFO缓冲,支 

持不问断全速实时采集 

采集模块的每个通道采用单端输入.输入电 

压范围:一5 V~+5 V.通道输入阻抗1 MQ。传声器 

的信号比较微弱.每个通道用一个独立的电压放 

大器放大信号。 

在程序中.同步数据采集器的采样频率设置 

为16 kHz,采样分辨率是14 Bit。声源播放的内容 

有男女声语音、白噪声等 以上实验装置采集的数 

据构成实验评估的数据集 

2-2实验结果评估和比较 

图3是同步数据采集模块第一通道的语音波 

图3第一通道采集的语音波形实例(“进士”) 

声源的实际位置,定位比较精确。而AFBBF算法 

其峰值明显扩展,较难辨别出最大值的位置.在搜 

索最大值时容易产生误差.因此导致定位误差明 

显大于AFBBF算法。主要原因是大部分音频信号 

是宽带信号,直接把DASBF用于声源定位时效果 

波达方向 

(a)DASBF算法估计的空间谱 

48 49 so 52 53 ¨ 

波达方向 ) 

(b)DASBF算法局部放大后的空问谱 

波达方向 

(C)AFBBF算法估计的空间谱 

图4 DASBF算法和AFBBF算法估计结果 

第2期 廖逢钗:基于听觉滤波器波束形成的声源定位 一155一 

差:AFBBF算法利用听觉滤波器把宽带音频信号 

分解为许多窄带频率通道信号。然后再利用传统的 

波束形成和二值加权累积进行声源定位。所以效果 

较好。 

表1 DASBF和AFBBF两种算法的定位结果(实际DOA=47。) 

3结论 

提出基于听觉滤波器波束形成器的声源定位 

方法.并通过建立有效的实验系统进行了验证.得 

到了以下结论: 

fl1基于听觉滤波器波束形成的声源定位方法 

能够有效地重构空问谱: 

f21 AFBBF算法比DASBF算法具有更高的精 

度和分辨率: 

f3、AFBBF使用“0—1”二值加权累积方法求 

“总空间谱”可以使波达方向处的谱峰更尖锐。 

参考文献: 

【1】BRANDSTEIN M,WARD D.Microphone arrays:signal 

processing techniques and applications[M】.New York: 

Springer Verlag,2001. 

【2】邵林,杨殿阁,李兵,等.基于双目视觉和声阵列的声学 

摄像机的3t- ̄13].仪器仪表学报,2o09(4):823~827. 

[31刘红宁,李志尊.基于移动机器人的声源定位系统U】.四 

川兵工学报,2009(4):77—79. 

【4]金乃高,殷福亮,,陈糖.基于分层采样粒子滤波的麦克风 

阵列说话人跟踪方法D].电子学报,2008(1):194-198. 

[551 MASAYA NAK^MIJR A,TAKANOBU NISHIURA, 

AKlN0BU LEE,et a1.Talker】ocalization on autonomous 

mobile robot using a microphone array[1].雹子情赧通信 

学会技衍研究赧告,2001,1【)1(31):25—32. 

【6]CARTER G.Variance bounds for passively locating an 

acoustic source with a symmetric line array[1]Journal of 

Acoustical Society"ofAmerica,1977,62(4):922—926. 

[7】HAHN W,TRETTER s.Optimum processing for delay 

vector esitmation in passive signal arrays叽IEEE 

Transactions on Information Theory,1973,19(1):608—614. 

【8】WAX M T,KAILA TH.Optimum localizaiton of mulitple 

sources by passive arrays I3].1EEE Transactions on 

Acoustics,Speeeh and Signal Processing,1983,31(5):1 210— 

1 217. 

[9】ALFREDO CICADA,FRANCESCO RIPAMONTI, 

MARCELLO VANALI.The delay and sum algorithm 

apphed to microphone array measurements卟Mechanical 

Systems and Singal Processing,2007(21):2 645—2 664. 

1 0】ROMAN W,WANG D L.Speech segregation based on 

sound localization[J].The Journal of the Acousticla Society 

of America,2003,11 4(4):2 236-2 252. 

【1 1】POTAMITIS I,KoKl(JNAKIs G.Speech separation of 

multiple movmg speakers using multisensor multitarget 

techniquesⅡ】.IEEE Transacitons on Systems,Man,and 

Cybernetics,2007,37(1):72—81. 

(责任编辑:朱联九) 


发布者:admin,转转请注明出处:http://www.yc00.com/num/1713746456a2310324.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信