英谢菲尔德大学马宁博士访问中科院声学所并作学术报告
应中科院语言声学与内容理解重点实验室的邀请,英国谢菲尔德大学的马宁博士于2015年9月30日来访,并作了题为“Exploiting Top-Down Source Models to Improve Binaural Localisation of Multiple Sources in Reverberant Environments”的报告。报告会在DSP三楼大会议室举行,部分研究人员和学生参加了学术交流。
马宁博士在报告中介绍了其所在研究组近期在对混响环境下的双耳多声源定位的研究中所取得的进展。该报告指出,目前的双耳声源定位方法大多采用的是自底向上的结构,即通过从双耳信号中提取的时间差和强度差作为线索来估算声源的位置。然而,许多关于人耳听觉的生理研究表明,人的听觉定位感知不但利用了上述两种底层特征,而且还结合了自顶向下的注意机制,即人会主动选择自己感兴趣的声源加以注意。
针对人耳的这种特点,该报告中介绍了一种融合了自底向上和自顶向下的知识的双耳声源定位算法框架。该框架的基本思想是通过事先给定的目标声源、干扰声源、以及背景噪声来对模型加以训练,之后根据训练结果对底层定位特征进行加权,从而实现选择注意的目的。实验表明,在存在混响以及多声源影响的环境中,由于加入了自顶向下的指导信息,声源定位的精度有了显著提升。
报告引起了听众的广泛兴趣,在场人员就报告内容进行了积极的讨论与充分的交流。
我想说两句