倾听音频空间:基于学习的声源定位与分离

2016.03.21

投稿:吴进部门:通信与信息工程学院浏览次数:

活动信息

时间: 2016年03月28日 10:00

地点: 校本部东区翔英大楼T516

行健讲坛学术讲座

205

时间: 2016328日(周一)上午1000

地点: 校本部东区翔英大楼T516

讲座: 倾听音频空间:基于学习的声源定位与分离

演讲者: 法国国家信息与自动化研究所 Antoine 终身研究员

演讲者简介: Antoine Deleforge,于2014获法国格勒诺布尔大学计算机科学与应用数学方向博士学位。同年,他的博士论文“acoustic-space-learning methods for audio source separation and localization”被评为Gretsi/ISIS/EEA图像、信号、视觉方向最佳论文。2014-2015Antoine Deleforge以博士后的身份担任爱尔兰根大学音频信号处理委员会主席。现为法国国家信息与自动化研究所的终身研究员,主要研究方向为机器学习、人工智能、声源定位。

讲座摘要:

声源定位长期被视为几何学问题。理想情况下,给定两个麦克风的位置,然后计算波达时间差(TDOA),就可以估计声源方位,但容易造成前后混淆。当面向实际应用时,几何建模复杂度急剧上升,甚至难以实现。本次讲座主要内容如下:

1. 介绍一种新的非几何方法,用于学习目标系统的音频空间,即声源所处环境中所有可能的听觉空间线索的集合。随后将会介绍此空间的流形结构以及用于开发此结构的通用统计学习框架,以提高真实环境下的声源定位和分离性能。

2.介绍基于上述方法的最新音视频研究成果

欢迎广大教师和学生参加!