模块化端到端语音识别

2018.11.07

投稿:杨秀丽部门:通信与信息工程学院浏览次数:

活动信息

时间: 2018年11月09日 11:00

地点: 校本部东区翔英大楼T516室

行健讲坛学术讲座

346

时间:   2018年11月9日(周五)上午11:00

地点:  校本部东区翔英大楼T516室

讲座:  模块化端到端语音识别

演讲者: 俞凯 教授 上海交通大学计算机系

演讲者简介:俞凯,上海交通大学计算机系教授,思必驰公司首席科学家。清华大学本科、硕士,剑桥大学博士。长期从事交互式人工智能、语音及语言处理的研究和产业化工作。NSFC优青,IEEE Speech and Language Processing Technical Committee委员。中国人工智能产业发展联盟学术和知识产权组组长,CCF语音对话及听觉专业组副主任。发表论文 130 余篇,获得多个国际评测冠军。他创立的思必驰公司入选2016高盛全球人工智能报告“AI Key Players”及2017年Gartner“Cool Vendors for AI”。

讲座摘要:传统语音识别基于HMM的声学框架和n-gram语言模型框架进行,取得了很大进展,但也遇到了性能瓶颈。近年来,以Connectionist Temporal Classification (CTC) 和序列学习为代表的深度学习模型受到广泛重视,一类完全不同的语音识别框架:端到端语音识别模型被提出。这类模型以完整神经网络来对声学序列到词序列的映射建模,具有极高的效率和优化便捷性,但也存在不够灵活,信息资源利用不充分的问题。本报告将介绍一种新型的端到端框架:模块化端到端语音识别。既保留声学模型和语言模型的区别,继承传统框架的优势,又能有效利用神经网络实现端到端的映射,保留端到端模型的解码优势。该模型使用了基于CTC声学模型的音素同步解码技术,本报告将先介绍相关技术,再展开介绍模块化端到端模型。

邀请人:上海大学通信与信息工程学院   朱梦尧  副教授

欢迎广大教师和学生参加!