首页-_学术活动_教师

学术报告545:ModelScope回声消除与远场唤醒

发布日期:  2023/02/23  周时强   浏览次数: 部门:    返回

报 告 人:纳跃跃,阿里巴巴达摩院机器智能技术语音实验室

报告时间:2月28日(周二)15:30

报告地点:腾讯会议(ID:801-926-576)

邀 请 人:马丽艳 副研究员                

报告摘要:

在远讲免提语音交互和语音通信应用中,例如智能音箱、电视、车载语音控制系统、会议终端等,设备自身播放的声音会被自身的拾音系统所采集到,从而形成声学回声。回声会对语音交互和语音通信任务造成影响,所以需要对其进行抑制,而相应的一系列抑制回声的技术则统称为回声消除。关键词检测,即语音唤醒,指的是一系列从实时音频流中检测出若干预定义关键词的技术。为了应对远讲免提语音交互过程中所出现的设备回声、人声干扰、环境噪声、房间混响等诸多不利声学因素的影响,关键词检测通常需要配合语音增强来使用。ModelScope是阿里巴巴旗下的一个开源模型共享与服务平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单。本报告介绍ModelScope平台的回声消除与远场唤醒任务,包括算法原理、模型架构、训练方法、示例程序等内容。

报告人简介:

纳跃跃,博士。分别于2005、2008、2014年获得北京交通大学计算机科学与技术学士、硕士、博士学位。2014至2016年在中国科学院声学研究所,语言声学与内容理解重点实验室完成博士后工作。于2017年加入阿里巴巴达摩院机器智能技术语音实验室,主要研究方向有语音信号处理、关键词检测、机器学习在信号处理中的应用等。






上一条:学术报告546:深度学习在医学成像中的挑战

下一条:学术报告544:高性能结构/功能材料超常冶金与制备-进展与思考