学术报告545：ModelScope回声消除与远场唤醒-上海大学计算机工程与科学学院

首页-_学术活动_教师


学术报告545：ModelScope回声消除与远场唤醒


发布日期： 2023/02/23 周时强浏览次数：部门: 返回

报告人：纳跃跃，阿里巴巴达摩院机器智能技术语音实验室

报告时间：2月28日（周二）15:30

报告地点：腾讯会议（ID：801-926-576）

邀请人：马丽艳副研究员

报告摘要：

在远讲免提语音交互和语音通信应用中，例如智能音箱、电视、车载语音控制系统、会议终端等，设备自身播放的声音会被自身的拾音系统所采集到，从而形成声学回声。回声会对语音交互和语音通信任务造成影响，所以需要对其进行抑制，而相应的一系列抑制回声的技术则统称为回声消除。关键词检测，即语音唤醒，指的是一系列从实时音频流中检测出若干预定义关键词的技术。为了应对远讲免提语音交互过程中所出现的设备回声、人声干扰、环境噪声、房间混响等诸多不利声学因素的影响，关键词检测通常需要配合语音增强来使用。ModelScope是阿里巴巴旗下的一个开源模型共享与服务平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单。本报告介绍ModelScope平台的回声消除与远场唤醒任务，包括算法原理、模型架构、训练方法、示例程序等内容。

报告人简介:

纳跃跃，博士。分别于2005、2008、2014年获得北京交通大学计算机科学与技术学士、硕士、博士学位。2014至2016年在中国科学院声学研究所，语言声学与内容理解重点实验室完成博士后工作。于2017年加入阿里巴巴达摩院机器智能技术语音实验室，主要研究方向有语音信号处理、关键词检测、机器学习在信号处理中的应用等。

上一条：学术报告546：深度学习在医学成像中的挑战

下一条：学术报告544：高性能结构/功能材料超常冶金与制备-进展与思考