学术报告557：大模型时代的对话系统：从PLM到LLM - 暨研究生论文发表经验谈-上海大学计算机工程与科学学院

首页-_学术活动_教师


学术报告557：大模型时代的对话系统：从PLM到LLM - 暨研究生论文发表经验谈


发布日期： 2024/03/15 刘跃军浏览次数：部门: 返回

报告人：朱志宏，腾讯优图实验室算法研究员

报告时间：3月18日（周一）10:00～11:20

报告地点：计算机学院901会议室

邀请人：刘炜副研究员

报告摘要：

探讨大模型时代对话系统的最新进展，特别是在任务型对话系统和大型语言模型（LLMs）的复杂推理方面的创新。首先，介绍一种针对多意图口语理解（SLU）的改进方法——双异构图标签交互。该方法通过创建一个全局静态异构标签图交互层来模拟标签之间的统计依赖性，再辅以本地动态异构标签图层促进每个话语中的意图和槽之间的自适应交互。这种方法克服了现有技术的局限，实现了最先进的性能。接着，探讨在复杂推理任务中大型语言模型（LLMs）的应用，以及如何通过一个自监督框架——AutoPRM来克服依赖大量手动标注数据的问题。AutoPRM通过将复杂问题分解为更简单的子问题，并使用强化学习来迭代优化子问题解决方案，实现了对LLMs的有效微调。这不仅显著提升了在数学和常识推理任务上的性能，而且还可以与其他推理管道轻松集成。最后，分享本人在科研和论文发表过程中的一些心得和经验。这些内容旨在为同样走在科研路上的同学们提供一些建议和灵感。

报告人简介:

朱志宏，腾讯优图实验室算法研究员, 2022年本科毕业于上海大学计算机学院，目前就读于北京大学深圳研究院，卡耐基梅隆大学、剑桥大学、南洋理工大学、中国科学院研究访问。主要研究方向为大型语言模型、任务型对话系统、多模态信息处理。截至目前，在ACL、AAAI、ICCV、ICLR、NAACL、EMNLP、COLING、WSDM、CIKM等计算机与人工智能TOP会议发表论文30余篇（第一作者发表16篇），专利在审（实授）7项。受邀担任国际顶级会议、期刊审稿人，包括ACL、ICCV、MM、ECAI、NeurIPS、EMNLP、NAACL、ECCV、KDD等。硕士期间，获得北京大学三好学生，北京大学奖学金等荣誉奖励，目前已经获得腾讯、阿里和华为等大厂高端人才计划offer。