报 告 人:姜雪,北京科技大学
报告时间:11月3日(周二)13:00-15:00
报告地点:宝山校区计算机学院402
邀 请 人:韩越兴 副教授
报告摘要:
人工智能技术已经成功地加速了许多新材料的发现,这些成功的前提是需要大量的结构化数据。然而,如今从已发表论文中获取数据仍然依靠人工阅读的方式,这不仅需要领域知识,而且相当费时、费力且容易出错。在本文中,我们提出了一种新的自然语言处理流程,该流程实现了自动从文章中挖掘高温合金的结构化数据,其中包括一种基于规则的命名实体识别方法和一种有效的启发式多重关系抽取算法。关系抽取算法有效地克服了小语料在文本挖掘中造成的障碍。通过自动归档文献、识别合金和性能实体以及关系抽取以生成结构化的高温合金数据库,我们证实了整个流程具有高效率的特点。
报告人简介:
姜雪,先后获得北京师范大学计算机科学与技术学士学位、计算机应用技术硕士学位,和北京科技大学材料科学与工程博士学位,现为北京科技大学钢铁共性技术协同创新中心全职研究人员。主要从事材料数据库与大数据技术交叉学科研究工作,具体包括材料数据库技术,机器学习辅助材料设计与优化,以及文本挖掘在材料智能设计上的应用等材料科学前沿共性技术研究。主持和参与北京材料基因工程高精尖创新中心科研业务费资助项目、国家重点研发计划课题、国家863计划课题、北京市科技支撑计划课题、广东省重点研发计划课题,以及多项企业合作课题。在《Scripta Materialia》《Calphad》《Computational Materials Science》等期刊发表文章10余篇。