原标题:实录分享 计算未来轻沙龙:让机器拥有理解语言的能力(视频 + PPT)
10 月 13 日(周六)上午,PaperWeekly 携手清华大学计算机系推出了计算未来轻沙龙第二期线下活动——让机器拥有理解语言的能力。来自中国科学院自动化研究所、国防科技大学计算机学院和清华大学计算机系的三位博士,系统而深入地分享了他们各自在机器阅读理解领域的最新研究进展。
王炳宁,中国科学院自动化研究所博士毕业生,主要研究方向为自然语言处理,机器阅读理解。在 IJCAI,ACL 等人工智能、自然语言处理顶级会议上以第一作者身份发表论文四篇。现负责搜狗立知项目阅读理解部分。
机器阅读理解是现今问答技术发展的核心之一。在本次报告中,我将从认知的角度介绍机器阅读理解的发展以及和人类阅读理解的关联和区别。
胡明昊,博士在读,本科毕业于国防科技大学计算机学院,研究领域为自然语言处理和机器阅读理解。博士期间在 IJCAI、EMNLP 等国际顶尖学术会议上发表文章。
近年来,抽取式机器阅读理解任务取得了显著的进展,最顶尖模型的性能甚至超过了人类。然而,当前方法却存在着效率低下、易受对抗样本攻击和无法拒绝给出答案等问题。在本报告中,我们将介绍如何利用知识蒸馏技术来提升阅读理解系统的效率和鲁棒性,并且讨论一个阅读+验证的框架来检测问题是否可回答。我们期望上述探索能够进一步增强阅读理解系统的实用性。
林衍凯,清华大学计算机系博士生五年级,来自清华大学自然语言处理组,由孙茂松教授和刘知远副教授共同指导,主要研究方向为知识图谱表示、构建和应用。目前已在人工智能、自然语言处理等领域的著名国际会议 IJCAI,AAAI,EMNLP,ACL 发表相关论文多篇,Google Scholar 引用数超过 700。
开放域问答着眼于从大规模的无标注文本中提取出给定问题的答案。现有开放域问答系统一般采用机器阅读理解技术对问题检索到的文本段落进行分析来提取出答案。但是,这些方法无法有效综合考虑不同文本段落的信息,还会受到文本段落中噪音的影响。此次报告,我们将介绍我们根据人类浏览、精读和总结的阅读模式提出的开放域问答模型,并介绍我们如何进一步利用有监督的数据帮助模型进行噪音过滤。
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得或技术干货。我们的目的只有一个,让知识真正流动起来。
• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)



