哈工大社会计算与信息检索研究中心
友爱  力行  乐学  日新

HIT-SCIR

哈工大SCIR三篇论文被ACL 2019录用

哈工大SCIR三篇论文被ACL 2019录用

2019年05月17日

ACL 2019, The 57th Annual Meeting of the Association for Computational Linguistics 将于2019年7月28日至8月2日意大利佛罗伦萨举行。ACL年会是计算语言学和自然语言处理领域最重要的顶级国际会议,CCF A类会议,由计算语言学协会主办,每年举办一次。其接收的论文覆盖了对话交互系统、语义分析、摘要生成、信息抽取、问答系统、文本挖掘、机器翻译、语篇语用学、情感分析和意见挖掘、社会计算等自然语言处理领域众多研究方向。

哈尔滨工业大学社会计算与信息检索研究中心有两篇长文和一篇短文被ACL 2019录用。下面是论文列表及介绍:

题目:Retrieval-Enhanced Adversarial Training for Neural Response Generation

作者:朱庆福,崔磊,张伟男,韦福如,刘挺

简介:对话系统大体上可以分为检索式和生成式两类。检索式系统从回复集合中选择和消息最匹配的回复,其中的回复集合由人工预先构建。因此,检索式的回复内容丰富但却不能定制。与之相对的生成式系统可以根据用户输入产生新的回复,但现有的基于Sequence-to-Sequence的模型倾向于生成一般性回复,丰富程度较差。为结合上述两类方法的优点,一些研究开始尝试使用检索式的候选回复来增强生成式的效果。但现有方法使用的极大似然损失与真实的回复质量一致性较差,不能准确地判断候选回复的使用情况。同时,候选回复所包含的丰富内容仅被视为生成的额外输入,没有被充分地使用。我们提出了一种基于对抗式训练的检索增强回复生成模型,通过引入一个判别器来引导候选回复在生成过程中使用。同时,我们还使用候选回复提升了判别器的准备率,从而在对抗训练下进一步提升生成的效果。在微博数据集上的自动评价、人工评价实验结果表明,我们的方法显著优于检索式、生成式和前人检索增强的回复生成。

题目:Learning to Ask Unanswerable Questions for Machine Reading Comprehension

作者:朱海潮,董力,韦福如,王文辉,秦兵,刘挺

简介:针对包含不可回答问题的机器阅读理解,本文提出一种数据增强方法,根据可回答的阅读理解样例中的原文、问题和答案来生成相关的不可回答问题。在问题生成模型方面,引入pair-to-seq模型来更好地建模问题和原文之间的交互。本文同时提出了一种利用现有阅读理解数据集来构造问题生成模型训练数据的方法。实验结果表明pair-to-seq模型生成的问题要优于seq-to-seq模型。同时,将生成的问题作为数据增强方法能够提升阅读理解模型的表现。

题目:Learning to Rank for Plausible Plausibility

作者:李忠阳,陈桐飞,Benjamin Van Durme

简介:现在许多NLP任务都可以被认为是分类问题,例如给出一个上文(NLI的premise),判断一个下文所属的分类标签(NLI的hypothesis)。这种分类任务在训练模型时通常会采用对数交叉熵形式(Log-loss)的损失函数。本文认为在建模这种可能性任务时,交叉熵损失在直觉上是不合适的。因为在很多任务中,给出一个上文,下文并不是绝对的正确(分类为1),也不是绝对的错误(分类为0),而是属于一个0到1之间的可能性打分。对数交叉熵损失函数自然而然地将正确类别打分为趋近于1,而将错误类别打分为趋近于0。本文中提出使用基于大间隔的损失函数(Margin-based Loss),则可以避免这种极端的可能性打分情况,使得模型能给出更加合理的可能性打分。最终,我们在COPA任务上采用BERT模型和Margin-based损失函数得到了更好的性能。

另外,祝贺我中心车万翔教授华中科技大学合作、我中心博士生尹庆宇加州大学圣芭芭拉分校合作的长文被ACL 2019录用。

题目:Generating Natural Language Adversarial Examples through Probability Weighted Word Saliency

作者:任抒怀,邓依荷,何琨,车万翔

题目:Towards Explainable NLP: A Generative Explanation Framework for Text Classification

作者:刘辉,尹庆宇,王洋(William Wang)


Copyright © Research Center for Social Computing and Information Retrieval 2001 - 2015
P.O.Box 321, HIT, P.R.China 150001
webmaster at ir dot hit dot edu dot cn