哈尔滨工业大学社会计算与信息检索研究中心 – 理解语言，认知社会 » 我中心主任刘挺教授应邀在2016年中国计算机大会（CNCC2016）上作学术报告

我中心主任刘挺教授应邀在2016年中国计算机大会（CNCC2016）上作学术报告

2016年10月25日

10月21日下午，2016中国计算机大会（CNCC2016）的重要活动之一“面向互联网大数据的语言与知识计算”专题论坛在陕西省太原市湖滨国际大酒店晋瑞厅火热举行。

哈尔滨工业大学社会计算与信息检索研究中心主任刘挺教授应邀在“面向互联网大数据的语言与知识计算”专题论坛上做学术报告，题为“基于伪数据的自然语言处理方法”。

报告题目：基于伪数据的自然语言处理方法

摘要：深度学习需要大规模的标注数据，但人工标注数据的成本很高，数据规模难于扩大。寻找或构造大规模的“伪数据”（Pseudo Data），以模拟真实的人工标注数据，是克服训练数据不足的有效手段。所谓伪数据就是不经人工标注而获得的训练数据，目前在词义消歧、句法分析、信息抽取、情感分析、阅读理解等研究课题中均已取得良好效果，但由于伪数据与真实数据的差异，也不可避免地带来了杂声问题。本报告对过去基于伪数据的自然语言处理方法进行总结，并对未来的发展方向做出展望。

刘挺教授应邀在CNCC2016“面向互联网大数据的语言与知识计算”专题论坛作学术报告