我中心主任刘挺教授应邀在2016年中国计算机大会(CNCC2016)上作学术报告
2016年10月25日10月21日下午,2016中国计算机大会(CNCC2016)的重要活动之一“面向互联网大数据的语言与知识计算”专题论坛在陕西省太原市湖滨国际大酒店晋瑞厅火热举行。
哈尔滨工业大学社会计算与信息检索研究中心主任刘挺教授应邀在“面向互联网大数据的语言与知识计算”专题论坛上做学术报告,题为“基于伪数据的自然语言处理方法”。
报告题目:基于伪数据的自然语言处理方法
摘要:深度学习需要大规模的标注数据,但人工标注数据的成本很高,数据规模难于扩大。寻找或构造大规模的“伪数据”(Pseudo Data),以模拟真实的人工标注数据,是克服训练数据不足的有效手段。所谓伪数据就是不经人工标注而获得的训练数据,目前在词义消歧、句法分析、信息抽取、情感分析、阅读理解等研究课题中均已取得良好效果,但由于伪数据与真实数据的差异,也不可避免地带来了杂声问题。本报告对过去基于伪数据的自然语言处理方法进行总结,并对未来的发展方向做出展望。
刘挺教授应邀在CNCC2016“面向互联网大数据的语言与知识计算”专题论坛作学术报告