哈工大社会计算与信息检索研究中心
友爱  力行  乐学  日新

HIT-SCIR

我中心主任刘挺教授应邀在2016年中国计算机大会(CNCC2016)上作学术报告

我中心主任刘挺教授应邀在2016年中国计算机大会(CNCC2016)上作学术报告

2016年10月25日

10月21日下午,2016中国计算机大会(CNCC2016)的重要活动之一“面向互联网大数据的语言与知识计算”专题论坛在陕西省太原市湖滨国际大酒店晋瑞厅火热举行。

哈尔滨工业大学社会计算与信息检索研究中心主任刘挺教授应邀在“面向互联网大数据的语言与知识计算”专题论坛上做学术报告,题为“基于伪数据的自然语言处理方法”。

报告题目:基于伪数据的自然语言处理方法

摘要:深度学习需要大规模的标注数据,但人工标注数据的成本很高,数据规模难于扩大。寻找或构造大规模的“伪数据”(Pseudo Data),以模拟真实的人工标注数据,是克服训练数据不足的有效手段。所谓伪数据就是不经人工标注而获得的训练数据,目前在词义消歧、句法分析、信息抽取、情感分析、阅读理解等研究课题中均已取得良好效果,但由于伪数据与真实数据的差异,也不可避免地带来了杂声问题。本报告对过去基于伪数据的自然语言处理方法进行总结,并对未来的发展方向做出展望。

 

刘老师 CNCC1

刘老师 CNCC2

刘挺教授应邀在CNCC2016“面向互联网大数据的语言与知识计算”专题论坛作学术报告


Copyright © Research Center for Social Computing and Information Retrieval 2001 - 2015
P.O.Box 321, HIT, P.R.China 150001
webmaster at ir dot hit dot edu dot cn