哈工大社会计算与信息检索研究中心
友爱  力行  乐学  日新

HIT-SCIR

我中心两篇论文被2016年全国知识图谱与语义计算大会(CCKS2016)接收

我中心两篇论文被2016年全国知识图谱与语义计算大会(CCKS2016)接收

2016年10月25日

2016年9月19-22日,全国知识图谱与语义计算大会(CCKS2016)在北京西郊宾馆隆重召开。会议由中国中文信息学会语言与知识计算专业委员会主办。来自全国学术界、产业界从事知识图谱相关研究的400多人参加,探讨了知识图谱领域的新发现、新技术和新应用,旨在向社会公众介绍知识图谱相关领域的发展趋势和创新成果,进一步推动我国知识图谱技术领域的发展,会议的主题是:语义、知识与链接大数据。

我中心(哈尔滨工业大学社会计算与信息检索研究中心)第一作者分别为姜天文、刘燊的两篇论文被大会接收,并在大会上作报告。其中,姜天文同学为我中心2016级直博生,导师为秦兵教授,目前主要研究方向为信息抽取、知识库;刘燊同学为我中心2014级硕士生,导师为秦兵教授,研究方向为信息抽取,目前已毕业,就职于北京秒针信息咨询有限公司。

题目:基于表示学习的开放域中文知识推理

作者:姜天文,秦兵,刘挺

摘要:知识库通常以网络的形式被组织起来,网络中每个节点代表实体,而每条连边则代表实体间的关系。为了利用这种网状知识库中的知识,往往需要设计专门的复杂度较高的图算法,但这些算法并不能很好适用于知识推理,尤其是随着知识库的知识规模不断扩大,基于网状结构知识库的推理很难较好地满足实时计算的需求。本文的主要研究内容是,使用基于TransE模型的知识表示学习进行知识推理,包括对实体关系三元组中关系指示词以及尾实体的推理,其中关系指示词推理的实验取得了较好的结果,且推理过程无需设计复杂的算法,仅涉及向量的简单运算。另外,本文对原始TransE模型的代价函数进行改进,以更好地适用于开放域中文知识库表示学习。

题目:基于字信息学习词汇分布的实体上位关系识别

作者:刘燊,姜天文,秦兵,刘挺

摘要:本文在实体上位关系识别任务上,使用基于字信息的词向量学习模型学习词向量表示,并以此学习上位关系向量表示,在实体上位关系识别实验结果上效果较好,并且很大程度上缓解了未登录词的问题。首先基于字信息的词向量模型可以学习出几乎任意词语的词向量,然后根据语料中的上下位词对学习上位关系向量并聚类,学习每个簇的上位关系映射矩阵。最后利用上位关系映射矩阵来判别上位关系是否成立。实验结果表明,在未登录词多的数据集中,上位关系判别依然有着近80%的准确率,达到了可以应用的结果。

CCKS大会现场

大会现场

CCKS 姜天文

姜天文同学在会议上作学术报告


Copyright © Research Center for Social Computing and Information Retrieval 2001 - 2015
P.O.Box 321, HIT, P.R.China 150001
webmaster at ir dot hit dot edu dot cn