负责人:刘挺教授
依托单位:哈尔滨工业大学
项目类型:国家自然科学基金 重点项目
项目名称:篇章级中文语义分析理论与方法


感谢您关注 哈工大中文篇章关系语料(HIT-CDTB), 本语料由哈工大社会计算与信息检索研究中心开发。

本次语料标注工作属于中心承担的自然科学基金重点项目“中文篇章及语义分析理论与方法”的部分工作内容;
语料包含525篇Ontonotes中文语料的标注结果,覆盖了句群关系、复句关系、分句关系等多级信息。

为促进国内相关研究发展,推动学术交流,我们决定 将语料免费对学术界开放,欢迎大家下载使用。


    • 如果您希望了解我们的语料,这里是小集合语料样例(50篇)下载 <语料样例下载(50篇)>
    • 如果您希望获取全部语料,请下载签署 <哈工大社会计算与信息检索研究中心共享资源协议>,并联系秦兵教授(qinb@ir.hit.edu.cn)。

特别说明:
1) 请您所在课题组负责人签署协议,并将协议Word电子版直接发送给 秦兵教授(qinb@ir.hit.edu.cn), 协商语料的具体交付方式。
2) HIT-SCIR共享资源的完整数据和相关程序库的完整版本只免费提供给“高校和科研院所”用于科学研究,对于独立个人或者商业公司的申请恕不免费提供。
3) 在发表论文和申报成果时声明“使用了哈工大社会计算与信息检索研究中心中文篇章关系语料”,并且引用以下论文:
    张牧宇,秦兵,刘挺. 中文篇章级句间语义关系体系及标注. 中文信息学报, 2014, 28(2):28-36.
    同时,发信给qinb@ir.hit.edu.cn,说明发表论文题目或取得成果的出处等情况。
具体要求请参见共享资源协议内容



中文篇章级关系体系及类型标注;张牧宇,秦兵,刘挺;中文信息学报,2014, 28(2): 28-36.
中文篇章级句间语义关系识别;张牧宇,宋原,秦兵,刘挺;中文信息学报,2013, 27(6): 51-58.