文本挖掘(TM组)
2014年05月14日简介
文本挖掘组主要研究信息抽取、意见挖掘、自动文摘以及文本分类聚类技术。研究重点为信息抽取及意见挖掘,包括指代消解、关系抽取、事件抽取及意见挖掘等。
文本挖掘组在2003年国家863组织的技术评测中获得“自动文摘”第一名。 2008年的TAC(Text Analysis Conference) 评测中的子任务之一Update Summary评测中名列前茅。参加中国中文信息学会信息检索专业委员会筹划举办了第一届中文倾向性分析评测(Chinese Opinion Analysis Evaluation, COAE2008),在任务三“中文文本倾向性相关要素抽取”的Lenient和Strict评价体系下分别取得了第1名和第2名。已经完成高校合作项目“多文档自动文摘”,企业合作项目“文本分类和聚类”等。目前正在承担国家863项目“基于实体关系的文本内容挖掘及集成平台”,微软基金项目以及企业合作项目等。
小组成员
老师:秦兵博士/教授(组长)、赵妍妍博士/副教授
博士生:李璐旸、冯骁骋、Lydia、耿昕伟、孙一博、李家琦、姜天文
2015级硕士生:朱海潮、刘家豪、李盛秋、宁丹丹、任文静
2016级硕士生:袁建华、牟文晶、傅科达、冷海涛、李嘉伟、樊继康
本科生:龚恒、丛大玮、刘勇杰、向政鹏
成员合影:
研究子方向
- 共指消解
- 实体关系抽取,
- 事件抽取
- 意见挖掘
- 多文档自动文摘
- 文本聚类
- 文本分类