哈工大信息检索研究室参加COAE2008评测并取得好成绩
2014年04月18日近年来,文本观点信息抽取和倾向性分析已经成为自然语言处理领域的一个热点问题。中国中文信息学会信息检索专业委员会筹划举办了第一届中文倾向性分析评测(Chinese Opinion Analysis Evaluation, COAE2008),致力于推动该领域的学术研究和技术开发应用,在建立基础数据集的基础上,探索中文倾向性分析的新技术、新方法。该评测共设置了6项任务,涉及词语、句子、篇章三个层次的倾向性分析,具体如下:
级别 | 任务说明 | 评测任务 | 任务编号 |
词语级 | 中文情感词的识别 | 情感词识别 | 1 |
词语级 | 中文情感词的褒贬分析 | 情感词极性判别 | 2 |
要素级 | 中文文本倾向性相关要素抽取 | 评价对象抽取 | 3 |
篇章级 | 中文文本的主客观分析 | 文本主客观判别 | 4 |
篇章级 | 中文文本的褒贬分析 | 文本褒贬极性判别 | 5 |
篇章级 | 面向对象的中文文本观点检索 | 观点检索(探索) | 6 |
共有21家单位报名参加评测,最终有20家单位提交了结果。 在秦兵老师的指导下,我研究室博士生赵妍妍、硕士生刘鸿宇代表实验室参加了此次评测,共参与了词语级和句子级的三项任务,取得了较好的成绩。其中,在任务三“中文文本倾向性相关要素抽取”中的Lenient和Strict评价体系下分别取得了第1名和第2名(13家单位参加,共提交16个结果);在任务一“中文情感词的识别”和任务二“中文情感词的褒贬分析”中也取得了较好的成绩。