哈尔滨工业大学社会计算与信息检索研究中心 – 理解语言，认知社会

语言分析(LA组)

2020年06月22日

语法分析

以依存句法分析为研究重点，涉及汉语分词、词性标注、命名实体识别及名词短语识别、动词细分类等内容。

语义依存(图)分析

语义依存分析是通往语义深层理解的一条蹊径，它通过在句子结构中分析实词间的语义关系（这种关系是一种事实上或逻辑上的关系，且只有当词语进入到句子时才会存在）来回答句子中”Who did what to whom when and where”等问题。语义分析可以跨越句子的表层结构直接获取深层语义表达的本质，这种性质在信息检索、机器翻译等诸多领域有重要作用。

语音转写后处理

由于口语的不规范性，直接进行语音转写的可阅读性往往存在较大的问题，所以凸显了语音转写后处理的重要性，即对口语化的文本进行分句、加标点，并对文本内容的流利性进行处理，甚至进行内容的摘要，以利于更好的阅读与编辑。

任务型对话系统

在当下日益加快的社会节奏中，人们对于更便捷，更智能的生活助手用来完成日常生活中的一些简单任务的需求越来越高。这里简单的任务包括查询机票，火车票，酒店等等。任务型对话系统研究的就是这类问题。任务型的对话系统主要分为对话状态跟踪，即从用户的请求中解析得到关键信息；对话策略，即制定回复策略以更好，更快地协助人们完成任务。任务型对话系统的研究有很广泛的运用场景。

语言技术平台云

语言技术平台(LTP) 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注、语义依存分析等丰富、高效、精准的自然语言处理技术。经过十余年的持续研发和推广，LTP 已经成为国内外最具影响力的中文处理基础平台，曾获 CoNLL 2009七国语言句法语义分析评测、CoNLL 2018国际多语言通用依存分析评测以及CoNLL 2019国际跨框架语义分析评测取得第1名。2016年，获黑龙江省科技进步一等奖；2010年获中国中文信息学会中文信息处理科学技术奖一等奖等。

科研项目

在研：

2020年1月—2023年12月，跨语言语义依存分析研究（61976072），国家自然科学基金面上项目

完成：

依存句法分析子结构可信度计算研究，61370164，国家自然科学基金面上项目，2014—2017
面向三元空间的互联网中文信息处理理论与方法，2014CB340503，国家973计划项目，2014—2018
汉语依存句法分析若干关键技术研究，60803093，国家自然科学青年基金，2009—2011
汉语语义角色标注方法研究，60675034，国家自然科学基金面上项目，2007-2009
基于等价伪词的汉语全文无指导词义消歧技术研究，60575042，国家自然科学基金面上项目，2006-2008
基于XML的分层交互式中文处理开放平台，2006AA01Z145，863计划探索类专题项目，2007-2008

成员介绍

教师：

车万翔副教授/博士生导师

博士生：

王少磊、徐俊、王宇轩、施晓明、郑博、滕德川、覃立波、候宇泰、柳泽明、窦隆绪、王宝鑫、徐阳、陈三元、徐啸

硕士生：
赖勇魁(LA)、季雨秋(LA)、李祺欣(LA)、冯云龙、王重元、潘名扬、雷志林