主要研究方向

文本规整

文本顺滑

针对停顿、冗余、修正等口语现象编辑文本,使语音转写文本更书面化。

中文文本校对

识别书面文本中的拼写与语法错误,并提供修改建议。

通用语言分析

语言技术平台

面向自然语言文本的通用语言分析技术,包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注、语义依存分析等技术。

专用语言分析

语义解析

让计算机学会理解自然语言,并将其翻译成机器可执行的、形式化的逻辑表达式(如 SQL 语句)。

任务型对话系统

在面向用户解决特定任务的专用人机对话系统中,通过对话语义分析解析对话领域、用户意图、相关语义槽等关键信息。

代码理解与生成

利用自然语言处理技术辅助计算机编程,提升编程效率。涉及从自然语言到编程语言的程序合成和代码检索,以及从编程语言到自然语言的代码摘要和文档生成等技术。