刘挺简历

English version

 

基本情况

男,19722月出生于哈尔滨,哈尔滨工业大学教授、博导

在学校担任的管理职务

·      2000.10至今, 哈工大计算机研究所副所长

·      2001.3至今,哈工大信息检索研究室主任

·      2004.11至今, 语言语音教育部微软重点实验室(哈尔滨工业大学)副主任

·      2009.3至今,哈工大计算机学院院长助理,主抓学科建设

社会兼职

国家863计划重点项目“中文为核心的多语言处理技术”总体组专家

中国中文信息学会

o        理事

o        信息检索专业委员会,副主任

o        计算语言学专业委员会,委员

中国计算机学会

o        高级会员

o        中文信息技术专业委员会,委员

o        YOCSEF,学术委员会委员

 

联系方式:

实验室邮箱:tliu@ir.hit.edu.cn;

其他常用邮箱:tliu72@gmail.com

主页: http://ir.hit.edu.cn/~tliu/;

博客:http://blog.sina.com.cn/tliu7221

邮寄地址:

哈尔滨工业大学321信箱,哈尔滨

电话: +86-451-86413683(86402993)-801, 13936137628

传真: +86-451-86413683(86402993)-812

办公地址:

哈尔滨市南岗区教化街276

 

荣誉

  • 哈尔滨市十大IT杰出青年, 哈尔滨, 2005
  • SMC优秀教师奖, 2003
  • 海王奖学金, 哈尔滨工业大学, 1995
  • 哈工大首届十佳大学生, 1995
  • 校优秀本科毕业生, 哈尔滨工业大学, 1993

研究领域

  • 自然语言处理
    • 语言分析
      • 依存分析
      • 词义消歧
      • 语义角色标注
    • 语言生成
      • 复述技术
      • 辅助写作
      • 机器翻译
  • 文本挖掘
    • 实体关系抽取
    • 共指消解
    • 意见挖掘
  • 文本检索
    • 问答系统
    • 垂直搜索
    • 个性化搜索

教学经历

1995 - 1998:   人工智能”, 面向哈工大计算机专业研究生

2001 - 2004:   统计自然语言处理”, 面向哈工大计算机专业研究生

2001 - 2009:   信息检索”, 面向哈工大计算机专业研究生

2006 – 2009: 计算机新进展,面向哈工大计算机专业本科生

 

职业经历

2004.7 至今:        教授, 哈工大计算机学院

2000.10 - 2004.7: 副教授,哈工大计算机学院

2000.5 - 2000.10:   讲师,哈工大计算机学院

1999.4 - 2000.5:     副研究员,微软中国研究院,自然语言计算组

1998.7 - 1999.4:    讲师,哈工大计算机系

1995.6 - 1998.7:    助教,哈工大计算机系

1995.9 - 1998.7:    博士生,哈工大计算机系

1993.9 - 1995.7:    硕士生,哈工大计算机系

1989.9 - 1993.7:    本科生,哈工大计算机系

 

主持或参与的科研项目

 

国家项目:

2008.1-2011.12: 下一代信息检索研究,国家自然科学基金重点项目

2008.1-2010.12: 基于实体关系的文本内容挖掘与集成技术平台,国家863计划探索类课题

2009.1 - 2011.12: 中文依存分析, 国家自然科学基金青年基金

2007.1 - 2009.12: 中文语义角色标注, 国家自然科学基金面上项目

2007.1 - 2008.12: 基于XML的分层互动中文处理开放平台,国家863计划探索类课题

2006.1 - 2008.12: 基于等价伪词的中文词义消歧,国家自然科学基金面上项目

2006.1 - 2008.12: 中文短语及简单句复述技术,国家自然科学基金面上项目

2005.1 - 2008.12:   问题理解与答案抽取,国家自然科学基金重点项目“问答式信息检索”的子课题

2003.1 - 2004.12:   开放域问答式信息检索技术研究, 国家自然科学基金面上项目

2003.2 - 2003.7:     中文信息模糊匹配技术,国家863课题

2001.1 - 2002.12:   基于依存分析的中文自动校对,国家863课题“中文处理平台”的子课题

 

信息产业部项目:

2007.1 - 2007.12: 短信息理解 242项目

2006.1 - 2006.12: 群发信息检测与过滤 242项目

2005.1 - 2005.12: 群发信息处理

2004.11 – 2005.5: 敏感信息聚类分析与特征抽取

2002.10 - 2003.12: 数据去冗余系统

2002.10 - 2003.12: 群发邮件自动发现与分析系统

2001.12 - 2002.12: 因特网主机攻击报警平台

2001.5 - 2002.12: 大规模网页快速去重系统

2000.10 - 2001.5: 网上有害信息人机互助式过滤系统

 

国际合作项目:

2008-2009: 特定域个性化交互式问答技术

2007 – 2008: 中文依存句法分析

2007: 中文共指消解

2006: 机构信息抽取

2005-2006: 中文词义消歧

2006: 中文依存句法分析

2005: 英文复述技术

2005: 多文档文摘

2003: 双语例句获取与处理

 

企业合作项目

2008,  语言技术平台授权

2007 - 2008, 中英双语例句检索

2006, 中文文本分类、聚类和文摘

2005 - 2006, 简繁转换等七项中文处理技术

2005, 在线客服系统

 

注:以上没有注明负责人的项目,负责人均为刘挺本人

科研团队中的助手

秦兵, 2000.5至今, 教授、博士生导师

张宇, 2002.4至今, 副教授、博士

车万翔, 2000.5至今, 讲师、博士

指导的博士生

作为副导师指导的博士生(导师均为李生教授):

卢志茂, 2003.9 – 2006.7 ,词义消歧

李维刚, 2002.9 - 2008.1 ,复述技术

马金山, 2003.3 - 2008.1 ,依存句法分析

车万翔, 2004.3-2008.12,语义角色标注

 

洪宇, 2004.9入学,话题检测与跟踪

张志昌, 2005.3入学,阅读理解

陈毅恒, 2005.3 入学,文本聚类

贺瑞芳, 2005.9 入学,自动文摘

, 2006.3入学,复述技术

, 2006.3入学,共指消解

宋巍, 2008.9入学,个性化信息检索

郭宇航, 2008.9入学,词义消歧

 

作为导师指导的博士生:

赵妍妍, 2007.9入学,意见挖掘

伍大勇, 2007.9入学,问答系统

和为, 2008.3入学,复述技术

李正华, 2008.9入学,依存分析

戈马(埃塞俄比亚),2008.9入学,个性化信息检索

薛涵2009.3入学,文本挖掘

学术活动

  1. 程序委员会主席, 第一届全国信息检索与内容安全学术会议, 200411, 上海
  2. 程序委员会主席, 第三届全国信息检索与内容安全学术会议, 20071月,苏州
  3. 亚洲信息检索会议AIRS2006分会场主席, 200611月,Singapore
  4. 第二届自然语言处理青年学者研讨会YSSNLP主席,Chair, 20056月,哈尔滨
  5. 2届和第4届全国信息检索与内容安全学术会议,程序委员会委员
  6. 6-9届全国计算语言学会议,程序委员会委员
  7. 自然语言处理国际联合学术会议IJCNLP2005, 20055月,韩国,程序委员会委员
  8. 组织委员会主席,亚洲信检索会议AIRS2008, 20081月,哈尔滨
  9. 国际青年计算机会议ICYCS2008, 长沙,程序委员会委员
  10. WWW2008, 北京,20084月,WWW in China专题会议的程序委员会委员
  11. SIGIR2009,美国波士顿,程序委员会委员

编委

1.       中文信息学报

审稿人

1.       Natural Language Engineering

2.       计算机学报

3.       自动化学报

4.       电子学报

5.       软件学报

发表论文

博士论文

基于篇章多级依存结构的自动文摘研究

导师:洪家荣、王开铸,哈工大计算机系, 1998.7

 

英文论文

2008

1.       Wanxiang Che, Min Zhang, Ai Ti Aw, Chew Lim Tan, Ting Liu, and Sheng Li. Using a Hybrid Convolution Tree Kernel for Semantic Role Labeling. ACM Transactions on Asian Language Information Processing. To appear. (EI Indexed)

2.       Min Zhang, Wanxiang Che, Guodong Zhou, Ai Ti Aw, Chew Lim Tan, Ting Liu,and Sheng Li. Semantic Role Labeling Using a Grammar-Driven Convolution Tree Kernel. IEEE Transactions on Audio, Speech, and Language Processing. 2008, 16(7):1315-1329 (SCI Impact Factor: 0.8)

3.       Wei Zheng, Yu Zhang, Yu Hong, Jili Fan, Ting Liu“Topic Tracking Based on Keywords Dependency Profile” AIRS  pp129-140,2008.01

4.       Wanxiang Che, Min Zhang, Ai Ti Aw, Chew Lim Tan, Ting Liu, Sheng Li ,“Fast Computing Grammar-driven Convolution Tree Kernel for Semantic Role Labeling” IJCNLP’08

5.       Shiqi Zhao, HaifengWang, Ting Liu, Sheng Li  “Pivot Approach for Extracting Paraphrase Patterns from Bilingual Corpora” Proceedings of ACL   pp780–788,2008

6.       Shiqi Zhao, Cheng Niu, Ming Zhou, Ting Liu, Sheng Li  “Combining Multiple Resources to Improve SMT-based Paraphrasing Model” Proceedings of ACL  pp1021-1029,2008

7.       Xiaofeng Yang, Jian Su, Jun Lang, ChewLim Tan, Ting Liu, Sheng Li  “An Entity-Mention Model for Coreference Resolution with Inductive Logic Programming” Proceedings of ACL  pp843-851,2008

 

2007

8.       Shiqi Zhao, Lin Zhao, Yu Zhang, Ting Liu, Sheng Li “HIT Web based Scoring Method for English Lexical Substitution “ Proceedings of SemEval pp:173-176  2007.06

9.       Min Zhang,Wanxiang Che,Aiti Aw and Chew Lim Tan,Ting Liu,Sheng Li “A Grammar-driven Convolution Tree Kernel for Semantic Role Classification “ Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics  pages200-207, Prague, Czech Tepublic,June 2007.

10.   Yuhang Guo, Wanxiang Che, Yuxuan Hu, Wei Zhang and Ting Liu “HIT-IR-WSD: A WSD System for English Lexical Sample Task “International Workshop on Semantic Evaluations Association for Computational Linguistics, Prague, Czech Republic  2007, pp. 165--168.

11.   Liu Ting, Ma Jinshan, Zhang Huipeng and Li Sheng “SUBDIVIDING VERBS TO IMPROVE SYNTACTIC PARSING “Journal of Electronics (China) ,2007.03, 24(3): 347-352

12.   Shiqi Zhao, Ming Zhou, Ting Liu “Learning Question Paraphrases for QA from Encarta Logs “ Proceedings of IJCAI  pp:1795-1800,2007.01

13.   Shiqi Zhao, Ting Liu, Xincheng Yuan, Sheng Li, and Yu Zhang “Automatic Acquisition of Context-Specific Lexical Paraphrases “ Proceedings of IJCAI pp:1789-1794   2007.01

14.   Jun Lang, Bing Qin, Ting Liu, Sheng Li “Intra-document Coreference Resolution: The state of the art “ Journal of Chinese Language and Computing  pp227-253, Vol.17(4) 2007

 

2006

15.   Liqi Gao, Yu Zhang, Ting Liu, Guiping Liu “Word Sense Language Model for Information Retrieval “  In Proceedings of AIRS(Asia Information Retrieval Symposium  2006.10,pages 158-171

16.   Shiqi Zhao, Ting Liu, Xincheng Yuan, Sheng Li, Yu Zhang  “Web Mining for Lexical Context-Specific Paraphrasing “ In Proceedings of AIRS(Asia Information Retrieval Symposium)  2006.10,pages 673-679

17.   Ting Liu, Jinshan Ma, Sheng Li  “Building a Dependency Treebank for Improving Chinese Parser “ Journal of Chinese Language and Computing. 2006.10,16(4):207-224

18.   Zhimao Lu, Haifeng Wang, Jianmin Yao, Ting Liu, Sheng Li  “An Equivalent Pseudoword Solution to Chinese Word Sense Disambiguation”  In Proceedings of the 44th Annual Meeting of the Association for Computational Linguistics  (ACL-2006.03),pages 457-464

19.   Wanxiang Che, Min Zhang, Ting Liu, Sheng Li  “A Hybrid Convolution Tree Kernel for Semantic Role Labeling”  In Proceedings of the 44th Annual Meeting of the Association for Computational Linguistics  pp73-80,(ACL-2006.03)

20.   Ting Liu, Jinshan Ma, Huijia Zhu, Sheng Li  “Dependency Parsing Based on Dynamic Local Optimization”  In Proceedings of CoNLL  pp211-2152,2006.02

 

2005

21.   Weigang Li, Ting Liu, Yu Zhang, Sheng Li and Wei He  “Automated Generalization of Phrasal Paraphrases from the Web “  The 3rd International Workshop on Paraphrasing  (IWP2005.10), pp49-57

22.   Wanxiang Che, Jianmin Jiang, Zhong Su, Yue Pan and Ting Liu  “Improved-Edit-Distance Kernel for Chinese Relation Extraction “  The Second International Joint Conference on Natural Language Processing (IJCNLP-05), 2005.10, Jeju Korea , pp134-139

23.   Zhuoran WangTing Liu  Chinese Unknown Word Identification Based on Local Bigram Model “  International Journal of Computer Processing of Oriental Languages .  2005,.0918(3): 185-196

24.   Huipeng Zhang, Ting Liu, Jinshan Ma and Xiantao Liao  “Chinese Word Segmentation with Multiple Postprocessors in HIT-IR Lab “  SIGHAN 2005.08, pp172-175

25.   Ting Liu, Wanxiang Che, Sheng Li, Yuxuan Hu, and Huaijun Liu  “Semantic role labeling system using maximum entropy classifier “  In Proceedings of CoNLL  2005.06,Ann Arbor, Michigan, pp189-192

26.   Lu Zhimao, Liu Ting, Li Sheng  “Unsupervised Chinese Word Sense Disambiguation Based on Equivalent Pseudowords  International Conference on Chinese Computing  2005.3

 

2004

27.   Weigang LiTing LiuSheng Li  Combining Sentence Length with Location Information to Align Monolingual Parallel Texts “  Asia Information Retrieval Symposium  2004, pages 71-77 (Lecture Notes in Computer Science, Volume 3411/2005, Pages118-128)

28.   Zhuoran WangTing Liu hinese Unknown Word Identification Based on Local Bi-gram Model with Integrally Smoothing Assumption“International Conference on Chinese Language Computing   pp524-528,2004.9

29.   Zhimao LuTing LiuSheng Li  “Combining Neural Networks and Statistics for Chinese Word Sense Disambiguation”  Third SIGHAN Workshop on Chinese Language Processing  pp49-56,2004.7

30.   Weigang LiTing LiuZheng WangSheng Li  “Aligning Bilingual Corpora Using Sentences Location Information” Third SIGHAN Workshop on Chinese Language Processing   pp141-147,2004.7

31.   Wanxiang CheTing LiuSheng Li  “A New Chinese Natural Language Understanding Architecture Based on Multilayer Search Mechanism”  Third SIGHAN Workshop on Chinese Language Processing   pp134-140,2004.07

32.   Jinshan MaYu ZhangTing LiuSheng Li  “A Statistical Dependency Parser of Chinese under Small Training Data”  The 1st International Joint Conference of Natural Language Processing   pp1-4 2004,3

 

中文论文

2008

33.   洪宇、郑伟 、张宇、邹博伟、刘挺 基于子话题分治匹配的新事件检测  计算机学报  Vol. 31, No. 4, pp. 687-695, 2008

 

2007

34.   洪宇、张宇、刘挺、李生 ,“话题检测与跟踪的评测及研究综述中文信息学报  Vol. 21, No. 6, pp. 71-87, 2007 

35.   洪宇,张宇,刘挺,郑伟,龚诚,李生基于层次聚类的自适应信息过滤学习算法中文信息学报  Vol. 21, No. 3, pp. 47-53, 2007 

36.   , 秦兵, 刘挺, 李正华, 李生  中文人称名词短语单复数自动识别  自动化学报  2007917

37.   李维刚、刘挺、李生 基于双语语料库的短语复述实例获取研究中文信息学报 pp:362-367 ,2007.08 5

38.   ,车万翔,李生 基于最大熵分类器的语义角色标注软件学报 Vol.18,No.3,3. 2007,pp.565-573

39.   李维刚、刘 挺、李   基于网络挖掘的实体关系元组自动获取  电子学报  pp2111-211620073511

40.   黄永光,刘挺,车万翔,胡晓光  面向变异短文本的快速聚类算法  中文信息学报  2007.21卷,02, pp:63-68

 

2006

41.   刘挺,马金山,李生 基于词汇支配度的汉语依存分析模型软件学报 2006.06179):1876-1883

42.   秦兵, 刘挺, 陈尚林,李生 多文档文摘中句子优化选择方法研究  计算机研究与发展  43卷,第6期,pp1129-1134,20066

43.   卢志茂,刘挺,李生  基于无指导机器学习的全文词义自动标注方法  自动化学报 2006,3, pages 228-236

44.   刘挺,李维刚,张宇,李生  复述技术研究综述  中文信息学报  2006.03404),pp25-33

45.   ,张宇,刘挺,马金山  基于句法结构分析的中文问题分类  中文信息学报  2006.03,20(2),pp33-39

46.   卢志茂,刘挺,李生  统计词义消歧的研究进展  电子学报  2006, 2, pages 333-343

 

2005

47.   , 张宇, 刘挺, 陈毅恒, 黄永光, 李生  基于类别特征域的文本分类特征选择方法  中文信息学报  2005.12, 19(6): 21-27

48.   秦兵, 刘挺, 李生  多文档自动文摘综述  中文信息学报  2005.11, 19(6): 13-20

49.   陈儒, 张宇, 刘挺  面向中文特定信息变异的过滤技术研究  高技术通讯  2005.09, 15(9): 7-12

50.   张宇, 刘挺,   基于改进贝叶斯模型的问题分类  中文信息学报  2005.02, 19(2):100-105

51.   张宇, 刘挺, 陈毅恒, , 李生  自然语言文本水印技术  中文信息学报  2005.02, 19(6): 13-20

52.   车万翔, 刘挺, 李生  实体关系自动抽取  中文信息学报  2005.02, 19(2):1-6

 

2004

53.   卢志茂,刘挺,君,李生  神经网络和贝叶斯网络在汉语词义消歧上的应用对比  高技术通讯   20048Page:723-728

54.   车万翔,刘挺,秦兵,李生  基于改进编辑距离的中文相似句子检索  高技术通讯  2004.07pp15-20

55.   马金山,张宇,刘挺,李生  利用三元模型及依存分析查找中文文本错误  情报学报  2004.06Page:723-728

56.   秦兵,刘挺,李生  基于局部主题判定与抽取的多文档文摘技术  自动化学报 20045pp905-910

57.   赵永贞,刘挺,王志伟,陈惠鹏,邵艳秋  汉语文语转换系统中停顿指数的自动标注  中文信息学报2004.05pp48-53

 

专利

1.         Computer-Aided Writing System and Method with Cross-language Writing Wizard, (1st inventor ), US Patent# 7107204, Sept. 12, 2006

 

技术评测

国际技术评测

1.                   CoNLL2009, 多国语语义角色标注与依存分析国际评测,第1名,20家单位参加

2.                   CoNLL2008, 语义角色标注与依存分析国际评测,第2名(在国内参赛单位第1),20家单位参加

3.                   美国NIST机器翻译评测, 2008, 英汉翻译第5名(国内第1),9家单位参加

4.                   CoNLL2006, 语义角色标注,第6名,19家单位参加

5.                   SIGHAN2005, 中文分词,北大测试集,第3

国家863组织的技术评测

6.                   2003, 自动文摘评测第1

7.                   2004, 信息检索评测第2

8.                   2005, 信息检索评测第1

技术产品化

1.         中英双语例句检索系统成为金山爱词霸短句搜索服务,金山爱词霸是中国最大的在线英语词典和学习社区

2.         中文处理系列技术,包括分词、英文拼写检查、简繁/繁简转换、拼音标注、自动文摘、英文断词、中文同义词扩展等,嵌入金山WPS Office办公软件中,金山WPS是有20多年历史的国产中文办公软件

3.         语言技术平台(LTP)是一个集成化的中文分析软件系统,它包括6项基础的中文处理技术,如分词、词性标注、命名实体识别、词义消歧、依存句法分析、语义角色标注等,以及2项中文语料库和词典。目前,该平台已经被270多家国内外研究机构免费共享,各家单位基于LTP发表的论文超过50篇。

开发的演示系统

1.         语言技术平台: http://ir.hit.edu.cn/demo/ltp/

2.         爱词霸双语例句检索: http://dj.iciba.com/