东芝(中国)研发中心王海峰博士受聘为哈工大兼职教授
2014年04月18日2007年4月28日上午,东芝(中国)研发中心的王海峰博士在哈工大计算机学院会议室正式受聘为哈工大兼职教授。刘挺老师主持会议,哈工大中文信息处理领域的相关师生30余人参加了受聘仪式。刘挺老师介绍了王海峰博士的简历,哈工大前党委书记李生教授为王海峰颁发了兼职教授证书。王海峰博士发表感言,他感谢母校的培养,表示将继续努力为母校的建设做贡献。李生老师是王海峰的导师,他对王海峰在校期间以及毕业后8年中取得的一系列成绩给予了充分肯定,他希望在校的学生们以王海峰博士为榜样,发扬哈工大的优秀传统,早日成才。随后,王海峰做了题为“基于枢轴语言的统计机器翻译”的学术报告,该报告集中了王海峰博士连续两年发表的ACL论文的精华。(附:王海峰简历、学术报告摘要)
颁发证书
王海峰博士做报告
观众
简历: 王海峰博士现任东芝(中国)研究开发中心首席研究员、副所长、兼研究部部长。兼任哈尔滨工业大学兼职教授、中国中文信息学会理事、《中文信息学报》编委等。 王海峰1999年3月毕业于哈尔滨工业大学获工学博士学位,曾任微软(中国)研究院副研究员、isilk.com研究科学家(香港特区政府优秀人才计划)。主要研究方向为自然语言处理与机器翻译、信息检索、语音识别及合成等。曾申请中国、美国及日本专利10余件,发表论文40余篇。
题目: 基于枢轴语言的统计机器翻译
摘要: 统计机器翻译(Statistical Machine Translation)是目前机器翻译领域最重要的研究热点。统计机器翻译通常需要大规模双语语料作为训练数据。但是,对于大多数语言对,通常都无法获得较大规模的双语语料,即使是汉语和日语这两种使用者过亿的语言,汉-日之间的双语语料也远比汉-英、日-英双语语料少得多。本报告将介绍基于枢轴语言(Pivot Language)的统计机器翻译方法。对于没有双语语料的待翻译语言对(如汉语-日语),如果存在一个枢轴语言(如英语),它分别与源语言和目标语言之间存在较大规模双语语料,则我们可以通过引入枢轴语言,使用源语言-枢轴语言、目标语言-枢轴语言两种语料来训练得到源语言-目标语言的之间的统计机器翻译模型,从而实现源语言-目标语言之间的翻译。在此基础上,如果同时存在少量的源语言-目标语言语料,我们还可以使用多个翻译模型进一步提高翻译质量。