哈尔滨工业大学信息检索研究室  
哈尔滨工业大学 | 计算机科学与技术 | 信息检索研究室 |硕士 | 2006年7月毕业
胡晓光 (男 22岁)

E-mail:xghu@ir.hit.edu.cn
手机:(86)137-9662-3992
电话:(86)451-86413683-811
生日:1983年5月
籍贯:浙江
通信地址:哈尔滨工业大学1917信箱(150001)

自我评价/职业目标
自我评价:
扎实计算机相关基础知识,出色的工程开发能力,具备自然语言处理基础,掌握信息检索相关技术,有一定搜索引擎开发经验
职业目标: 希望能从事信息检索相关研究及软件开发相关工作
教育背景
2004/09 - 2006/07 哈尔滨工业大学 计算机科学与技术 硕士学位
2000/09 - 2004/07 哈尔滨工业大学 计算机科学与技术 本科学位
在校情况
获奖记录: 2004年硕士入学考试总成绩年级第五名
语言水平
一次性通过大学英语六级考试,成绩80
比较好的英语听、说、读、写能力
2003年1月TOEFL考试成绩590
专业技能

精通标准C/C++语言Java语言程序开发
掌握信息检索相关技术和各种检索模型
掌握自然语言处理相关的基础
熟悉计算理论和算法设计与分析等技术
熟悉信息过滤中各种模式匹配算法
熟悉Windows平台下MFC应用程序开发
了解Oracle9i数据库管理和程序开发

项目管理经验
2005/08 - 2005/09 项目名称:2005年863信息检索评测

项目描述:2005年863信息检索评测的对象是中文信息检索领域的核心技术,评测任务为给定主题,返回测试集中与该主题相关的网页测试集是由北京大学计算机网络与分布式系统实验室提供的 CWT100G。
责任描述:检索采用空间向量模型和统计语言模型,主要负责空间向量模型的各种检索实验,以及查询结果的部分后处理。系统的查询准确度R-Precision为36.7%,在22家参赛单位中排第一;MAP为31.1%,和最好成绩相差0.6%;P@10为62.4%,和最好成绩相差0.4%。
2005/04 - 2005/08 项目名称:国家计算机网络信息安全管理中心敏感信息处理
软件环境:红旗LinuxDC Oracle9i JDK1.4.2
硬件环境:曙光服务器
开发工具:VC.NET JBuilderX Eclipse

项目描述:此项目为工程项目,开发时间约5个月,规模约1.5万行代码,系统获得用户的好评。
责任描述:负责Oracle9i数据库管理、Windows平台下客户端程序开发和Linux平台下过滤程序的开发以及相关文档的编写,负责开发、维护代码约1万行。
2005/02 - 2005/05 项目名称:信息检索实验室爱尔搜索引擎开发

项目描述:爱尔搜索引擎是哈尔滨工业大学信息检索实验室独立开发的新闻搜索引擎,该搜索引擎提供新闻的检索、分类、聚类、文摘等服务,目前已初步完成,并对外开放。
责任描述:负责网页正文的索引和查找,索引和查找采用目前开源的工具Lucene。在项目开发过程中,对Lucene的源代码进行了深入的分析,掌握了Lucene索引算法以及检索模型
2003/05 - 2003/06

项目名称:2004年863命名实体识别评测

项目描述:命名实体(NE)是指人名、地名、机构名、时间词、数量词等一些专用名词。NE识别是句法分析、信息检索等的基础,此次863评测主要考察识别的准确率和召回率。
责任描述:主要负责内部评测程序的编写和数词部分的识别。数词识别主要采用了基于规则的方法。

2004/08 - 2004/10

项目名称:信息检索研究室依存树库建设

项目描述: 信息检索研究室汉语树库(IRLab Chinese Treebank,简称 IRCTB)的建设是一项旨在为自然语言处理领域的研究提供基础数据的工作。树库共包含 11,000 个汉语句子,句子来自于《人民日报》。
责任描述:主要负责部分树库依存关系标注的检查,树库动词细分类标注工具的编写,以及部分树库动词细分类标注工作。

2003/10 - 2004/05 项目名称:P2P文件共享和互传系统

项目描述:本科阶段毕业设计,独立开发,系统用于学习和实验。
责任描述:独立完成点对点P2P文件共享互传系统,该系统采用Java语言开发,实现点对点网络环境下文件多线程互传功能。
2003/05 - 2003/06 项目名称:可定制文法的LR(1)编译器

项目描述:编译原理课程设计
责任描述:独立完成一个可定制文法的自底向上LR(1)编译器。该编译器采用C语言开发,可以根据输入的上下文无关文法,自动构造LR跳转表,完成从源代码到四元式的翻译。
2003/04 - 2003/05 项目名称:TCP协议模拟

项目描述:网络原理课程设计
责任描述:独立完成基于UDP协议的可靠数据传输程序。该程序模拟了TCP协议的数据传输过程,实现了TCP的选择重发、滑动窗口、拥塞控制等机制,从而实现了数据的相对可靠传输。
兴趣爱好
篮球、游泳、健美等体育运动