王煦祥

哈尔滨工业大学(HIT) 在读硕士

社会计算与信息检索研究中心(SCIR) QA组
导师:张宇 教授
方向:关键词提取

  • 王煦祥
  • Dec. 2, 1991
  • 哈尔滨 南岗区 教化街29号 6楼
  • xxwang@ir.hit.edu.cn
  • +86 18845O91O33

科研

  • 关键词提取2014.09 - Present

    从会议、演讲、电话通话语料中提取出能说明主要内容的主题词,即关键词。通过关键词大概了解会议、演讲的内容,并为后续提取摘要做准备。
    应用于会议纪要、敏感内容监测等。
    使用机器学习的方法进行关键词抽取。
    使用基于图的方法、主题聚类、主题模型等方法(无监督方法)进行关键词抽取。

  • 面向百度知道的常问问题集构建2014.03 - 2014.07

    本科毕业设计

    使用Scrapy框架,爬取百度知道问题与最佳答案。
    基于VSM的文本相似度计算,采用了TF-IDF的方法计算词项在文本中的权重。
    基于语义的文本相似度计算,使用知网(HowNet)作为系统的语义知识资源。
    前台展示模块,使用Tornado作为服务器开发框架,使用bootstrap作为前端开发框架。

教育

  • 哈尔滨工业大学 硕士2014.09 - 2016.07

    计算机科学与技术学院

    社会计算与信息检索研究中心(SCIR)

奖励

  • 哈尔滨工业大学第二届创业大赛一等奖2014.10

    基于图像识别的黄桃去核机器人
  • 第二届全国海洋航行器设计与制作大赛二等奖2013.08

  • 哈尔滨工业大学优秀团员标兵2013.05

  • 国家奖学金2012.11

  • 哈尔滨工业大学三好学生2012.09

Contact info

  • 黑龙江省 哈尔滨市 南岗区 教化街29号6楼

  • Email: xxwang@ir.hit.edu.cn
  • Phone: +86 18845O91O33