信息检索实验室推出“人物资讯中心”
2014年04月18日您是否有过这种经历:在浩瀚的互联网中,苦苦追寻您的偶像、您的好友、您所关心的任何人,而“先进的”搜索引擎工具或者“全面及时的”人物门户网站,在给您带来只言片语、浮光掠影式的丝丝线索之外,更多的是这些信息的杂乱和无序?
“人物资讯中心”,是为尝试解决这些问题而来!
我们的“人物资讯中心”系统,其意图是:对互联网上关于人的各种杂乱无章的信息,按“人”为中心进行统合、整理和挖掘。通过该系统,用户可以方便、全面地追踪某个人的相关新闻事件及发展,方便地获得该人物的各种资讯,使得关于“人物”的信息获取,不再是茫茫人海中的苦苦寻觅,而是近在眼前的举手可得。
实现这样一个系统,将是逐步实现和不断完善的过程。今天,我们推出“人物资讯中心(娱乐版)”系统。该系统追踪娱乐界明星们的各种新闻报道,并对这些报道按照事件进行聚类,并按照本日、本周、本月的形式对明星按照热点情况进行排列。这样,用户可以方便的获知娱乐明星的各种活动信息及其发展。
系统使用了实验室的多项技术,包括网页爬行、正文和标题提取、文本聚类、多文档文摘、词法分析等。这是IR-Lab用于测试各项技术,展示各项技术的一个重要的应用平台。
人物资讯中心(PIC, People Information Center)