社会预测组(SP组)
2020年06月22日简介
社会预测组(Social Prediction, SP),组长:丁效
社会媒体已经迅速发展成为具有重大影响力的新媒体,并为预测技术提供了新的数据源。2011年实验室由“信息检索研究中心”更名为“社会计算与信息检索研究中心”,从此开始进军社会计算研究领域,同时社会预测研究组也正式成立。社会预测研究组的目标是对社会媒体数据的挖掘与分析,汇集大众的群体智慧,运用科学的知识、方法和手段,对事物未来发展趋势和状态做出科学的估计和评价。经过九年的探索与积累,社会预测组将研究方向主要聚焦于文本驱动的预测、消费意图挖掘以及事理图谱构建等技术。秉承着研究中心“以中文技术,助民族复兴”的理想,社会预测组将研究重点放在计算机辅助民生经济上,在市场行情预测、消费意图挖掘、事理图谱等一系列研究任务上展开研究。并在SemEval-2020国际语义评测“检测反事实陈述”子任务中取得第一名。
小组成员
老师:丁效 博士/讲师(组长)
博士生:石继豪、杜理、蔡碧波、吴婷婷、熊凯、高靖龙、曾屹荣
硕士生:徐焕琛、杨重阳、吴宇航、唐旻骥、赵阳、赵翼、付凯
研究子方向
文本驱动的预测
文本是信息的重要载体,也是人们进行决策时依赖的重要信息源。当前基于文本的人工智能系统被运用于社会的各个领域,如智慧医疗,推荐系统,信贷审核等。传统的依靠人对海量数据阅读分析并做出决策的模式在大数据时代已经变得不再现实。许多决策需要依靠智能分析算法自动分析,辅助人类做出决策。文本驱动的预测通过对文本进行分析建模,理解文本所蕴含的复杂语义,从而建立文本语义与预测目标之间的关系。
消费意图挖掘
消费意图是指消费者通过显式或隐式的方式来表达对于某一产品或服务的购买意愿。消费意图挖掘包括显式/隐式消费意图挖掘、消费对象推荐等多个任务,在很多方面都有重要应用,如推荐系统、产品销量预测等。。
事理图谱
随着深度学习的兴起,人工智能迎来了新的发展高潮。人工智能的一个发展瓶颈在于,如何让机器掌握人类知识。事件之间在时间上相继发生的演化规律和模式是一种十分有价值的知识,挖掘这种事理逻辑知识对我们认识人类行为和社会发展变化规律非常有意义。然而,当前无论是知识图谱还是语义网络等知识库的核心研究对象都不是事件。尽管传统知识图谱在现代搜索引擎中(例如Google、Bing、Baidu等商业搜索引擎)得到了广泛应用,但是其聚焦于实体和实体之间的关系,缺乏对事理逻辑知识的挖掘。我们认为事理逻辑知识,包括事件之间的顺承、因果、条件和上下位等关系,对于人工智能领域的多种任务具有非常巨大的价值。为了揭示事件的演化规律和发展模式,我们提出了事理图谱的概念,旨在将事件的演化规律和模式构建成一个有向图形式的事理知识库,用于刻画和记录人类行为活动和事件客观演化规律。
开放领域事理图谱
基于研究组对事理图谱概念的定义,我们在金融、军事等多个领域,以腾讯、网易、和讯等网站的财经新闻文本,以及人民日报、中国青年报等多家报纸的开放领域新闻文本为基础进行了探索与实践,经过多次迭代与完善,构建了一个开放域的事理图谱。这也是事理图谱 “构建”、“推理”和“应用”三个关键技术点的具体应用。同时,事理图谱还融合了事件抽取、因果关系抽取、相似事件识别等多项关键技术。
科研项目
在研
- 国家自然科学基金委员会,青年基金项目,61702137,基于文本表示学习的金融市场 行情预测方法研究,2018-01至2020-12
- 科技创新2030-“新一代人工智能”重大项目“可泛化的领域知识学习与计算引擎” ,2018AAA0101901,2019.12-2022.12
完成
- 国家自然科学基金委员会,面上项目,“基于社会媒体的产品销量预测技术”