事理图谱是一个事理逻辑知识库,描述了事件之间的演化规律和模式。结构上,事理图谱是一个有向有环图,节点代表事件,有向边代表事件之间的时序、因果、条件和上下位等逻辑关系。理论上,事理图谱中的事件是具有一定抽象程度的泛化事件。这些事件可以表示为抽象、语义完备的谓词性词或词组,也可以表示为可变长度的、结构化的(主体,事件词,客体)多元组。
事件之间的因果关系是事理图谱当中重要的事理知识。现有的因果知识获取大多数是基于抽取方法,例如通过模式匹配、统计机器学习或深度学习方法从文本中抽取出因果事件对。基于抽取的方法是对世界上已有知识的获取和记录,并不创造新的知识。为此,我们提出了一种获取因果事理知识的新途径——基于生成的方法,作为对传统抽取式因果知识获取的重要补充。对于任意的开放域句子级事件输入,可生成多个可能的句子级原因或者结果。人工和自动评估指标表明,即使对于全新的输入,我们的方法也可以生成高质量、多语义的原因和结果。
开源情报系统基于各类自然语言处理技术,通过对世界各地最新新闻进行搜集,处理和剖析,将同一宏观事件的所有热点新闻归纳成事件发展脉络,并对宏观事件的热点人物以及热点实体进行专门分析。形成了对新闻动态的实时捕获,新闻专题的自定义,宏观事件脉络的自动归纳,百科词条的自动构建,关键信息的自动抽取等全栈情报分析系统。对于决策系统等具有重大意义。