科研队伍

简介

健康智能(Health Intelligence,HI),组长:赵森栋

本研究组于2021年成立至今一直致力于探索人工智能在医疗健康领域的应用和前景。我们研究的方向包括:1. 构建基于医学知识的医学大模型,旨在提高医疗决策的准确性。2. 研究大模型优化技术,如可解释性增强方法和缓解大模型幻觉等问题,以提升模型可信度。 3. 利用深度学习技术,开发提高药物研发效率和准确度的智能方法,促进药物研发进程。4. 研究语言和认知之间的关联,推动自然语言处理和人类认知研究的融合。总的来说,本组希望利用和提升人工智能技术,推进医疗健康事业的发展。研究组目前承担国家重点研发:新一代人工智能2030计划、国家自然科学基金项目等多项科研项目。同时,本组已经在Briefings in Bioinformatics、Bioinformatics、IEEE TKDE、J-BHI、ACL、AAAI、IJCAI、WSDM、ICDM、CIKM、EMNLP、COLING等国际期刊和会议上发表多篇论文。

小组成员

教师:秦兵赵森栋
博士生:王昊淳、杜晏睿、孙孟周
硕士生:席奴瓦、陈雨晗、蔡沐祯、郭昊强、强泽文、陈健宇、李子健
本科生:李文豪、徐浩铭
毕业生:白睿、刘驰、王奥博(剑桥大学读博)

研究方向

医学大模型

在当前大语言模型蓬勃发展的当下,我们前瞻性地对医学垂直领域的大语言模型进行了探索,并提出适配领域的知识微调方法,并以此不断进行迭代,通过结合通用域大语言模型以及医学领域知识,初步研究成果于23年3月在GitHub开源,已累计获得超过3.3k star,未来我们将不断进行方法迭代,实现更可靠、更高效的医学领域大语言模型。

大语言模型优化技术

我们致力于大语言模型可解释性优化和幻觉消除技术的研究与应用。在可解释性优化方面,大语言模型内部决策和推理过程通常缺乏透明性和可解释性,这限制了其在关键领域(如医疗)的应用。为了解决这一问题,我们专注于大语言模型的可解释性优化技术,包括缓解模型的捷径行为、构建可靠的可解释AI模型等方面;在幻觉消除方面,大模型在专业领域内的回答会不时生成一些难以分辨的错误,为了防止大模型生成的错误回答误导用户,我们利用富有专业知识的外部模型对大模型的输出进行检测与筛查,也利用该种方法对模型在该领域上的能力进行评价,实现模型在医疗等专业领域内更加可靠的应用。

AI与药学 (AI for Pharmaceutical Sciences)

我们致力于探索人工智能在药物科学领域的应用。我们主要研究通过深度学习技术提高药物属性预测以及新药发现的水平,并应用多模态信息融合的方法同时利用文本和分子数据,开发出助推药物研发的AI技术。基于此,我们期待通过AI改变传统依赖经验的药物研发模式,实现更高效准确的新药开发。

脑认知与自然语言处理

我们的研究重点是在自然语言处理领域内探索和理解脑认知的作用。我们的研究主要涵盖了自然语言处理过程中的认知信号解码,以及开发以认知信号增强的自然语言处理方法。我们也致力于深入理解和应用认知信号和认知理论在自然语言处理过程中的价值。通过这些研究,我们期待将人类大脑的理解和解析语言的能力与自然语言处理技术相结合,探究并提高机器理解和生成自然语言的能力。初步成果已发表于ACL2023。

科研项目

在研

  1.  人机融合医疗会诊关键技术与应用 (国家重点研发:新一代人工智能2030计划)

  2.  基于医学文献的知识验证方法研究(国家自然科学基金项目)

  3.  基于跨模态预训练模型的从头药物设计方法研究(黑龙江省自然基金优秀青年项目)

  4.  Prompt数据质量快速提升技术(企业合作项目)

照片墙

hi02

hi01

 

研究成果

  1. 中文医学大模型-本草
    hi-project1

  2. 面向肝胆胰专科的病历诊断智能体

  3. 医学文献智能体
    医学领域一直在不断发展和进步,新的研究成果和临床实践经验往往存在医学文献中,能够帮助医生和研究人员更好地了解疾病的发展机制、诊断方法和治疗策略。因此,从医学文献中获取最新信息来进行知识验证是至关重要的。如下图所示,医学文献智能体旨在检索到与问题相关的文献,根据文献内容回答问题并提供支撑决策的依据。该智能体帮助用户验证和更新他们的知识,以支持更准确的诊断和更有效的治疗。
    hi-project2

论文发表

2023

UniCoRN: Unified Cognitive Signal ReconstructioN bridging cognitive signals and human language

作者:Nuwa Xi, Sendong Zhao, Haochun Wang, Chi Liu, Bing Qin and Ting Liu

发表:ACL 2023

 

Less Learn Shortcut: Analyzing and Mitigating Learning of Spurious Feature-Label Correlation

作者:Yanrui Du, Jing Yan, Yan Chen, Jing Liu, Sendong Zhao, Hua Wu, Bing Qin

发表:IJCAI 2023

 

2022

Structural and Textual Information Fusion for Symptom and Disease Representation Learning

作者:Sendong Zhao, Meng Jiang, Bing Qin, Ting Liu, ChengXiang Zhai, Fei Wang

发表:IEEE Transactions on Knowledge and Data Engineering (IEEE TKDE)

 

Biomedical Evidence Engineering for Data-driven Discovery

作者:Sendong Zhao, Aobo Wang, Bing Qin, Fei Wang

发表:Bioinformatics

 

Prompt Combines Paraphrase: Teaching Pre-trained Models to Understand Rare Biomedical Words

作者:Haochun Wang, Chi Liu, Nuwa Xi, Sendong Zhao, Meizhi Ju, Shiwei Zhang, Ting Liu

发表:COLING 2022

 

2021

Recent Advances in Biomedical Literature Mining

作者:Sendong Zhao, Chang Su, Zhiyong Lu, Fei Wang

发表:Briefings in Bioinformatics