科研队伍

简介

健康智能(Health Intelligence,HI),组长:赵森栋

本研究组于2021年成立至今一直致力于探索人工智能在医疗健康领域的应用和前景。我们研究的方向包括:1. 构建基于医学知识的医学大模型,旨在提高医疗决策的准确性。2. 研究大模型优化技术,如可解释性增强方法和缓解大模型幻觉等问题,以提升模型可信度。 3. 利用深度学习技术,开发提高药物研发效率和准确度的智能方法,促进药物研发进程。4. 研究语言和认知之间的关联,推动自然语言处理和人类认知研究的融合。总的来说,本组希望利用和提升人工智能技术,推进医疗健康事业的发展。研究组目前承担国家重点研发:新一代人工智能2030计划、国家自然科学基金项目等多项科研项目。同时,本组已经在Briefings in Bioinformatics、Bioinformatics、IEEE TKDE、J-BHI、ACL、AAAI、IJCAI、WSDM、ICDM、CIKM、EMNLP、COLING等国际期刊和会议上发表多篇论文。

小组成员

教师:秦兵赵森栋

博士生:王昊淳、杜晏睿、孙孟周

硕士生:强泽文、陈健宇、马铭、刘佳彤、范宇政、姜毅、李健博、李家运、韩霄

本科生:李文豪、赵丹杨、曹家炜、胡柏瑞、王镜博、吕元昊、彭康

毕业生:白睿、刘驰、王奥博(剑桥大学读博)、席奴瓦、陈雨晗、蔡沐祯、郭昊强、李子健

研究方向

医学大模型

在当前大语言模型蓬勃发展的当下,我们前瞻性地对医学垂直领域的大语言模型进行了探索,并提出适配领域的知识微调方法,并以此不断进行迭代,通过结合通用域大语言模型以及医学领域知识,初步研究成果于23年3月在GitHub开源,已累计获得超过3.3k star,未来我们将不断进行方法迭代,实现更可靠、更高效的医学领域大语言模型。

大语言模型优化技术

我们致力于大语言模型可解释性优化和幻觉消除技术的研究与应用。在可解释性优化方面,大语言模型内部决策和推理过程通常缺乏透明性和可解释性,这限制了其在关键领域(如医疗)的应用。为了解决这一问题,我们专注于大语言模型的可解释性优化技术,包括缓解模型的捷径行为、构建可靠的可解释AI模型等方面;在幻觉消除方面,大模型在专业领域内的回答会不时生成一些难以分辨的错误,为了防止大模型生成的错误回答误导用户,我们利用富有专业知识的外部模型对大模型的输出进行检测与筛查,也利用该种方法对模型在该领域上的能力进行评价,实现模型在医疗等专业领域内更加可靠的应用。


科研项目

在研

面向心血管疾病的人机融合会诊系统 (企业合作项目)

基于医学文献的知识验证方法研究(国家自然科学基金项目)

基于跨模态预训练模型的从头药物设计方法研究(黑龙江省自然基金优秀青年项目)

面向脑卒中的人机融合会诊系统(企业合作项目)

基因组学数据分析与解读大模型关键技术与应用(黑龙江省重点研发计划

面向精准医疗的基因解读大模型关键技术与应用(企业合作项目)

已结束

人机融合医疗会诊关键技术与应用 (国家重点研发:新一代人工智能2030计划)

Prompt数据质量快速提升技术(企业合作项目)


照片墙

hi02

hi01

 

研究成果

  1. 中文医学大模型-本草
    hi-project1

  2. 面向肝胆胰专科的病历诊断智能体

  3. 医学文献智能体
    医学领域一直在不断发展和进步,新的研究成果和临床实践经验往往存在医学文献中,能够帮助医生和研究人员更好地了解疾病的发展机制、诊断方法和治疗策略。因此,从医学文献中获取最新信息来进行知识验证是至关重要的。如下图所示,医学文献智能体旨在检索到与问题相关的文献,根据文献内容回答问题并提供支撑决策的依据。该智能体帮助用户验证和更新他们的知识,以支持更准确的诊断和更有效的治疗。
    hi-project2

论文发表

2025

Investigating the Security Threat Arising from ``Yes-No'' Implicit Bias in Large Language Models

作者:Yanrui Du, Sendong Zhao, Ming Ma, Yuhan Chen, Bing Qin

发表:AAAI 2025


LLMs May Perform MCQA by Selecting the Least Incorrect Option

作者:Haochun Wang, Sendong Zhao, Zewen Qiang, Nuwa Xi, Bing Qin, Ting Liu

发表:COLING 2025


2024

MoGU: A Framework for Enhancing Safety of Open-Sourced LLMs While Preserving Their Usability

作者:Yanrui Du, Sendong Zhao, Danyang Zhao, Ming Ma, Yuhan Chen, Liangyu Huo, Qing Yang, Dongliang Xu, Bing Qin

发表:NIPS 2024


CMCOQA: A Chinese Medical Complex Open-Question Answering Benchmark

作者:Zijian Li, Sendong Zhao, Haochun Wang, Haoming Xu, Bing Qin, Ting Liu

发表:BIBM 2024


Probing the Dual Logic Ability of Privatized Medical-Domain LLMs

作者:Yanrui Du, Sendong Zhao, Muzhen Cai, Ming Ma, Danyang Zhao, Jiawei Cao, Bing Qin

发表:BIBM 2024


AS-ES Learning: Towards Efficient CoT Learning in Small Models

作者:Nuwa Xi, Yuhan Chen, Sendong Zhao, Haochun Wang, Bing Qin, Ting Liu

发表:ACL 2024


MolTailor: Tailoring Chemical Molecular Representation to Specific Tasks via Text Prompts

作者:Haoqiang Guo, Sendong Zhao, Haochun Wang, Yanrui Du, Bing Qin

发表:AAAI 2024


From Artificially Real to Real: Leveraging Pseudo Data from Large Language Models for Low-Resource Molecule Discovery

作者:Yuhan Chen, Nuwa Xi, Yanrui Du, Haochun Wang, Jianyu Chen, Sendong Zhao, Bing Qin

发表:AAAI 2024


Manifold-based Verbalizer Space Re-embedding for Tuning-free Prompt-based Classification

作者:Haochun Wang, Sendong Zhao, Chi Liu, Nuwa Xi, Muzhen Cai, Bing Qin, Ting Liu

发表:AAAI 2024


Knowledge-tuning Large Language Models with Structured Medical Knowledge Bases for Trustworthy Response Generation in Chinese

作者:Haochun Wang, Sendong Zhao, Zewen Qiang, Zijian Li, Chi Liu, Nuwa Xi, Yanrui Du, Bing Qin, Ting Liu

发表:ACM Transactions on Knowledge Discovery from Data (ACM TKDD)


2023

UniCoRN: Unified Cognitive Signal ReconstructioN bridging cognitive signals and human language

作者:Nuwa Xi, Sendong Zhao, Haochun Wang, Chi Liu, Bing Qin and Ting Liu

发表:ACL 2023

 

Less Learn Shortcut: Analyzing and Mitigating Learning of Spurious Feature-Label Correlation

作者:Yanrui Du, Jing Yan, Yan Chen, Jing Liu, Sendong Zhao, Hua Wu, Bing Qin

发表:IJCAI 2023


Make Your Decision Convincing! A Unified Two-Stage Framework: Self-Attribution and Decision-Making

作者:Yanrui Du, Sendong Zhao, Haochun Wang, Yuhan Chen, Rui Bai, Zewen Qiang, Muzhen Cai, Bing Qin

发表:EMNLP 2023


2022

Structural and Textual Information Fusion for Symptom and Disease Representation Learning

作者:Sendong Zhao, Meng Jiang, Bing Qin, Ting Liu, ChengXiang Zhai, Fei Wang

发表:IEEE Transactions on Knowledge and Data Engineering (IEEE TKDE)

 

Biomedical Evidence Engineering for Data-driven Discovery

作者:Sendong Zhao, Aobo Wang, Bing Qin, Fei Wang

发表:Bioinformatics

 

Prompt Combines Paraphrase: Teaching Pre-trained Models to Understand Rare Biomedical Words

作者:Haochun Wang, Chi Liu, Nuwa Xi, Sendong Zhao, Meizhi Ju, Shiwei Zhang, Ting Liu

发表:COLING 2022

 

2021

Recent Advances in Biomedical Literature Mining

作者:Sendong Zhao, Chang Su, Zhiyong Lu, Fei Wang

发表:Briefings in Bioinformatics