健康智能(Health Intelligence,HI),组长:赵森栋
本研究组于2021年成立至今一直致力于探索人工智能在医疗健康领域的应用和前景。我们研究的方向包括:1. 构建基于医学知识的医学大模型,旨在提高医疗决策的准确性。2. 研究大模型优化技术,如可解释性增强方法和缓解大模型幻觉等问题,以提升模型可信度。 3. 利用深度学习技术,开发提高药物研发效率和准确度的智能方法,促进药物研发进程。4. 研究语言和认知之间的关联,推动自然语言处理和人类认知研究的融合。总的来说,本组希望利用和提升人工智能技术,推进医疗健康事业的发展。研究组目前承担国家重点研发:新一代人工智能2030计划、国家自然科学基金项目等多项科研项目。同时,本组已经在Briefings in Bioinformatics、Bioinformatics、IEEE TKDE、J-BHI、ACL、AAAI、IJCAI、WSDM、ICDM、CIKM、EMNLP、COLING等国际期刊和会议上发表多篇论文。
博士生:王昊淳、杜晏睿、孙孟周
硕士生:强泽文、陈健宇、马铭、刘佳彤、范宇政、姜毅、李健博、李家运、韩霄
本科生:李文豪、赵丹杨、曹家炜、胡柏瑞、王镜博、吕元昊、彭康
毕业生:白睿、刘驰、王奥博(剑桥大学读博)、席奴瓦、陈雨晗、蔡沐祯、郭昊强、李子健
医学大模型
在当前大语言模型蓬勃发展的当下,我们前瞻性地对医学垂直领域的大语言模型进行了探索,并提出适配领域的知识微调方法,并以此不断进行迭代,通过结合通用域大语言模型以及医学领域知识,初步研究成果于23年3月在GitHub开源,已累计获得超过3.3k star,未来我们将不断进行方法迭代,实现更可靠、更高效的医学领域大语言模型。
大语言模型优化技术
我们致力于大语言模型可解释性优化和幻觉消除技术的研究与应用。在可解释性优化方面,大语言模型内部决策和推理过程通常缺乏透明性和可解释性,这限制了其在关键领域(如医疗)的应用。为了解决这一问题,我们专注于大语言模型的可解释性优化技术,包括缓解模型的捷径行为、构建可靠的可解释AI模型等方面;在幻觉消除方面,大模型在专业领域内的回答会不时生成一些难以分辨的错误,为了防止大模型生成的错误回答误导用户,我们利用富有专业知识的外部模型对大模型的输出进行检测与筛查,也利用该种方法对模型在该领域上的能力进行评价,实现模型在医疗等专业领域内更加可靠的应用。
在研
面向心血管疾病的人机融合会诊系统 (企业合作项目)
基于医学文献的知识验证方法研究(国家自然科学基金项目)
基于跨模态预训练模型的从头药物设计方法研究(黑龙江省自然基金优秀青年项目)
面向脑卒中的人机融合会诊系统(企业合作项目)
基因组学数据分析与解读大模型关键技术与应用(黑龙江省重点研发计划)
面向精准医疗的基因解读大模型关键技术与应用(企业合作项目)
已结束
人机融合医疗会诊关键技术与应用 (国家重点研发:新一代人工智能2030计划)
Prompt数据质量快速提升技术(企业合作项目)
面向肝胆胰专科的病历诊断智能体
医学文献智能体
医学领域一直在不断发展和进步,新的研究成果和临床实践经验往往存在医学文献中,能够帮助医生和研究人员更好地了解疾病的发展机制、诊断方法和治疗策略。因此,从医学文献中获取最新信息来进行知识验证是至关重要的。如下图所示,医学文献智能体旨在检索到与问题相关的文献,根据文献内容回答问题并提供支撑决策的依据。该智能体帮助用户验证和更新他们的知识,以支持更准确的诊断和更有效的治疗。
2025
Investigating the Security Threat Arising from ``Yes-No'' Implicit Bias in Large Language Models
作者:Yanrui Du, Sendong Zhao, Ming Ma, Yuhan Chen, Bing Qin
发表:AAAI 2025
LLMs May Perform MCQA by Selecting the Least Incorrect Option
作者:Haochun Wang, Sendong Zhao, Zewen Qiang, Nuwa Xi, Bing Qin, Ting Liu
发表:COLING 2025
2024
MoGU: A Framework for Enhancing Safety of Open-Sourced LLMs While Preserving Their Usability
作者:Yanrui Du, Sendong Zhao, Danyang Zhao, Ming Ma, Yuhan Chen, Liangyu Huo, Qing Yang, Dongliang Xu, Bing Qin
发表:NIPS 2024
CMCOQA: A Chinese Medical Complex Open-Question Answering Benchmark
作者:Zijian Li, Sendong Zhao, Haochun Wang, Haoming Xu, Bing Qin, Ting Liu
发表:BIBM 2024
Probing the Dual Logic Ability of Privatized Medical-Domain LLMs
作者:Yanrui Du, Sendong Zhao, Muzhen Cai, Ming Ma, Danyang Zhao, Jiawei Cao, Bing Qin
发表:BIBM 2024
AS-ES Learning: Towards Efficient CoT Learning in Small Models
作者:Nuwa Xi, Yuhan Chen, Sendong Zhao, Haochun Wang, Bing Qin, Ting Liu
发表:ACL 2024
MolTailor: Tailoring Chemical Molecular Representation to Specific Tasks via Text Prompts
作者:Haoqiang Guo, Sendong Zhao, Haochun Wang, Yanrui Du, Bing Qin
发表:AAAI 2024
From Artificially Real to Real: Leveraging Pseudo Data from Large Language Models for Low-Resource Molecule Discovery
作者:Yuhan Chen, Nuwa Xi, Yanrui Du, Haochun Wang, Jianyu Chen, Sendong Zhao, Bing Qin
发表:AAAI 2024
Manifold-based Verbalizer Space Re-embedding for Tuning-free Prompt-based Classification
作者:Haochun Wang, Sendong Zhao, Chi Liu, Nuwa Xi, Muzhen Cai, Bing Qin, Ting Liu
发表:AAAI 2024
Knowledge-tuning Large Language Models with Structured Medical Knowledge Bases for Trustworthy Response Generation in Chinese
作者:Haochun Wang, Sendong Zhao, Zewen Qiang, Zijian Li, Chi Liu, Nuwa Xi, Yanrui Du, Bing Qin, Ting Liu
发表:ACM Transactions on Knowledge Discovery from Data (ACM TKDD)
2023
UniCoRN: Unified Cognitive Signal ReconstructioN bridging cognitive signals and human language
作者:Nuwa Xi, Sendong Zhao, Haochun Wang, Chi Liu, Bing Qin and Ting Liu
发表:ACL 2023
Less Learn Shortcut: Analyzing and Mitigating Learning of Spurious Feature-Label Correlation
作者:Yanrui Du, Jing Yan, Yan Chen, Jing Liu, Sendong Zhao, Hua Wu, Bing Qin
发表:IJCAI 2023
Make Your Decision Convincing! A Unified Two-Stage Framework: Self-Attribution and Decision-Making
作者:Yanrui Du, Sendong Zhao, Haochun Wang, Yuhan Chen, Rui Bai, Zewen Qiang, Muzhen Cai, Bing Qin
发表:EMNLP 2023
2022
Structural and Textual Information Fusion for Symptom and Disease Representation Learning
作者:Sendong Zhao, Meng Jiang, Bing Qin, Ting Liu, ChengXiang Zhai, Fei Wang
发表:IEEE Transactions on Knowledge and Data Engineering (IEEE TKDE)
Biomedical Evidence Engineering for Data-driven Discovery
作者:Sendong Zhao, Aobo Wang, Bing Qin, Fei Wang
发表:Bioinformatics
Prompt Combines Paraphrase: Teaching Pre-trained Models to Understand Rare Biomedical Words
作者:Haochun Wang, Chi Liu, Nuwa Xi, Sendong Zhao, Meizhi Ju, Shiwei Zhang, Ting Liu
发表:COLING 2022
Recent Advances in Biomedical Literature Mining
作者:Sendong Zhao, Chang Su, Zhiyong Lu, Fei Wang
发表:Briefings in Bioinformatics