哈工大SCIR发布基于本草大模型与 PICOs-RAG 的体检报告解读助手

发布时间:2025年12月27日 12:36:01 阅读次数:10

近期,哈尔滨工业大学社会计算与交互机器人研究中心健康智能组(HIT-SCIR-HI)正式发布面向体检报告解读场景的智能辅助系统——体检报告解读助手。该系统以本草大模型为核心底座,结合体检报告解析、结构化总结与专业医学证据检索能力,针对健康管理中“信息量大、术语多、解读任务集中、证据检索耗时”等痛点,提供更高效、更可解释、更可追溯的辅助解读支持。

目前,该系统已在哈尔滨工业大学校医院健康管理中心的实际工作流程中上线并开展内部试用与验证。自 2025 年 7 月落地应用以来,已累计辅助解读体检报告 5200 余份,为健康管理服务提供了可落地、可复核的智能化支撑。

面向真实体检场景的关键能力

1)基于本草大模型:更懂医学表达,也更懂“体检报告怎么读”

体检报告解读助手以本草大模型为核心能力底座,针对体检领域高频指标与常见异常组合进行了场景化增强。系统能够在保持专业严谨的同时,输出更便于理解的解释方式,并支持围绕报告内容进行连续追问,帮助用户把零散指标转化为可理解的信息与可执行的建议方向。

用户可获得的典型信息包括:

  • 指标含义与异常项解释 

  • 异常组合的联动理解(例如体重指数 + 血脂异常 + 脂肪肝提示)     

  • 后续建议方向(复查项目、生活方式调整、必要时专科咨询等)

2)支持 PDF 格式体检报告解析:自动识别、结构化呈现

系统支持直接上传 PDF格式体检报告并解析关键内容,提取指标与文本并结构化呈现,同时提供“解析结果预览”,便于核对解析准确性并继续提问,降低人工录入成本,提高解读效率。

图1 :PDF 解析结果预览

3)支持一键生成总结:快速提炼重点与可执行建议

为解决“报告信息量大、难以抓住重点”的问题,系统提供一键生成总结功能:在解析结果基础上自动提炼主要异常项、风险提示与建议方向,帮助快速形成结构化结论,减少重复沟通成本。

生成内容可涵盖:

  • 主要异常项与风险提示 

  • 关键指标组合的联动解释 

  • 推荐复查项目与时间建议 

  • 生活方式调整方向(饮食、运动、作息等) 

  • 必要时的就医建议(如建议咨询相应专科)

图2 :一键生成总结

4)采用 PICOs-RAG 技术检索专业医学文献:让解读“有证据”

为增强回答的专业性与可追溯性,系统引入 PICOs-RAG 技术:将用户问题补全为多个具备 PICO结构的衍生问题,再将衍生问题转化为关键词组合,对PubMed 等权威医学数据库进行检索;随后基于检索到的文献摘要回答衍生问题,并综合生成最终回答。

该机制带来的价值包括:

  • 衍生问题补全贴合证据检索逻辑,提升检索相关性 

  • 证据驱动生成,降低“无依据结论”风险 

  • 引用编号稳定,便于复核与审阅 

图3 :PICOs-RAG流程图 

图4 :PICOs-RAG效果展示

5)引用超链接跳转:点击即可查看PubMed文献来源

系统支持将最终回答中的引用编号自动转换为可点击链接,用户可直接跳转到 PubMed 查看对应文献条目,使“参考来源可验证、可追溯”,也便于专业人员快速复核与深入阅读。

图5 :文献超链接跳转

试用验证:累计辅助解读体检报告 5200 余份

目前,体检报告解读助手已在哈尔滨工业大学校医院健康管理中心进行内部试用与验证,自2025年7月份落地以来,累计辅助解读体检报告 5200 余份。在实践中,该系统主要帮助缓解:

  • 体检季高峰期解读需求集中带来的服务压力 

  • 用户对报告理解不一致导致的反复咨询 

  • 专业问题需要证据支撑但人工检索耗时的问题 

  • 结论表达需要标准化、可复核、可追溯的问题 

展望

哈尔滨工业大学社会计算与交互机器人研究中心健康智能组(HIT-SCIR-HI)将持续围绕健康管理需求迭代系统能力,在保障数据安全与隐私的前提下,进一步提升报告解析覆盖面、证据检索质量与交互体验,拓展更多健康管理场景,推动智能技术更稳健地服务实际健康管理工作。

Demo

在12月23日至1月6日期间,读者可以访问http://43.143.221.174:9008/跳转至体检报告解读助手进行试用,支持上传PDF和md格式文件。正常情况下20页左右的PDF文件解析时间在20秒左右。上传的文件均在本地进行处理,不会发送至任何第三方,如果仍然有隐私方面的担忧,可以提前将敏感信息遮挡或删除。