1.引言
哈尔滨工业大学社会计算与交互机器人研究中心文本生成组(HIT-SCIR-TG)推出的航天知识大模型“风筝”迎来 2.0 版本更新。本次升级不仅显著增强了模型的多语言航天知识理解与推理能力,还同步推出了面向公众与工程人员的卫星硬件百科推送系统,进一步打通“专业数据—智能模型—精准推送”之间的链路。
风筝 2.0 在持续强化中文能力的基础上,正式支持中英文航天知识协同建模,能够更高效地理解国际航天资料、技术报告与前沿研究成果;而新上线的卫星硬件百科系统,则将复杂的工程参数与专业描述转化为直观、可信、可查询的知识信息,帮助用户快速理解卫星系统中的关键硬件与应用场景。本次发布标志着风筝从“航天知识问答模型”进一步演进为“模型能力 + 行业知识服务”的综合航天智能平台。

2. 风筝 2.0:面向多语言场景的航天知识大模型升级
风筝 2.0 基于通义千问最新一代模型 Qwen3 进行领域后训练与能力增强而来。在继承 Qwen3 通用语言理解与推理能力的基础上,风筝 2.0 通过系统性的航天领域数据注入与训练策略设计,进一步强化了模型在专业知识理解、复杂问题推理以及跨语言航天问答方面的表现。
2.1 多语言高质量数据采集
在风筝 2.0 的研发过程中,模型的数据基础实现了全面升级。相较 1.0 版本,风筝 2.0 将语言能力从中文拓展至中英文双语,并显著拓宽了航天知识覆盖范围。研发团队系统采集并整理了大规模多语言航天专业数据,内容涵盖航天发展历史、航天器设计原理、轨道与动力学、以及前沿技术研究等方向。同时,引入了结构化的卫星硬件百科数据,数据来源多个国际公开平台,覆盖 9000 余件卫星子系统与硬件单元的关键参数和技术规格。

此外,模型还吸收了大量高质量航天期刊数据,其中中文文献 2 万余篇,英文文献 1 万余篇。最终,风筝 2.0 的训练语料规模扩展至 52 万余条,形成了一个跨语言、跨层级、覆盖工程细节与理论知识的航天知识体系。
2.2 双阶段知识注入
风筝 2.0 延续并优化了两阶段训练策略。 在第一阶段,模型重点学习航天领域的事实性与科学性知识,通过中英文航天知识库,将大量专业信息稳定注入模型参数中,夯实领域基础。 在第二阶段,训练重点转向模型的指令理解与多轮交互能力。该阶段使用了 Infinite-Instruct 数据集,以及基于高质量航天文档生成的中英文问答数据,使模型在复杂问题解析、跨语言问答和连续对话中表现更加稳定。
2.3 模型评测
为系统评估模型升级效果,团队构建了全新的中英文航天知识评测体系,覆盖单知识点问答与多知识点综合推理等多种任务形式。评测结果显示,风筝 2.0 在中文航天知识理解方面持续提升,在准确性、覆盖度和逻辑一致性上均优于 1.0 版本。与此同时,其英文能力达到行业领先水平:在中英文双语评测基准中,风筝 2.0 相较 Qwen3-8B 的平均性能提升达 12.63%,展现出优异的跨语言知识迁移能力。

3. 卫星硬件百科推送系统
在风筝 2.0 模型能力的支撑下,我们同步推出了卫星硬件百科推送系统,致力于将分散、复杂的卫星工程数据转化为结构清晰、易于理解的知识服务。
系统能够理解用户以自然语言提出的需求,例如“适合高温环境的卫星硬件单元有哪些?”,并基于真实工程数据,给出参数对比、适用场景说明以及型号参考,提供接近航天工程师视角的知识解读。
3.1 高质量卫星硬件数据的采集
为确保输出内容具备工程参考价值,系统底层接入了大量真实来源的航天工业数据。团队系统性整合了来自国外主流硬件数据库的信息,覆盖结构、热控、电源、姿轨控、测控与数据管理等多个关键子系统。
针对不同数据源格式不统一、描述方式差异较大的问题,系统通过标准化处理流程,对硬件参数、技术指标与厂商信息进行统一整理与归类,最终形成了覆盖 9000 余条硬件单元的高可信本地知识库。这一数据底座为后续的智能检索与内容生成提供了可靠保障。
3.2 检索增强生成强化
在实际使用场景中,用户的需求往往并不严谨,甚至带有模糊指代或复合条件。针对这一特点,卫星硬件百科系统引入了面向航天领域的智能检索增强机制,并与航天科普问答助手融合。
系统能够结合上下文理解用户意图,对诸如“它的功耗是多少?”、“这种设备适合什么轨道?”等表述进行自动澄清,并将复杂需求拆解为多个子问题分别检索。
在生成最终响应内容前,系统会对检索到的候选数据进行多轮筛选与一致性校验,仅将与当前需求高度相关的真实参数输入模型进行生成。输出内容严格以数据库中的事实信息为依据。
当系统发现数据库中不存在满足条件的硬件单元时,会明确提示“暂无相关数据”,而不是生成看似合理但缺乏依据的答案,从机制上避免不可信信息的产生。

3.3 系统演示
在系统演示中,当用户咨询“硬件设备中常用的星载计算机有哪些”时,系统能够自动给出不同类别硬件的关键性能指标、典型应用场景及参考链接,帮助用户在短时间内建立起对相关工程方案的整体认知,读者可以访问 http://175.102.130.94:8501/ 进行试用。


通过风筝 2.0 与卫星硬件百科推送系统的协同,我们希望让航天工程知识不再局限于专业文档与工程团队内部,而是以更加开放、直观的方式服务更广泛的人群,真正打通航天知识传播与应用的“最后一公里“。
4. 参与人员
指导教师:冯骁骋教授、秦兵教授
项目主要开发者:马伟涛、张慧怡、赵帅博、刘慧新、沈翃宇(以上排名不分先后)

