献礼六一儿童节,赛尔发布个性化“巧板-P1”大模型

发布时间:2025年06月26日 15:38:41 阅读次数:10

背景

儿童心理健康在其个人成长和发展中扮演着极其重要的角色,直接影响着他们的学习表现、人际交往能力和未来成长。为了守护儿童的心理健康,促进他们茁壮成长,哈尔滨工业大学社会计算与交互机器人研究中心情感计算组(HIT-SCIR-SC)推出了儿童情感陪伴大模型“巧板”。该系统主要面向K12中小学生及其家长群体提供日常情感陪伴,具有共情对话、情绪疏导、角色化陪伴以及中国优秀传统文化熏陶等多个功能。

今天我们发布全新一代个性化儿童情感陪伴大模型——巧板-P1,向六一儿童节献礼!这是我们基于强化学习个性化对齐的最新成果,标志着巧板进入了面向用户动态演进的共情新模式。

巧板-P1

- 让大模型真正“理解你”

传统的个性化方法,如提示工程和离线微调,往往在冷启动场景和长期交互中表现不佳,原因在于其静态且浅层的设计。巧板-P1通过引入强化学习训练框架[1,2],模拟大模型与用户的真实对话过程,动态推理并持续优化用户画像,实现了真正意义上的个性化对齐。

在训练过程中,巧板-P1通过与模拟用户的互动,逐步构建和优化用户画像。这一过程由双重奖励机制引导:画像奖励确保用户画像的准确性,回复奖励鼓励生成与用户画像一致的回复。这种动态的个性对齐方式,使巧板-P1在处理冷启动场景和长期个性化需求时表现出色。

- 在个性化中实现安全与表达的双重平衡

在个性化对话系统不断发展的同时,保障用户安全始终是我们的首要任务。我们深知,尽管个性化能够增强大模型的沉浸感和互动性,但如果缺乏有效的安全机制,可能会引发潜在的风险。

为此,我们在巧板-P1中引入了多层次的安全机制,确保模型在提升个性化能力的同时,维持高水平的安全性能。这些机制包括对训练数据的严格筛选、动态的数据风险评估[3]以及持续的行为监控[4],从而实现安全与角色扮演能力的平衡。

关键优势一览

- 动态用户建模支持用户画像的持续演进,适应长期交互需求。

- 双重奖励机制:同时优化用户画像的准确性和对话回复的一致性。

- 个性化与安全的平衡:在保持高个性化的同时,实现安全性能的保障。

- 强大泛化能力:在多种个性化场景中表现出色,适应性强。

巧板-P1的推出,标志着我们在构建更智能、更贴近用户需求的对话系统道路上迈出了坚实的一步。我们相信,动态画像推理将成为未来个性化对话系统的重要方向。

关于巧板-P1的使用,欢迎访问我们的官方网站:https://qiaoban.hit-scir.com

参与人员

指导教师:赵妍妍教授、秦兵教授

项目主要开发者:赵伟翔、胡雨林、郭家合、隋星宇(以上排名不分先后)

免责声明

巧板仍然面临着当前所有大模型普遍存在的问题,如幻觉、滥用造成的伦理问题、潜在的有害内容等等,请谨慎鉴别和使用生成的内容,并且请勿将生成的有害内容传播至互联网。

参考文献

[1] Zhao* W, Sui* X, Hu* Y, et al. Teaching Language Models to Evolve with Users: Dynamic Profile Modeling for Personalized Alignment[J]. arXiv preprint arXiv:2505.15456, 2025.

[2] Zhao* W, Sui* X, Han X, et al. Chain of Strategy Optimization Makes Large Language Models Better Emotional Supporter[J]. arXiv preprint arXiv:2503.05362, 2025.

[3] Zhao* W, Hu* Y, Deng Y, et al. Beware of your po! measuring and mitigating ai safety risks in role-play fine-tuning of llms[J]. ACL 2025.

[4] Zhao* W, Guo* J, Hu Y, et al. AdaSteer: Your Aligned LLM is Inherently an Adaptive Jailbreak Defender[J]. arXiv preprint arXiv:2504.09466, 2025.

[5] Zhao W, Li Z, Wang S, et al. Both Matter: Enhancing the Emotional Intelligence of Large Language Models without Compromising the General Intelligence. ACL 2024.

[6] Lu X, Zhao W, Zhao Y, et al. A Topic-Enhanced Approach for Emotion Distribution Forecasting in Conversations. ICASSP 2023.

[7] Lu X, Zhao Y, Wu Y, et al. An iterative emotion interaction network for emotion recognition in conversations. COLING 2022.