对话技术(DT组)

2017年06月15日

对话技术组（Dialogue Technology）

对话技术组（Dialogue Technology，DT），组长：张伟男

对话技术组（Dialogue Technology，DT）主要研究方向包括社交媒体多智能体和具身智能。具体研究点包括主题可控生成、角色化对话生成、检索增强大模型、大模型攻击与安全、论辩挖掘与生成、内容推荐、具身多模态大模型、交互学习、持续学习。在ACL、WWW、AAAI、IJCAI等CCF A类顶级国际会议上发表论文多篇。DT组主导研发了聊天机器人“笨笨”，曾获“合创杯”第二届全国青年人工智能创新创业大会三等奖，中国人工智能学会最佳青年技术成果奖。

毕业生分布情况

指导老师

刘挺

教授

张伟男

教授 | 组长

李洋

讲师 | 兼职

社交媒体多智能体研究方向

具身智能研究方向

智能人机对话系统“笨笨”
聊天机器人技术开放平台-CTP
活字2.0
活字-日新
具身智能
社交媒体多智能体

智能人机对话系统“笨笨”

笨笨

笨笨是由实验室DT组主导研发的一款面向普通用户的聊天机器人，主要提供一对一的聊天功能以及其他生活服务及问答功能，2016年6月6日正式对外发布，搭载于微信公众号平台之上，同时具备实体形态。2019年4月笨笨的开放域对话功能上线到科大讯飞AIUI平台，对外提供服务，上线至今，平均每月调用6千万次。笨笨对话系统及其相关应用曾获“合创杯”第二届全国青年人工智能创新创业大会三等奖、中国人工智能学会最佳青年技术成果奖、吴文俊人工智能科技进步奖二等奖，相关研究成果发表在ACL等国际顶级会议。

笨笨架构

笨笨目前具备的功能

闲聊

基于检索技术和回复生成技术，跟用户进行单轮无目的的闲聊。

属性回复

回复用户关于机器人姓名、年龄、性别等属性方便的问题。

饮食推荐

为用户推荐地方特色小吃等。

指代消解

在聊天过程中，对于本轮中使用的代词根据上一轮输入中的实体进行消解。

实体查询

如果用户输入是以“你知道XXX吗”之类的问题，会返回查询到的相关知识。

情感回复

对用户的情感进行抚慰。

指令执行

协助用户完成“订机票”、“订火车票”和“查询公交”任务。

知识问答

用户可以对一些常识进行提问，笨笨会返回相应问题的答案。

新闻推荐

用户输入新闻推荐，笨笨首先询问用户想要看新闻的类别。再用户返回之后，为用户推荐对应类别下的新闻。同时，用户可以不断再来一条持续看，或者切换新闻的类别。

古文回复

触发词“笨笨古文”。在古文回复功能中，笨笨会采用古文回答用户的输入。

笨笨古诗

触发词“笨笨古诗”。“笨笨”对作诗很感兴趣，背了很多首古诗。现在的“笨笨”可是一个大诗人，能陪您玩诗词成语、诗词九宫格、古诗词补全、诗词飞花令、诗词接龙等五个游戏。

猜谜语

触发词“猜谜语”。中国的谜语文化源远流长，距今已经有三千多年的历史了。经过历代发展，又形成了灯谜、字谜、动物谜语等。谜语是一项饶有趣味的文字游戏，往往需要一定的想象力才能分析推理出谜底。现在的笨笨能够陪您玩猜谜游戏了！

成语接龙

触发词“成语接龙”。笨笨最近对成语很感兴趣，在假期偷偷学会了三万多个成语，现在的笨笨能够陪您玩【成语接龙】游戏了。

笨笨聊小说

触发词“笨笨聊小说”。用户可以指定用户扮演小说中的一个角色。笨笨会根据角色的信息回答用户的问题。

脑筋急转弯

触发词“脑筋急转弯”。笨笨可以和用户进行脑筋急转弯的游戏。用户回答不了时，可以请求提示。

聊天机器人技术开放平台-CTP

CTP简介

聊天机器人技术开放平台（Chatbot Technology Platform，CTP）测试版是基于哈工大SCIR自主研发的笨笨机器人核心技术及框架开发，CTP测试版旨在开放我们已有的研究技术，希望能够最大化这些技术的利用价值，同时方便普通用户和开发者创建或者开发专属机器人。

CTP链接

快去创建你的专属机器人吧！项目地址

多技能闲聊机器人demo

兵马俑虚拟人demo

党建机器人demo

大语言模型活字2.0

活字2.0简介

活字系列是由哈工大自然语言处理研究所多位老师和学生参与开发的一个开源可商用的大规模预训练语言模型。活字2.0通过人类反馈的强化学习（RLHF）进一步优化了模型回复质量，使其更加符合人类偏好。相较于上一个版本平均长度明显提高，遵从指令的能力更强，逻辑更加清晰。

活字2.0创新点：

更好的回复：活字2.0的回复具有更好的模式，回复平均长度明显提高，指令的能力更强，逻辑更加清晰；
融合多种trick的稳定PPO训练，训练更加稳定高效：训练过程中保持数据分布一致、训练过程中进行Reward Shaping、Actor权重滑动平均；
多维度标注的中文偏好数据，精确建模人类偏好：Instruction标注是否具有诱导性、针对每条回复从有用性、真实性和无害性三个维度打分、综合考虑Instruction类别和回复质量的偏好排序。

实现路径

活字2.0实现路径

活字2.0与活字1.0对比

活字-日新

活字-日新简介

基于我们提出的检索增强框架和活字2.0，检索多种外源知识并通过拒绝采样和奖励模型打分，赋予了活字检索并利用外源知识的能力，使活字在事实性和时效性问题上有稳定的提升。实现了基于检索增强的中英文多轮对话。

使用示例

2025年亚冬会在哪举办？

今年春晚的魔术谁的两张牌没有合到一起？

具身智能

具身智能简介

具身智能是一种基于物理身体进行感知和行动的智能系统，其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动，从而产生智能行为和适应性。与非具身的人工智能相比，具身的人工智能具有主动性和交互性。

NAO机器人演示

小车导航演示

仿真环境下任务规划

社交媒体多智能体相关成果

技术简介

预训练语言模型具有强大的语言理解和生成能力，然而在特定场景的应用中仍需要进一步调整模型的行为以适配具体需求。我们探索如何利用大模型面向特定场景进行主题可控和角色化的内容生成。综合使用多种前沿的大模型相关技术，我们训练和部署的模型能够针对特定话题，以符合特定角色属性的风格进行观点生成和对话式的生成。

关键技术

指令微调、克服灾难性遗忘、上下文学习、检索增强

技术效果

主题可控生成

利用微博语料构造发帖任务的指令数据，采用高效微调的方式训练发帖模型

采用检索增强的方式实时获取主题相关信息，辅助生成强时效性，内容丰富的文本

角色化对话

利用特定角色的大量对话数据，结合背景知识等信息，进行角色化对话模型训练

以独立模块微调单个角色，通过动态加载方式，在低资源下实现多角色实时调度

<!--