哈工大发布“珠算”代码大模型 目前开源代码大模型提升编程能力的同时会严重损害通用语言能力。为此,哈工大赛尔实验室推出了“珠算”代码大模型,以2.7B参数在代码与通用语言平均性能上超越了3B及以下代码大模型,希望通过开放权重、训练细节及微调适配平台与插件,助力开源社区发展 2024-09-17
哈工大开源“活字3.5”对话大模型 哈工大社会计算与信息检索研究中心(HIT-SCIR)发布了活字3.5对话大模型,新版模型在中英文知识、数学推理、代码生成、指令遵循能力、内容安全性等诸多方面实现了性能提升。我们希望该开源项目能够有助于推动自然语言处理技术的研究和应用。 2024-09-12
哈工大开源“活字”对话大模型3.0版本 哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)近期推出了最新成果——活字3.0,致力于为自然语言处理的研究和实际应用提供更多可能性和选择。 2024-02-15
HIT-SCIR发布首个中文扩词表增量预训练混合专家模型Chinese-Mixtral-8x7B 哈工大社会计算与信息检索研究中心(HIT-SCIR)基于Mixtral-8x7B进行了中文扩词表增量预训练。扩充后的词表显著提高了模型对中文的编解码效率,通过大规模开源语料对扩词表模型进行增量预训练,使模型具备了强大的中文生成和理解能力。 2024-01-18
哈工大自然语言处理研究所公开《ChatGPT调研报告》,内测哈工大“活字”对话大模型 2023年3月6日,哈工大自然语言处理研究所 ( HIT-NLP, since 1979 ) 师生联合撰写出《ChatGPT调研报告》(84页),对“大模型”技术进行了系统的介绍。此外,哈工大自然语言处理研究所已经研制出哈工大“活字”对话大模型(通用),目前处于研究所内测阶段。 2023-05-04
LTP 4.0!单模型完成6项自然语言处理任务 语言技术平台(Language Technology Platform, LTP)是哈工大社会计算与信息检索研究中心(HIT-SCIR)历时多年研发的一整套高效、高精度的中文自然语言处理开源基础技术平台。该平台集词法分析(分词、词性标注、命... 2020-06-15
哈工大讯飞联合实验室研制的文本顺滑技术成功接入“讯飞听见”系统 科大讯飞2016年度发布会于2016年11月23日在北京国家会议中心成功召开,升级版的“讯飞听见”系统亮相此次发布会。讯飞在2015年的年度发布会就已推出实时语音转写的“讯飞听见”智能会议系统,实时将语音转写成文字,速度和准确率远超人工速记... 2017-01-10