哈工大主页
首页
中心概况
成员介绍
科研队伍
决策智能(DI组)
近期新闻
成员介绍
发表论文
科研项目
联系我们
问答系统(QA组)
语言分析(LA组)
对话技术(DT组)
知识挖掘(KM组)
文本生成(TG组)
情感计算(SC组)
近期新闻
成员介绍
发布物
科研项目
加入我们
健康智能(HI组)
脑智计算(BC组)
科研项目
发表论文
技术资源
演示系统
中心新闻
你的位置:
首页
中心新闻
中心新闻
Transformer架构是MoE模型的理想选择吗?探究配套架构对MoE模型基础能力的影响
论文名称:How does Architecture Influence the Base Capabilities of Pre-trained Language Models? A Case Study Based on FFN-Wider and MoE Transformers 论文作者:陆鑫,赵妍妍,秦兵,霍亮宇,杨青,许冬亮 (NeurIPS 2024)
了解详情
哈工大SCIR《自然语言处理:基于大语言模型的方法》一书出版
声明:本文转载自哈尔滨工业大学计算学部公众号编者按:由哈工大社会计算与交互机器人研究中心车万翔教授主笔,研究中心毕业生郭江博士、崔一鸣博士参与编写,哈工大副校长刘挺教授主审的《自然语言处理:基于大语言模型的方法》一书正式出版。由赛尔实验室(SCIR)车万翔教授、郭江博士、崔一鸣博士编写,电子工业出版社博文视点出版的《自然语言处理:基于大语言模型的方法》一书正式上架。(u.jd.com/6aTcBrL)近年来,以ChatGPT为代表的大语言模型的兴起,已成为 NLP 研究的新范式。本书基于2021年出版的《自然语言处理:基于预训练模型的方法》之上,进一步扩充添加了大语言模型相关的技术内容,介绍了大语言模型(LLM)在自然语言处理(NLP)领域的应用,结合理论与实践,帮助读者掌握最新技术。本书涵盖 NLP 和深度学习的基础知识、预训练语言模型的核心技术及其应用,以及大语言模型的预训练方法、适配、应用和评估策略,同时介绍基于 LLM 思想的前沿技术,并以 DeepSeek 系列模型为例解析最新进展。本书既适合具有一定机器学习基础的高等院校学生、研究机构的研究者,以及希望深入研 究自然语言处理
了解详情
计算学部赵妍妍教授受邀为昌黎县全县教师解锁大模型时代下DeepSeek技术及其应用
声明:本文转载自哈尔滨工业大学计算学部公众号3月14日,计算学部赵妍妍教授受河北昌黎第一中学邀请,为昌黎县全县教师作了题为《大模型时代下DeepSeek技术及其应用》的专题讲座。各校教师代表齐聚一堂,共同探索智能技术与教育融合的新路径。赵妍妍为计算学部教授、博士生导师,研究方向为大语言模型、情感计算、社会计算,目前担任中国中文信息学会情感计算专委会委员、社会媒体处理专委会委员,曾获黑龙江省科技进步一等奖、黑龙江省科技进步二等奖等多项重要荣誉。讲座中,赵妍研教授深入浅出地介绍了DeepSeek平台的功能与操作,并通过案例讲授了DeepSeek是什么、会什么、怎么用等;围绕DeepSeek在信息收集、资料整理、内容创作等方面的应用展开详细讲解,有效提升了老师们对DeepSeek应用的认知和实践能力。赵妍妍教授还向老师们介绍了神秘而强大的Manus。Manus拥有具备超强学习能力和卓越适应性的“数字大脑”,能够真正像人类一样进行思考和行动。它可以完全独立自主地完成从规划到执行的全流程任务,淋漓尽致地展示了真正的Agent能力。这一前沿技术的分享,进一步拓宽了大家的视野,让老师们得以接触到更多
了解详情
从自我进化视角出发,全面解析LLM的推理能力技术演进路径
声明:本文转载自机器之心公众号论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接:https://www.researchgate.net/publication/389209259_A_Survey_on_Complex_Reasoning_of_Large_Language_Models_through_the_Lens_of_Self-Evolution?channel=doilinkId=67b8b5b0207c0c20fa9111fbshowFulltext=true仓库链接:https://github.com/cs-holder/Reasoning-Self-Evolution-Survey1. 引言在人工智能领域,大型语言模型的复杂推理研究正成为学术界和工业界关注的焦点。随着 OpenAI 的 O1 以及后续 DeepSeek R1 等突破性成果的发布,这一领域的研究热度持续升温,引发了广泛的学术讨论和实践探索。这些里程碑式的研究成果不仅推动了相关技术的快速发展,也激
了解详情
计算学部携手黑龙江省疾控局 用AI为公共卫生筑牢“智慧防线”
声明:本文转载自哈尔滨工业大学计算学部公众号
了解详情
论文浅尝 | 迈向更全面的多模态大模型:多模态大模型如何突破模态与任务限制?(哈工大SCIR)
声明:本文转载自开放知识图谱公众号论文链接:https://arxiv.org/abs/2412.11694仓库链接:https://github.com/threegold116/Awesome-Omni-MLLMs1. 引言不断发展的多模态大语言模型(MLLMs)展现了实现通用人工智能的潜力,其通过将大语言模型与特定模态的预训练模型结合,扩展了单一非语言模态的理解与生成能力,例如视觉MLLMs、音频MLLMs和3D-MLLMs。然而,这些特定模态MLLMs(Specific-MLLMs)难以应对现实场景中涉及多模态的复杂任务,因此研究者正致力于扩展模态范围,推动全模态MLLMs(Omni-MLLMs)的发展。为了应对现实场景中的复杂任务,越来越多的研究者将目光投向了全模态大语言模型(Omni-MLLMs),其旨在实现全模态的理解与生成。Omni-MLLMs通过整合多种非语言模态的预训练模型,在Specific-MLLMs的基础上扩展了理解和生成能力。其利用大语言模型的涌现能力,将不同非语言模态视为不同“外语”,在统一空间内实现跨模态信息的交互与理解。与Specific-MLLMs相
了解详情
每页
6
记录
总共
535
记录
第一页
<<上一页
下一页>>
尾页
页码
2
/
90
跳转到
最近更新
2025-04-07
科技日报推出报道《“Al+科研”,科研范式革命真的来了?》,哈工大人工智能学院执行院长张伟男:复合型人才培养是关键!
2025-04-07
哈工大SCIR赵森栋副教授在CCDE 2025大会报告《从辩论决策到主动预防:医学大模型驱动的医疗与疾控体系智能化跃迁》
2025-04-07
哈尔滨SCIR冯骁骋教授受邀为中共哈尔滨市委党校作《大模型原理、技术与应用——从ChatGPT到DeepSeek》专题讲座
2025-04-02
哈工大|PPT公开!“DeepSeek技术前沿与应用”专题讲座,1小时快速掌握DeepSeek基本原理
2025-03-31
秦兵教授牵头国家自然科学基金人工智能专项重点项目《大模型情感感知与认知调控》启动会召开