中国科大大模型并行训练系统研究成果荣获IEEEICCD2025唯一最佳论文奖


近日,在美国达拉斯举行的第43届IEEE国际计算机设计会议(IEEE International Conference on Computer Design, ICCD 2025)上,我校计算机科学与技术学院与新加坡国立大学、阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)、山西大学以及合肥综合性国家科学中心人工智能研究院合作发表的论文《DHeLlam: General-Purpose, Automatic Micro-batch Co-execution for Distributed LLM Training》荣获大会“唯一最佳论文奖”(Best Paper Award)。

随着大语言模型参数量不断增加,分布式训练效率面临前所未有的挑战。尽管现有训练框架已在计算层面高度优化,但在实际部署中,通信瓶颈仍严重制约了GPU浮点运算资源的利用率。针对这一关键问题,研究团队受DNA双螺旋结构启发,创新性地提出双流并行叠加系统——DHeLlam。DHeLlam的核心在于其“链式交织”机制:将单个GPU上连续处理的训练微批次视为两条交织的数据链,并通过算子级重叠分析与动态规划搜索,自动地协同调度前向传播与反向传播过程。该方法首次在无需复制模型参数的前提下,实现了两个微批次的高效并行执行,有效掩盖了高昂的通信开销。尤为突出的是,DHeLlam具备卓越的通用兼容性,可无缝集成至各类主流并行策略中,包括数据并行、张量模型并行、上下文并行,乃至复杂的流水线并行,显著提升分布式LLM训练的整体效率。为业界大规模的LLM训练提供了一种更加通用、高效的通信优化方法。
ICCD是由国际电气与电子工程师协会(IEEE)主办的权威国际学术会议,也是中国计算机学会(CCF)推荐的B类国际会议,拥有悠久的创办历史与深厚的学术积淀。多年来,该会议始终聚焦于计算机体系结构、硬件加速技术以及系统软件等关键交叉领域,是全球相关研究方向的重要交流平台与风向标。
本论文第一作者为中国科学技术大学博士研究生王海权与新加坡国立大学博士后阮超逸(共同一作),通讯作者为中国科学技术大学李诚副教授。其他作者包括MBZUAI马晓松教授、中国科大博士生贺嘉、硕士生阮家齐,以及山西大学硕士生唐承捷。该研究得到了科技部重点研发计划子课题、安徽省高校协同创新项目等经费支持。合肥综合性国家科学中心人工智能研究院信息计算平台为系统研发与原型测试提供了智能算力支持。
获奖论文及相关信息已发布于ICCD 2025官方网站:
https://www.iccd-conf.com/home.html
(计算机科学与技术学院、科研部)
本文链接:http://knowith.com/news-1-13349.html中国科大大模型并行训练系统研究成果荣获IEEEICCD2025唯一最佳论文奖
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
辽宁考研机构实力排名?大连理工大学盘锦校区海洋工程研究生怎么样
水利水电工程考研院校(水利水电工程考研院校排名)
英语专业考研科目(仙桃电大是专科吗)
宾夕法尼亚大学教育学院硕士(宾夕法尼亚大学教育学院硕士学费)
英语比较好的培训机构 渭南师范学院研究生有哪些专业
普通二本考研还是考公务员(二本选择考研还是考公)
2015经济学考研:西方经济学模拟试题一
重庆永川区大学(重庆市永川景圣中学录取分数2023)
长沙最出名的考研培训机构 湖南长沙研究生培训机构有哪些
考研时候包放哪里_考研时包放在哪里
持之以恒:2024花呗现在怎么提现出来(推荐十个操作步骤)
秒懂:京东白条额度可以套出来吗-本文详细讲解过程步骤
湘潭“问题泥鳅”案被通报:药残超10倍9人被抓,涉案金额逾7千万
分享:东白条提现秒到方法(分享三个操作方法)-知者
励精图治:羊小咩额度怎么提现(分享4个提现方法)
顶天立地:成都郫都区上门信用卡垫还使用实操流程公布
积极进取:DY月付是怎么套出来的,教你6个常见的方法
分期乐购物额度自己如何套出来,提现出来的方法介绍
分期乐怎么套出现金-五个最新操作方法
总结:京东白条有办法套出来吗(最新秒到方法今日看点)-知者