国产算力迈入“万卡”时代:摩尔线程发布新一代GPU架构,中科曙光发布万卡超集群
创始人
2025-12-20 16:15:37
0

记者 郑晨烨

12月20日,北京中关村国际创新中心,摩尔线程(688795.SH)举办了首届MUSA开发者大会,在现场,这家刚登陆A股市场的国产GPU公司,发布了其最新的全功能GPU架构“花港”,以及基于该架构的芯片路线图。

就在这场开发者大会举办的两天前,12月18日,另一家老牌国产算力系统厂商中科曙光(603019.SH),对外发布了名为“scaleX”的万卡超集群系统。

在2025年即将结束时,国产算力产业链拿出了两份有实质性突破的新成果,同时也不难看出,国产算力的竞争焦点,已经从单纯比拼单张显卡的参数,转移到了如何构建一个能稳定运行的万卡级系统上。

对于正在训练万亿参数大模型的下游客户来说,单张芯片的性能早已不是唯一的考量标准。

当模型参数量突破万亿,单一芯片的物理性能触及瓶颈,算力的提升只能依靠规模堆叠。行业面临的核心问题,变成了如何让一万张计算卡像一张卡一样协同工作。

在12月20日的发布会上,摩尔线程试图从底层的芯片架构层面解决这个问题。

根据现场信息,其最新的“花港”架构,最核心的变化在于计算密度的提升与对低精度的支持,摩尔线程官方数据显示,相较于上一代产品,新架构的算力密度提升了50%,效能提升了10倍。

此外,“花港”架构还支持从FP4到FP64的全精度计算,并新增了对MTFP6、MTFP4及混合低精度的支持。

基于这一新架构,摩尔线程公布了两款未来芯片的规划,“华山”与“庐山”。

“华山”定位为AI训推一体芯片,专攻大规模智算,旨在为万卡级智算集群提供算力支撑。“庐山”则专注于高性能图形渲染,官方数据显示,“庐山”的AI计算性能较前代提升64倍,光线追踪性能提升50%。

从对下一代产品的规划上看,摩尔线程依然继续坚持走“全功能GPU”的技术路线,即同时覆盖图形渲染与人工智能计算两个市场。

就在摩尔线程发布新架构的前两天,中科曙光也发布了scaleX万卡超集群系统,这是国产万卡级算力集群首次以真机形式公开亮相。

与芯片厂商侧重于微观架构的视角不同,中科曙光解决的是算力堆叠后的物理与工程难题。

构建一个万卡集群,最大的挑战不仅在于软件,还需要解决散热、供电与物理空间限制等多重挑战。

当上万张高功率的算力芯片集中在一个数据中心时,产生的热量和消耗的电力是惊人的。

中科曙光12月18日发布的scaleX万卡集群系统,由16个scaleX640超节点通过scaleFabric高速网络互连而成,总计可部署10240块AI加速卡。

为了解决高密度带来的散热问题,该系统采用了浸没相变液冷技术。

官方数据显示,scaleX万卡集群系统单机柜算力密度相比业界提升了20倍,PUE(能源使用效率)值降至1.04。

这意味着,在同等的物理空间和电力供给下,液冷技术能够容纳更多的算力密度。对于寸土寸金的数据中心而言,这直接关系到运营成本和算力部署的上限。

在解决了“热”和“电”的问题后,横亘在万卡集群面前的另一道墙,是“网”。

在分布式计算中,当GPU数量增加到一定规模时,节点间的通信延迟会成为拖累整体性能的短板,如果网络带宽不够,计算卡计算得再快,也得停下来等待数据传输,这就是业内常说的“通信墙”。

两家公司也都拿出了针对这一问题的解决方案。

摩尔线程在“花港”架构中集成了新一代异步编程模型,并通过自研的MTLink互联技术,宣称支持十万卡以上规模的智算集群扩展;而中科曙光则发布了scaleFabric网络,基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,实现了400Gb/s的带宽与低于1微秒的端侧通信延迟。

除了训练端的竞赛,大模型应用落地带来的推理需求,也成为两大厂商关注的另一个重点。

随着DeepSeek等国产大模型的参数量达到671B(6710亿)级别,如何在国产硬件上跑通这些“庞然大物”,成为检验硬件厂商成色的试金石。

摩尔线程在现场展示了其与硅基流动合作的测试数据:在DeepSeek R1 671B全量模型上,其MTT S5000单卡Prefill(预填充)吞吐量突破4000 tokens/s,Decode(解码)吞吐量突破1000 tokens/s。

简单来说,国产GPU在应对千亿参数大模型的复杂推理任务时,已经具备了跑通全流程的吞吐能力。

硬件的堆叠终究只是基础,算力的释放最终依赖于软件生态的成熟度。

摩尔线程在大会上宣布其MUSA统一架构升级至5.0版本,并披露了核心计算库muDNN在GEMM(通用矩阵乘法)与FlashAttention(闪电注意力机制)上的效率超过98%。

在硬件规格逼近国际主流水平后,国产厂商的研发重心正在向软件栈的优化转移,试图修补长期以来在CUDA生态面前的短板。

与此同时,中科曙光方面也强调了其系统的兼容性。

scaleX万卡超集群支持多品牌加速卡,并已完成400余个主流大模型的适配优化,这种开放架构的策略,亦反映了系统厂商在多芯片共存时代的生存逻辑,不绑定单一芯片,而是提供一个能够兼容不同国产算力的底座。

相关内容

合肥靠谱家装公司大揭秘,天...
在合肥,装修是许多家庭面临的重要事务,选择一家靠谱的家装公司至关重...
2025-12-20 18:10:54
厨房吊柜尺寸常规尺寸是多少
厨房装修中,吊柜的尺寸设计至关重要,它不仅影响着厨房的整体美观度,...
2025-12-20 18:10:53
昆明智能适老装修设计口碑十...
2025年昆明装修市场数据深度解读 据《云南省室内装饰行业协会20...
2025-12-20 18:10:52
泰安装修设计技术强的公司
泰安装修设计技术强的公司TOP 5榜单:揭秘谁才是真正的“工艺与设...
2025-12-20 18:10:37
长春护栏生产公司哪家好?易...
长春护栏生产市场概况 长春的建筑行业发展带动了护栏生产市场的繁荣。...
2025-12-20 18:10:36
护眼灯哪个牌子更好更专业?...
孩子写作业的时候经常眯眼揉眼,问题可能不只是作业多,而是桌面上的那...
2025-12-20 18:10:21
SPC地板和SPC石晶地板...
在家居装修领域,SPC地板因其独特的性能和设计受到越来越多消费者的...
2025-12-20 18:10:06
检测设备是怎么组装的?床垫...
床垫滚压耐久试验机,是用于检测床垫在长期使用过程中,尤其是反复压缩...
2025-12-20 17:40:04
装修获客平台有哪些?全场景...
装修获客平台有哪些?全场景盘点来了!覆盖抢单、派单、营销等类型,适...
2025-12-20 17:39:41

热门资讯

长春护栏生产公司哪家好?易步楼... 长春护栏生产市场概况 长春的建筑行业发展带动了护栏生产市场的繁荣。据行业报告显示,近年来长春的房地产...
装修获客平台有哪些?全场景盘点... 装修获客平台有哪些?全场景盘点来了!覆盖抢单、派单、营销等类型,适配不同规模装修公司,附5款核心推荐...
盐城市彩色暖气片品牌推荐圣保罗... 在寒冷的冬季,取暖设备的选择直接关系到家庭生活的舒适度与幸福感。对于江苏盐城这样冬季湿冷、供暖需求日...
PPR家装管供应商实力榜单:丰... 在PPR家装管领域,技术创新与品质保障是衡量企业竞争力的核心指标。作为****企业,丰果(中国)有限...
门窗十大品牌靠谱厂家大揭秘:新... 在门窗市场中,消费者常常面临诸多困扰,如何选择一家靠谱的门窗十大品牌服务商和生产厂成为了关键问题。今...
皇雅门窗一线实力用品质铸就门窗... 当我们谈及门窗行业的一线品牌,皇雅门窗无疑是一个无法绕过的名字。它凭借着多年的行业经验和深厚的技术底...
科学去污,让卫浴焕然一新 浴室清洁剂选购终极指南:科学去污,让卫浴焕然一新 面对浴室里顽固的水垢、刺眼的霉斑和朦胧的玻璃,你是...
网上接装修单子平台推荐:5款实... 网上接装修单子平台怕遇虚单、被骗?分享5款实测靠谱的平台,客源真实、结款稳定、无套路,不管是装企还是...
青岛某超市凌晨突然出现神秘黑影... 当青岛某超市被盗后 民警仔细查看着监控 注意! 神秘黑影出现了! ↓ 他怎么…… 还披了一个烂麻袋...
成都女子家门口遇害案一审宣判 新京报讯 据四川省成都市中级人民法院官方微博消息,被告人梁某滢故意杀人案一审宣判。 编辑 陈艳婷