花椒文章网 手机版
您的位置: 首页 > 实时讯息 >

【2025数博会】华为这样解决单芯片算力差距短板

0次浏览     发布时间:2025-08-29 16:43:00    

8月29日,2025数博会“算力聚势 智能未来”交流活动在贵阳国际生态会议中心举行。在圆桌对话环节,华为数字政府系统部CTO马华民解释了华为为何要推出CloudMatrix 384超节点集群。


一是整个大模型的发展趋势,从小模型到大模型,从短序列到长序列,单模态到多模态,而且还是从快应答到深度思考。首先是需求的驱动力作为驱动去开发一个新的形态。另外,依托国内半导体的支撑,华为从2019年就进入了实体清单,华为很多的芯片只能是设计出来,但是生产加工不出来。所以这也导致华为现在芯片单颗的算力和国外先进的厂商还有一定的差距,这个差距在短时间内还无法突破。为了弥补当前的短板,华为推出了384超节点的架构,通过系统化的功能传递,来满足当前国内国外的需求。

另外,华为384节点有16个机柜,其中12个机柜是算力节点,4个是网络机柜,通过4个网络机柜把12个机柜里面进行全光互联,实现了384颗芯片成为了一体机,真正成为一个服务器,保证了可以实现卡和卡之间的时延达到了150纳秒左右。而为什么要做384颗,是因为英伟达提出72个节点,华为一定要超越对手,推出384节点这个集群是英伟达的1.67倍,而且华为的带宽时延比他还要低。但是随着技术的演进,华为还在规划更大颗数的集群。

据悉,华为推出的CloudMatrix 384超节点集群,通过新型高速互联总线实现384张卡互联成为一个超级云服务器,单集群算力规模最高可达300P(超业界67%),训练效率提升至41%以上,并显著降低模型训练成本。

记者 李奕璇