华为升腾芯片实现算力突破撼动英伟达霸主地位

2025-08-24 来源：中国时报浏览数：224 国际会展网

核心提示：随着5G、生成式AI等新兴应用迅速发展，对数据的传输量与传输速度要求也愈加提高，为了满足高速低延迟的数据传输需求，运用共同封装模块技术（Co-packaged optics；CPO）整合光电元件，使得晶片开发者获得更多通信频宽，不仅能实现高速低延迟的数据传输，而且让传输数据时所消耗的电力也大幅减少，符合当今全球低碳节能的要求，也正因为拥有上述之优势的CPO，将成为下一代高速网通芯片的关键技术之一。

18SZ图片处理

随着5G和AI新技术的快速发展，对于数据传输的速度和效率要求日益提高，能实现高速、低延迟、低功耗数据传输技术的CPO，正成为未来科技发展的关键。

随着5G、生成式AI等新兴应用迅速发展，对数据的传输量与传输速度要求也愈加提高，为了满足高速低延迟的数据传输需求，运用共同封装模块技术（Co-packaged optics；CPO）整合光电元件，使得晶片开发者获得更多通信频宽，不仅能实现高速低延迟的数据传输，而且让传输数据时所消耗的电力也大幅减少，符合当今全球低碳节能的要求，也正因为拥有上述之优势的CPO，将成为下一代高速网通芯片的关键技术之一。

18SZ图片处理

今年在上海举行的世界人工智能大会（WAIC）上，华为升腾384（CloudMatrix 384）超节点真机首次亮相，该系统由384颗升腾NPU，与192颗鲲鹏CPU芯片构建，采用全互连拓墣构架以实现芯片间的数据传输，其算力表现十分突出，能提供高达300PFLOPs的密集BF16算力，接近英伟达GB200 NVL72系统的两倍。此外，CloudMatrix 384在內存容量和频宽方面也具有显著优势，其总內存容量是英伟达方案的3.6倍，內存宽带则达到2.1倍，为大规模AI训练和推理提供了更高效的硬件支持。

华为重磅产品登场

18SZ图片处理

尽管单颗升腾芯片的性能仅为英伟达Blackwell构架GPU的三分之一，华为透过大量配置升腾芯片来实现算力突破，在超大规模模型训练和即时推理等应用中展现了强大的竞争力。按照中国本土法人的分析指出，华为的CloudMatrix 384解决方案已领先英伟达和AMD目前市场上的产品一个世代，并认为中国在AI基础设施上的突破将对全球AI产业格局产生深远影响。

英伟达执行长黄仁勋也曾公开表示，从技术参数来看，华为的CloudMatrix 384超节点性能甚至超越英伟达，比英伟达的尖端技术更具优势。黄仁勋强调英伟达必须高度重视华为这家实力雄厚的公司，并全力应对挑战。黄仁勋认为，华为已明确表态要融合5G与AI技术，这种前瞻性的布局被视为是完全正确的战略方向，而英伟达也在推进类似计划，但必须加快进度。

18SZ图片处理

此外，半导体研究和咨询机构SemiAnalysis指出，华为的工程优势不仅体现在芯片层面，更展现在系统级的创新，包括网络构架、光学互联以及软件优化，这些技术使得CloudMatrix 384能充分发挥集群算力，满足超大规模AI计算的需求，进一步巩固其在全球AI产业中的领先地位。

根据Yole预估，全球硅光子市场规模到2027年将超过50亿美元，年复合成长率达30%，其中在全球光信号互连市场规模将从2022年的0.38亿美元，成长至2028年的1.37亿美元，年复合成长率达24%，而从2028年以后，由AI、机器学习（ML）需求所驱动的CPO与Optical I/O为主的产品进一步放量，将迎来新一波成长动能，到了2033年市场规模将再成长至26亿美元，年复合成长率达80%。

18SZ图片处理

近期摩根士丹利证券（Morgan Stanley）也发布了CPO产业的研究报告，看好CPO市场规模将在2023～30年间以172%的年复合成长率扩张，预计30年达到93亿美元，并且在乐观的情境下，年复合增长率可高达210%，市场规模将突破230亿美元。

博通、英伟达扮演产业领头羊

18SZ图片处理

网通芯片大厂博通（Broadcom）在2022年八月推出Tomahawk 4的交换器芯片Humboldt，功耗、成本皆较上一代交换器芯片节省五成，紧接着在2023年三月正式发表Tomahawk 5交换器芯片Bailly，性能持续提升，并于去年开始量产。根据Broadcom提供的数据显示，一台配备有Tomahawk 5的交换器将能替代48台2014年推出的Tomahawk 1交换器，而目前800G模块的功耗为13～15W，Tomahawk 5则可将功耗降至4.8W以下。今年六月，博通再发表新款Tomahawk 6芯片，由台积电三纳米制程生产，新款芯片的频宽102.4Tbps，是上一代产品的两倍，并延续采用CPO技术，将收发器功能直接整合到交换器当中，有助减少硬件成本并降低功耗。

打赏