随着5G和AI新技术的快速发展,对于数据传输的速度和效率要求日益提高,能实现高速、低延迟、低功耗数据传输技术的CPO,正成为未来科技发展的关键。
随着5G、生成式AI等新兴应用迅速发展,对数据的传输量与传输速度要求也愈加提高,为了满足高速低延迟的数据传输需求,运用共同封装模块技术(Co-packaged optics;CPO)整合光电元件,使得晶片开发者获得更多通信频宽,不仅能实现高速低延迟的数据传输,而且让传输数据时所消耗的电力也大幅减少,符合当今全球低碳节能的要求,也正因为拥有上述之优势的CPO,将成为下一代高速网通芯片的关键技术之一。
今年在上海举行的世界人工智能大会(WAIC)上,华为升腾384(CloudMatrix 384)超节点真机首次亮相,该系统由384颗升腾NPU,与192颗鲲鹏CPU芯片构建,采用全互连拓墣构架以实现芯片间的数据传输,其算力表现十分突出,能提供高达300PFLOPs的密集BF16算力,接近英伟达GB200 NVL72系统的两倍。此外,CloudMatrix 384在內存容量和频宽方面也具有显著优势,其总內存容量是英伟达方案的3.6倍,內存宽带则达到2.1倍,为大规模AI训练和推理提供了更高效的硬件支持。
华为重磅产品登场
尽管单颗升腾芯片的性能仅为英伟达Blackwell构架GPU的三分之一,华为透过大量配置升腾芯片来实现算力突破,在超大规模模型训练和即时推理等应用中展现了强大的竞争力。按照中国本土法人的分析指出,华为的CloudMatrix 384解决方案已领先英伟达和AMD目前市场上的产品一个世代,并认为中国在AI基础设施上的突破将对全球AI产业格局产生深远影响。
英伟达执行长黄仁勋也曾公开表示,从技术参数来看,华为的CloudMatrix 384超节点性能甚至超越英伟达,比英伟达的尖端技术更具优势。黄仁勋强调英伟达必须高度重视华为这家实力雄厚的公司,并全力应对挑战。黄仁勋认为,华为已明确表态要融合5G与AI技术,这种前瞻性的布局被视为是完全正确的战略方向,而英伟达也在推进类似计划,但必须加快进度。
此外,半导体研究和咨询机构SemiAnalysis指出,华为的工程优势不仅体现在芯片层面,更展现在系统级的创新,包括网络构架、光学互联以及软件优化,这些技术使得CloudMatrix 384能充分发挥集群算力,满足超大规模AI计算的需求,进一步巩固其在全球AI产业中的领先地位。
根据Yole预估,全球硅光子市场规模到2027年将超过50亿美元,年复合成长率达30%,其中在全球光信号互连市场规模将从2022年的0.38亿美元,成长至2028年的1.37亿美元,年复合成长率达24%,而从2028年以后,由AI、机器学习(ML)需求所驱动的CPO与Optical I/O为主的产品进一步放量,将迎来新一波成长动能,到了2033年市场规模将再成长至26亿美元,年复合成长率达80%。
近期摩根士丹利证券(Morgan Stanley)也发布了CPO产业的研究报告,看好CPO市场规模将在2023~30年间以172%的年复合成长率扩张,预计30年达到93亿美元,并且在乐观的情境下,年复合增长率可高达210%,市场规模将突破230亿美元。
博通、英伟达扮演产业领头羊
网通芯片大厂博通(Broadcom)在2022年八月推出Tomahawk 4的交换器芯片Humboldt,功耗、成本皆较上一代交换器芯片节省五成,紧接着在2023年三月正式发表Tomahawk 5交换器芯片Bailly,性能持续提升,并于去年开始量产。根据Broadcom提供的数据显示,一台配备有Tomahawk 5的交换器将能替代48台2014年推出的Tomahawk 1交换器,而目前800G模块的功耗为13~15W,Tomahawk 5则可将功耗降至4.8W以下。今年六月,博通再发表新款Tomahawk 6芯片,由台积电三纳米制程生产,新款芯片的频宽102.4Tbps,是上一代产品的两倍,并延续采用CPO技术,将收发器功能直接整合到交换器当中,有助减少硬件成本并降低功耗。