前不久的GTC 2025期间,英伟达发布了两款CPO交换机,光通信行业市场研究机构LightCounting对这一举动进行了点评。
与此前的传闻一致,英伟达正式推出了面向InfiniBand和以太网的两大CPO(共封装光学)交换机产品线,分别命名为Quantum-X Photonics与Spectrum-X Photonics。InfiniBand CPO将于2025年下半年首发,以太网CPO则计划在2026年下半年面市。
值得注意的是,CPO将作为可选配置,英伟达仍会继续提供采用可插拔模块的传统交换机系统。
鉴于目前CPO技术渗透缓慢,人们不禁要问英伟达为何押注这一方向。首要驱动力在于功耗优化,英伟达创始人兼CEO黄仁勋在主题演讲中重点强调,采用CPO技术后,1.6T端口的功耗从可插拔光模块的30W骤降至9W,降幅高达70%。
英伟达的CPO方案采用了新型微环调制器(MRM)以实现能效跃升。此前博通的CPO方案通过去除DSP实现了50%的功耗降低,但其技术基础是传统光模块中常见的Mach-Zehnder调制器(MZM)。
下图展示了该技术涉及的多元组件生态:由台积电制造的电子芯片与光子芯片通过3D堆叠封装集成,台积电的紧凑型通用光子引擎(COUPE)技术整合了用于光纤阵列表面耦合的微透镜。在Quantum-X Photonic平台中,光学引擎组件通过中介层与交换机ASIC连接。虽然英伟达未披露各环节的具体分工,但其CPO合作伙伴名单已涵盖Browave、Coherent、康宁、Fabrinet、富士康、Lumentum、Senko、SPIL、住友、天孚通信和台积电等产业链巨头。
LightCounting指出,光模块厂商或许可以暂时松一口气,英伟达首款CPO产品是InfiniBand交换机,而该协议在英伟达的AI战略中的地位已被以太网反超。实际上,Quantum-X Photonic平台甚至未出现在产品路线图中。加之英伟达目前已推出搭载OSFP端口(支持1.6T光模块)的Quantum-X800系统,预计首批CPO部署将主要用于自有集群。Quantum-X Photonic平台更多承担技术验证的角色,短期内对光模块需求影响有限。
黄仁勋在演讲中将Spectrum-X称为“全垒打式创新”,旨在将以太网提升至InfiniBand的性能水平。他表示Spectrum-X将在Rubin平台时代实现“数十万GPU”的互联。尽管英伟达未透露细节,但Spectrum-X Photonics平台采用了与Quantum-X Photonic不同的设计架构,可能代表第二代技术演进。
无论如何,英伟达的入局将为CPO生态注入强心剂。自2021年初起,该技术主要由博通推动。预计到2027年,两家巨头都将推出基于单通道200G的CPO交换机,届时产业生态将趋于成熟。
Scale-out是CPO的低风险切入点,但Scale-up才是决胜关键。混合专家(MoE)模型所需的快速响应时间依赖于跨GPU的专家并行计算。黄仁勋通过案例展示了吞吐量与响应时间的权衡,指出最佳实践需要将单个专家分割到64个GPU实例上运行。Blackwell架构的NVL72机架通过NVlink+无源铜缆背板构建了72 GPU纵向扩展域,预计2026年下半年推出的Vera Rubin NVL144将采用类似设计,无源铜缆用量可能翻倍。
虽然英伟达未透露Rubin Ultra NVL576的细节,但Kyber机架布局显然对NVlink互连提出了新要求。尽管如此,144个GPU封装仍可容纳在一个机柜中,最大距离约为2米。路线图中未提及Feynman平台的NVlink扩展能力,LightCounting预计其将支持多机柜级联,届时必然需要光互连方案。
英伟达早在2022年GTC大会就公布了基于光纤的NVlink计划。公司内部已建成至少一个此类集群,但由于重定时光模块功耗过高,未能大规模推广。虽然去除DSP是重要进步,但仍需持续技术突破。这也解释了英伟达为何冒险押注MRM等新技术。鉴于Scale-up能力对AI集群的重要性,英伟达可能正在研究一系列创新光学技术。
NVlink CPO定档2028年,意味着英伟达将有两代产品周期在Scale-out网络中验证技术可行性。这将大幅降低未来GPU集成CPO的风险,虽然具体时间未定,但这已成为不可避免的技术演进方向。
0 条