GPU × 光模块对应关系速查

AI算力互联架构 · 模块用量测算 · 产业链映射 | 2026-06-25
核心数据速览
GB200 vs H100
光模块用量倍数
1.6T
下一代主力
光模块速率
1.6T vs 800G
InP衬底消耗
600K+
GB200 NVL72
MLCC用量/柜
一、GPU代际 × 光模块对应
每颗GPU从训练集群中产生的光模块需求,随网络拓扑升级呈非线性增长。
GPU代际 网络速率 主力光模块 封装形态 每GPU模块数 模块ASP 价值量/GPU
A100
2020
200G HDR IB 200G QSFP56 QSFP56 2-3 个 $300-400 $600-1,200
H100
2023
400G NDR IB
/RoCE v2
400G QSFP-DD
(DR4/FR4)
QSFP-DD 3-4 个 $500-700 $1,500-2,800
B200
2025
800G Ultra
IB/Ethernet
800G OSFP
(2×400G FR4)
OSFP 4-6 个 $1,200-1,600 $4,800-9,600
GB200 NVL72
2025-26
1.6T 1.6T OSFP-XD
(2×800G/LPO)
OSFP-XD 8-12 个 $2,500-3,500 $20,000-42,000
Rubin (下一代)
2027E
3.2T 3.2T OSFP-XD
(TFLN/薄膜InP)
OSFP-XD+ 12-16 个 $4,000-5,500 $48,000-88,000
注:每GPU模块数 = 服务器端 + 交换机端分摊,基于 Leaf-Spine 两层(H100)/ 三层(B200+)拓扑估算。 ASP 为2026年行业均价,实际随量产节奏下探。
二、网络拓扑 × 光模块用量拆解
不同拓扑层级决定"每GPU消耗多少光模块"。
拓扑架构 适用GPU 交换机层级 每GPU总端口 光模块总量/GPU 特点
Leaf-Spine 两层 A100/H100 Leaf + Spine 8×400G 3-4 个400G 最简结构,万卡以下适用
Fat-Tree 三层 B200 Leaf + Spine + Super Spine 8×800G 4-6 个800G 多层交换机叠加端口需求
NVLink + IB混合 GB200 NVL72 NVLink柜内 + IB/RoCE柜间 NVLink(柜内) + 8×1.6T IB 8-12 个1.6T 柜内不走光模块,柜间全光互联
Ultra Ethernet Rubin 2027+ 3-4层 CLOS 16×3.2T 12-16 个3.2T UEC标准,4层CLOS成标配
三、典型集群规模 × 光模块总需求
从千卡到十万卡,光模块用量指数级增长。
集群规模 GPU型号 网络架构 光模块类型 光模块总数 光模块总价值
1K卡 H100 两层Leaf-Spine 400G QSFP-DD ~3,500 个 ~$2M
10K卡 H100 两层Leaf-Spine 400G QSFP-DD ~35,000 个 ~$20M
10K卡 B200 三层Fat-Tree 800G OSFP ~55,000 个 ~$75M
72K卡 (NVL72×1K) GB200 NVLink柜内+IB柜间 1.6T OSFP-XD ~700,000 个 ~$2.0B
100K卡 GB200 三层IB + NVLink 1.6T OSFP-XD ~950,000 个 ~$2.7B
数据来源:TrendForce、招银国际、广发证券测算。GB200 NVL72按每柜72 GPU + 18个IB交换机计算柜间光模块。
四、光模块规格演进路线
速率 封装 通道配置 光芯片方案 DSP芯片 功耗 量产时间
400G QSFP-DD 4×100G 或 8×50G EML / VCSEL 博通 BCM8956X
马vell Nova
10-12W 2022(已成熟)
800G OSFP 8×100G EML / 硅光
+ InP CW光源
博通 BCM8958X
马vell Spica
16-20W 2024(爬坡中)
1.6T OSFP-XD 8×200G 或
16×100G
硅光 + InP CW
(LPO可选无DSP)
博通 BCM8982X
马vell Celestial
25-30W 2025H2-2026
3.2T OSFP-XD+ 16×200G TFLN / 薄膜InP
(技术路径未收敛)
下一代 5nm DSP 35-45W 2027E
五、产业链映射:GPU → 光模块 → 上游材料
环节 400G时代 800G时代 1.6T时代 关键瓶颈
GPU A100 / H100 B200 GB200 / Rubin CoWoS产能
网络芯片 CX-7 (400G) CX-8 (800G) CX-9 / BlueField-4 台积电5/3nm
交换芯片 Tomahawk5 Tomahawk6 Jericho4 / Ramon 博通独占
DSP芯片 7nm 5nm 3nm 博通/马维尔双寡头
光芯片 EML(100G/lane) EML / 硅光 硅光 + InP CW光源 InP衬底缺口30-50%
上游材料 InP衬底需求平稳 InP需求+80% InP需求4× (16通道) 味之素ABF膜+住友InP外延
光模块厂商 中际旭创/新易盛
Coherent/Lumentum
中际旭创(800G量产)
Coherent/II-VI
中际旭创/Coherent
竞争格局重塑中
良率+认证壁垒
六、GB200 NVL72 光互联架构示意
┌─ GB200 NVL72 机柜内 (NVLink, 不走光模块) ─┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ │GPU 1│ │GPU 2│ │ ... │ │GPU72│ └──┬──┘ └──┬──┘ └──┬──┘ └──┬──┘ └─────NVLink Switch──────┘ 柜内 NVLink 铜互联, 无光模块 └──────────────┬──────────────────────┘ │ 8× 1.6T OSFP-XD 光模块 (上行) ┌──────── InfiniBand Spine 交换机 ────────┐ │ 每台: 64× 1.6T端口 = 64个光模块 │ └─────────────────┬───────────────────────┘ │ 跨柜互联 (全部走光模块) ┌──────── 其他 NVL72 机柜 ──────────────┐ │ GPU 73-144 ... GPU 72N │ └────────────────────────────────────────┘ 光模块消耗 = 柜间IB网络全部端口 每NVL72柜 ≈ 8-12个1.6T光模块 (上行端) + 交换机端等量 + SuperSpine层 = 总量翻2-3倍
七、投资映射:GPU升级 → 谁受益?
受益环节 代表公司 弹性逻辑 确定性
光模块整机 中际旭创 / 新易盛 / Coherent 800G→1.6T量价齐升
硅光芯片 Marvell / Intel / 中际旭创自研 800G起硅光占比提升
InP衬底/外延 住友电工 / II-VI / 云南锗业 核心瓶颈,缺口30-50%
EML芯片 Lumentum / 光迅科技 / 仕佳光子 100G/lane EML国产替代窗口
DSP芯片 博通 / 马维尔 每代升级ASP+15-20%
光纤连接器 长飞光纤 / 亨通光电 / 特发信息 MPO/MTP连接器随通道数线性增长
MLCC被动元件 Murata / 三星电机 / 风华高科 800G模块MLCC用量为400G的3倍
PCB/IC载板 深南电路 / 兴森科技 / 博敏电子 高速PCB层数+面积双升
核心结论
  • 非线性增长:GPU每升级一代,光模块用量翻3-4倍,ASP翻2-2.5倍,价值量翻6-10倍
  • InP是核心瓶颈:1.6T硅光方案不减少InP反而增加CW光源需求,缺口2032年前难以弥合
  • 集群规模放大弹性:万卡→十万卡集群使拓扑从两层变三层,交换机端口数叠加,光模块用量再翻1.5-2倍
  • 国产替代窗口:800G是国产光模块(中际旭创/新易盛)份额跃升的关键节点,但EML芯片和InP衬底仍高度依赖进口
  • 投资优先级:InP衬底(确定性最高)> 光模块整机(弹性最大)> 硅光芯片(趋势确定但格局未定)> EML国产替代(节奏待验证)