GPU × 光模块对应关系速查

核心数据速览

4×

GB200 vs H100
光模块用量倍数

1.6T

下一代主力
光模块速率

4×

1.6T vs 800G
InP衬底消耗

600K+

GB200 NVL72
MLCC用量/柜

一、GPU代际 × 光模块对应

每颗GPU从训练集群中产生的光模块需求，随网络拓扑升级呈非线性增长。

GPU代际	网络速率	主力光模块	封装形态	每GPU模块数	模块ASP	价值量/GPU
A100 2020	200G HDR IB	200G QSFP56	QSFP56	2-3 个	$300-400	$600-1,200
H100 2023	400G NDR IB /RoCE v2	400G QSFP-DD （DR4/FR4）	QSFP-DD	3-4 个	$500-700	$1,500-2,800
B200 2025	800G Ultra IB/Ethernet	800G OSFP （2×400G FR4）	OSFP	4-6 个	$1,200-1,600	$4,800-9,600
GB200 NVL72 2025-26	1.6T	1.6T OSFP-XD （2×800G/LPO）	OSFP-XD	8-12 个	$2,500-3,500	$20,000-42,000
Rubin (下一代) 2027E	3.2T	3.2T OSFP-XD （TFLN/薄膜InP）	OSFP-XD+	12-16 个	$4,000-5,500	$48,000-88,000

注：每GPU模块数 = 服务器端 + 交换机端分摊，基于 Leaf-Spine 两层（H100）/ 三层（B200+）拓扑估算。 ASP 为2026年行业均价，实际随量产节奏下探。

二、网络拓扑 × 光模块用量拆解

不同拓扑层级决定"每GPU消耗多少光模块"。

拓扑架构	适用GPU	交换机层级	每GPU总端口	光模块总量/GPU	特点
Leaf-Spine 两层	A100/H100	Leaf + Spine	8×400G	3-4 个400G	最简结构，万卡以下适用
Fat-Tree 三层	B200	Leaf + Spine + Super Spine	8×800G	4-6 个800G	多层交换机叠加端口需求
NVLink + IB混合	GB200 NVL72	NVLink柜内 + IB/RoCE柜间	NVLink(柜内) + 8×1.6T IB	8-12 个1.6T	柜内不走光模块，柜间全光互联
Ultra Ethernet	Rubin 2027+	3-4层 CLOS	16×3.2T	12-16 个3.2T	UEC标准，4层CLOS成标配

三、典型集群规模 × 光模块总需求

从千卡到十万卡，光模块用量指数级增长。

集群规模	GPU型号	网络架构	光模块类型	光模块总数	光模块总价值
1K卡	H100	两层Leaf-Spine	400G QSFP-DD	~3,500 个	~$2M
10K卡	H100	两层Leaf-Spine	400G QSFP-DD	~35,000 个	~$20M
10K卡	B200	三层Fat-Tree	800G OSFP	~55,000 个	~$75M
72K卡 (NVL72×1K)	GB200	NVLink柜内+IB柜间	1.6T OSFP-XD	~700,000 个	~$2.0B
100K卡	GB200	三层IB + NVLink	1.6T OSFP-XD	~950,000 个	~$2.7B

数据来源：TrendForce、招银国际、广发证券测算。GB200 NVL72按每柜72 GPU + 18个IB交换机计算柜间光模块。

四、光模块规格演进路线

速率	封装	通道配置	光芯片方案	DSP芯片	功耗	量产时间
400G	QSFP-DD	4×100G 或 8×50G	EML / VCSEL	博通 BCM8956X 马vell Nova	10-12W	2022（已成熟）
800G	OSFP	8×100G	EML / 硅光 + InP CW光源	博通 BCM8958X 马vell Spica	16-20W	2024（爬坡中）
1.6T	OSFP-XD	8×200G 或 16×100G	硅光 + InP CW （LPO可选无DSP）	博通 BCM8982X 马vell Celestial	25-30W	2025H2-2026
3.2T	OSFP-XD+	16×200G	TFLN / 薄膜InP （技术路径未收敛）	下一代 5nm DSP	35-45W	2027E

五、产业链映射：GPU → 光模块 → 上游材料

环节	400G时代	800G时代	1.6T时代	关键瓶颈
GPU	A100 / H100	B200	GB200 / Rubin	CoWoS产能
网络芯片	CX-7 (400G)	CX-8 (800G)	CX-9 / BlueField-4	台积电5/3nm
交换芯片	Tomahawk5	Tomahawk6	Jericho4 / Ramon	博通独占
DSP芯片	7nm	5nm	3nm	博通/马维尔双寡头
光芯片	EML（100G/lane）	EML / 硅光	硅光 + InP CW光源	InP衬底缺口30-50%
上游材料	InP衬底需求平稳	InP需求+80%	InP需求4× (16通道)	味之素ABF膜+住友InP外延
光模块厂商	中际旭创/新易盛 Coherent/Lumentum	中际旭创(800G量产) Coherent/II-VI	中际旭创/Coherent 竞争格局重塑中	良率+认证壁垒

六、GB200 NVL72 光互联架构示意

┌─ GB200 NVL72 机柜内 (NVLink, 不走光模块) ─┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ │GPU 1│ │GPU 2│ │ ... │ │GPU72│ └──┬──┘ └──┬──┘ └──┬──┘ └──┬──┘ └─────NVLink Switch──────┘ 柜内 NVLink 铜互联, 无光模块 └──────────────┬──────────────────────┘ │ 8× 1.6T OSFP-XD 光模块 (上行) ▼ ┌──────── InfiniBand Spine 交换机 ────────┐ │ 每台: 64× 1.6T端口 = 64个光模块 │ └─────────────────┬───────────────────────┘ │ 跨柜互联 (全部走光模块) ▼ ┌──────── 其他 NVL72 机柜 ──────────────┐ │ GPU 73-144 ... GPU 72N │ └────────────────────────────────────────┘ 光模块消耗 = 柜间IB网络全部端口每NVL72柜 ≈ 8-12个1.6T光模块 (上行端) + 交换机端等量 + SuperSpine层 = 总量翻2-3倍

七、投资映射：GPU升级 → 谁受益？

受益环节	代表公司	弹性逻辑	确定性
光模块整机	中际旭创 / 新易盛 / Coherent	800G→1.6T量价齐升	高
硅光芯片	Marvell / Intel / 中际旭创自研	800G起硅光占比提升	高
InP衬底/外延	住友电工 / II-VI / 云南锗业	核心瓶颈，缺口30-50%	高
EML芯片	Lumentum / 光迅科技 / 仕佳光子	100G/lane EML国产替代窗口	中
DSP芯片	博通 / 马维尔	每代升级ASP+15-20%	高
光纤连接器	长飞光纤 / 亨通光电 / 特发信息	MPO/MTP连接器随通道数线性增长	高
MLCC被动元件	Murata / 三星电机 / 风华高科	800G模块MLCC用量为400G的3倍	中
PCB/IC载板	深南电路 / 兴森科技 / 博敏电子	高速PCB层数+面积双升	中

核心结论

非线性增长：GPU每升级一代，光模块用量翻3-4倍，ASP翻2-2.5倍，价值量翻6-10倍
InP是核心瓶颈：1.6T硅光方案不减少InP反而增加CW光源需求，缺口2032年前难以弥合
集群规模放大弹性：万卡→十万卡集群使拓扑从两层变三层，交换机端口数叠加，光模块用量再翻1.5-2倍
国产替代窗口：800G是国产光模块（中际旭创/新易盛）份额跃升的关键节点，但EML芯片和InP衬底仍高度依赖进口
投资优先级：InP衬底（确定性最高）> 光模块整机（弹性最大）> 硅光芯片（趋势确定但格局未定）> EML国产替代（节奏待验证）