消息源 Kopite 近日分享了英伟达下一代 GeForce 和数据中心 GPU 的相关信息。代号 Blackwell 产品线中,GB20X 主要面向消费级 GeForce RTX 显卡;GB10X 主要面向数据中心。
GB100
消息源 Kopite 表示 GB100 共有 8 组 GPC,每组 GPC 内包含 10 个 TPC,推测每个 TPC 内含有 2 个 SM,相当于有 160 个 SM。
每组 GPC 内含有 20 个 SM,假设每个 SM 可以包含 128 个 CUDA 核心,那么 GB100 可能包含 20480 个 CUDA / FP32 核心。
GB202
消息源 Kopite 表示 GB202 共有 12 组 GPC,每组 GPC 内包含 8 个 TPC,每个 TPC 内含有 2 个 SM,共计有 192 个 SM,相当于 24576 个 CUDA 核心。
Kopite 报告 GB100 和 GB202 将分别包括 8192 位和 512 位内存总线,楼主在此附上信息如下:
GB100(数据中心):160 个 SM | 20480 个 CUDA 核心 | 8192 位内存总线
GB202(游戏):192 个 SM | 24576 个 CUDA 核心 | 48 GB G7 显存
由于上述芯片均未流片,因此很难确定性能。最初的泄漏吹捧 RTX 5090 比 RTX 4090 快 1.7 倍,无法验证。
GB100
消息源 Kopite 表示 GB100 共有 8 组 GPC,每组 GPC 内包含 10 个 TPC,推测每个 TPC 内含有 2 个 SM,相当于有 160 个 SM。
每组 GPC 内含有 20 个 SM,假设每个 SM 可以包含 128 个 CUDA 核心,那么 GB100 可能包含 20480 个 CUDA / FP32 核心。
GB202
消息源 Kopite 表示 GB202 共有 12 组 GPC,每组 GPC 内包含 8 个 TPC,每个 TPC 内含有 2 个 SM,共计有 192 个 SM,相当于 24576 个 CUDA 核心。
Kopite 报告 GB100 和 GB202 将分别包括 8192 位和 512 位内存总线,楼主在此附上信息如下:
GB100(数据中心):160 个 SM | 20480 个 CUDA 核心 | 8192 位内存总线
GB202(游戏):192 个 SM | 24576 个 CUDA 核心 | 48 GB G7 显存
由于上述芯片均未流片,因此很难确定性能。最初的泄漏吹捧 RTX 5090 比 RTX 4090 快 1.7 倍,无法验证。