NVIDIA 2024年3月発表の GPU アーキテクチャ。B100/B200/B204 (DC AI)・GeForce RTX 50 (コンシューマ) 採用・208B トランジスタ・TSMC 4NP プロセス。
NVIDIA Blackwell は NVIDIA が2024年3月18日発表 (GTC 2024) した GPU アーキテクチャ。Hopper (H100/H200・2022) の後継として、B100/B200/B204 データセンタ AI 向け + GeForce RTX 50 シリーズ コンシューマ向けで採用。208億トランジスタ (B200・2 ダイ MCM 構成)・TSMC 4NP プロセス・第2世代 Transformer Engine・NVLink 5 (1.8TB/s)・FP4 サポート (新精度) で生成 AI 学習+推論性能を世代ジャンプ。B200 は H100 比 2.5倍学習性能・5倍推論性能 (FP4 精度時) を発揮し、GPT-5/Claude 4/Gemini 2.5 等の次世代 LLM 学習基盤として2024-2026年の AI 業界を牽引。GB200 NVL72 (Grace Blackwell スーパチップ・72 GPU + 36 Grace CPU + 液冷) は1ラック単位で18 PFlops FP4 性能 を実現し、$3-$5M/ラックで Microsoft/Meta/Tesla 等の大規模 AI 学習に投入された。コンシューマ向け GeForce RTX 50 シリーズは2025年1月発売で、Blackwell の DLSS 4 + 第5世代 Tensor Cores を活用したゲーミング向け実装。
| GPU | リリース年 | プロセス | メモリ | TDP |
|---|
| H100 (Hopper) | 2022 | TSMC 4N | 80GB HBM3 | 700W |
| H200 (Hopper Refresh) | 2024 | TSMC 4N | 141GB HBM3E | 700W |
| B100 (Blackwell) | 2024 | TSMC 4NP | 192GB HBM3E | 700W |
| B200 (Blackwell) | 2024 | TSMC 4NP | 192GB HBM3E | 1000W |
| GB200 NVL72 | 2024 | TSMC 4NP | 13.5TB HBM3E (rack) | 120kW (rack) |
| RTX 5090 (Consumer) | 2025/1 | TSMC 4NP | 32GB GDDR7 | 575W |
NVIDIA Blackwell は2026年現在 データセンタ AI と コンシューマ GPU 双方の最新アーキテクチャ。コンシューマ自作PC では GeForce RTX 50 シリーズ ($299-$1,999) が直接購入可能。注意点として、データセンタ B100/B200 は個人購入不可 (Hyperscaler 専売)、AWS p5e/Azure ND GB200/GCP A4 等のクラウドインスタンス経由で時間単位レンタル ($30-$50/時/GPU)で利用可能。自作 PC AI 用途では RTX 5090 (32GB GDDR7) が Local LLM 推論最強 (Llama 3.3 70B・Qwen 2.5 72B 動作可能)・RTX 5070 Ti (16GB) が ミッドレンジ AI 推論 (Llama 3.1 13B・Mistral Small 3 動作可能)。Blackwell の FP4 精度サポートは推論専用で学習には FP8/FP16 が標準。コンシューマ GPU の AI 用途では FP8 精度が主流で、FP4 は Hopper/Blackwell の DC AI で活用される。
Q1: Blackwell B200 と H100 の違い? A: ① 208億 vs 80億トランジスタ (2.6倍) ② 192GB HBM3E vs 80GB HBM3 (2.4倍) ③ FP4 サポート ④ 第2世代 Transformer Engine ⑤ NVLink 5 (1.8TB/s)・H100 は1.2TB/s。総合 2.5倍学習・5倍推論性能。
Q2: GB200 NVL72 とは? A: 72 ×B200 GPU + 36 ×Grace CPU + 9 NVSwitch を1ラック内に液冷統合・1ラック単位 18 PFlops FP4 性能。$3-$5M/ラックで2024年下半期から Microsoft/Meta 等が大量導入。
Q3: コンシューマ用途で Blackwell のメリットは? A: GeForce RTX 50 シリーズ (2025/1)・GDDR7 + DLSS 4 Multi Frame Generation で 4Kゲーミング+AI ローカル推論性能向上。AI PC のローカル LLM 動作 (Llama 3.3 70B等) で活躍。