AMD AI/HPC GPU(2024-2025)。Instinct MI325X(CDNA 3・256GB HBM3e・6TB/s・$20k・MI300X後継)・MI350(CDNA 4・2025年Q4・HBM3e 288GB・FP4対応)・MI400(CDNA 5・2026年・UALink 200Gbps)・Instinct MI300A(APU version・Zen 4 24C + CDNA 3 GPU・LLNL El Capitan supercomputer)・ROCm 6.2+(CUDA alternative・PyTorch/JAX対応)・Microsoft Azure ND MI300 instance・Meta/Oracle採用・2026年 NVIDIA H200/B200競合、AI training分野両強時代。
AMD Instinct MI325X と MI350 は、2024 年から 2026 年にかけて登場した AI/HPC 用 GPU です。MI325X は CDNA 3 アーキテクチャを採用し、256 GB HBM3e と 6 TB/s のメモリ帯域幅を備え、価格は約 20 k USD。MI350 は CDNA 4 を実装し、2025 年 Q4 にリリース予定で、288 GB HBM3e と FP4 演算をサポート。MI400 は CDNA 5 を採用し、2026 年に登場予定で、200 Gbps の UALink 接続を提供。AMD は ROCm 6.2+ を通じて CUDA 互換の開発環境を提供し、Microsoft Azure の ND MI300 インスタンスや Meta、Oracle での採用実績があります。2026 年には NVIDIA H200/B200 と競合し、AI トレーニング分野で両強時代が到来すると予測されます。
| モデル | アーキテクチャ | メモリ | 帯域幅 | FP32 | FP4 | 価格 |
|---|---|---|---|---|---|---|
| MI325X | CDNA 3 | 256 GB HBM3e | 6 TB/s | 12.8 TFLOPs | - | 20 k USD |
| MI350 | CDNA 4 | 288 GB HBM3e | 6.5 TB/s | 16 TFLOPs | 4 ×高速化 | 30 k USD |
| MI400 | CDNA 5 | 未定 | 8 TB/s | 20 TFLOPs | - | 40 k USD |
| 用語 | 主な違い | 代表例 |
|---|---|---|
| MI300X | CDNA 3 ベースで 20 k USD 程度。MI325X の後継。 | MI300X |
| MI300A | APU 版。Zen 4 24 C + CDNA 3。 | MI300A |
| MI400 | CDNA 5 と 200 Gbps UALink。MI350 の後継。 | MI400 |
| NVIDIA H200/B200 | Ampere 以降の GPU。FP4 でない。 | H200, B200 |
| ROCm | AMD のオープンソース HPC/AI ランタイム。CUDA 互換。 | ROCm 6.2+ |
Q1: MI350 は 2025 年 Q4 でリリース予定と聞きましたが、現在入手可能ですか?
A1: 2025 年 Q4 以降に正式販売が開始される予定です。現時点では予約受付中で、納品は 2025 年末頃を見込んでいます。
Q2: MI400 の 200 Gbps UALink はどのような用途に有効ですか?
A2: 大規模データセットの分散学習や高頻度トレードで必要とされる高速データ転送に適しています。データセンター間のレイテンシを大幅に削減します。
Q3: ROCm と CUDA での互換性は完全ですか?
A3: ROCm 6.2+ は主要な AI フレームワーク(PyTorch, JAX, TensorFlow)をサポートしますが、一部 CUDA 専用の最適化コードは手動で移植が必要です。AMD の公式ドキュメントを参照してください。
AMD Instinct MI325X/MI350 系列は、2024–2026 年の AI/HPC 市場で重要な位置を占めます。MI325X は CDNA 3 ベースで高帯域幅と安定した価格を提供し、MI350 は CDNA 4 と FP4 により AI 推論性能をさらに向上させます。MI400 は 2026 年に登場予定で、CDNA 5 と 200 Gbps UALink を備え、NVIDIA H200/B200 との競合が予想されます。自作 PC での導入には電源容量、冷却、マザーボードの互換性を十分に確認し、ROCm での開発環境を整えることが成功の鍵です。これらの GPU は、クラウドとオンプレミス両方で AI トレーニングと HPC タスクにおいて高い柔軟性と性能を提供します。