CXL Compute Express Link 1.1で定義のキャッシュコヒーレンシプロトコル。CPU-Accelerator間でキャッシュコヒーレンスを実現。
CXL.cacheは、CXL Consortium(Intel・AMD・ARM・NVIDIA・Microsoft等業界連携、2019年3月設立)が策定したCompute Express Link 1.1仕様(2019年6月)で定義された3プロトコル(CXL.io・CXL.cache・CXL.mem)の1つで、Accelerator(GPU/FPGA/ASIC等)がCPUのキャッシュ階層にコヒーレントアクセスを可能にする業界標準キャッシュコヒーレンシプロトコル。AI/機械学習/HPC(高性能計算)/ネットワーク処理におけるCPUとアクセラレータ間の低遅延データ共有+メモリ管理単純化+プログラミングモデル簡素化を実現する革新的技術で、従来のNVIDIA NVLink(独自・NVIDIA GPU専用)+AMD Infinity Fabric(AMD独自)の代替+業界標準オープンプロトコルとして急速に普及中。注意: 本記事は既存「CXL(Compute Express Link)」(既存登録、CXL全般説明)とは差別化し、CXL.cacheプロトコル特化(プロトコル詳細・Accelerator-CPU共有・Type 2 デバイス・低遅延キャッシュコヒーレンシ)に焦点を当てる。CXL.cacheの仕組みはMOESIキャッシュコヒーレンスプロトコル+ホスト管理型キャッシュ無効化+スヌープフィルタ+スピーカイト要求等の技術を組み合わせ、Accelerator側でCPU-RAMの内容をローカルにキャッシュして使用、Accelerator側のキャッシュ更新をCPU側に伝播する双方向同期を実現。Type 2 デバイス(CXL.cache+CXL.mem両対応)は2024年現在のNVIDIA H100 NVL(CXL対応版)・H200 NVL・Intel Sapphire Rapids/Emerald Rapids/Granite Rapids(Intel Xeon 4/5/6世代)・AMD EPYC 4th/5th gen等の最新サーバCPU+Accelerator組合わせで実装される。CXL 2.0(2020年)・3.0(2022年)・3.1(2023年)と発展、3.0以降はFabric Manager対応+ファブリック型接続でPooled Memory+Switched CXL等の高度な構成が可能。
| 規格 | 帯域 | 遅延 | 用途 | 対応機 |
|---|---|---|---|---|
| CXL.cache 1.1 | 64GB/s (PCIe5 x16) | <100ns | Accelerator-CPU | NVIDIA H100 NVL等 |
| CXL.cache 3.0 | 128GB/s (PCIe6 x16) | <80ns | Fabric+Pool |
| NVIDIA Blackwell等 |
| NVIDIA NVLink 4.0 | 900GB/s (NVL2) | 40ns | NVIDIA GPU専用 | H100/H200 |
| NVIDIA NVLink 5.0 | 1.8TB/s | 25ns | NVIDIA GPU専用 | Blackwell B100/B200 |
| AMD Infinity Fabric | 800GB/s | 50ns | AMD専用 | EPYC/Instinct |
CXL.cacheは完全にエンタープライズ・データセンター向け仕様で、コンシューマ自作PC市場には存在しない+将来的な波及予定もない(CXL 2.0/3.0の物理層PCIe 6.0/7.0対応コンシューマ普及は2027年以降の見込み)。個人ユーザーがCXL.cacheを利用するシナリオは、Intel Xeon 4/5/6+CXL対応マザーボード(Supermicro X14・Dell PowerEdge R760/R770等)+CXL対応Accelerator(NVIDIA H100 NVL $30,000+など)で、合計**$50,000-200,000+のサーバ機材を所有・運用することが必要。個人/小規模研究室レベルではAWS/Azure/GCPのCXL対応インスタンス(AWS m7i.metal-48xl・Microsoft Azure HBv4-series等)のクラウドレンタルが現実的な接近方法。CXL.cacheの理解はコンピュータアーキテクチャ研究**+HPCシステム設計+AI訓練インフラ設計の専門家向けで、一般PC自作市場とは無縁の技術領域。
CXL.ioはPCI Express互換のIO転送プロトコル(DMA・I/O操作)でCXL最低限の機能、CXL.memはAccelerator/Memory ExpansionデバイスがCPUから直接アクセス可能にするメモリプール拡張プロトコル。CXL.cacheは3つの中で最も高度な双方向キャッシュコヒーレンシを提供、Accelerator側でCPU-RAMをコヒーレントにキャッシュ管理する。NVLink 4.0/5.0(NVIDIA独自)はNVIDIA GPU間+Grace CPU-GPU間の高帯域接続で900GB/s-1.8TB/s達成、CXL.cacheの帯域(64-128GB/s)を大きく上回るがNVIDIA独占でオープン性に劣る。AMD Infinity Fabric(AMD独自、800GB/s)も同様、業界横断オープンスタンダードのCXLとは住み分け。
Q1: CXL.cacheとNVLinkどちらが優れている? A: 帯域・遅延ではNVLink 5.0(1.8TB/s、25ns)が圧倒、CXL.cache 1.1(64GB/s、<100ns)の30倍。ただしNVLinkはNVIDIA専用、CXL.cacheは業界横断オープンなのでInteleal+AMD GPU+各社FPGA組合わせ可能で、用途と要件で使い分けます。
Q2: Type 2デバイスとは? A: CXLの3デバイスタイプ(Type 1/2/3)の1つで、CXL.cache+CXL.memの両プロトコル対応。AcceleratorがCPUキャッシュコヒーレント+メモリ拡張両方を提供する高度な仕様。NVIDIA H100 NVL・H200 NVL・Intel Habana Gaudi 3等が代表例です。
Q3: 一般PC自作市場への波及は? A: 2026年現在限定的、コンシューマGPU(GeForce RTX/Radeon RX)は標準でCXL対応せず(NVLink/PCIe汎用接続)。コンシューマ波及は2028年以降のPCIe 6.0/7.0+次世代AI PC環境を待つ必要があり、現状はサーバ専用技術として発展しています。