光インターコネクト。チップ間を光通信で接続し超高速化
Photonic Interconnect(光インターコネクト)とは、コンピュータ内部のチップ間、あるいはサーバー間などのデータ転送に、従来の電気信号(電子)ではなく「光信号(光子)」を用いる技術のことです。
現在のコンピューティング、特に生成AIなどの大規模言語モデル(LLM)を動かすデータセンターでは、GPUやCPUといった演算装置の処理能力が劇的に向上しました。しかし、演算器の間を結ぶ「配線(インターコネクト)」が電気的な銅線であるため、データの転送速度が追いつかず、演算器がデータ待ち状態で遊んでしまう「メモリウォール」や「通信ボトルネック」という深刻な問題が発生しています。
光インターコネクトは、このボトルネックを解消するために、シリコンフォトニクス(Silicon Photonics)などの技術を用いて、チップの至近距離まで光ファイバーや光導波路を持ち込み、超高速・低遅延・低消費電力でデータをやり取りすることを目指す次世代の通信基盤です。
現代のAIコンピューティングにおいて、NVIDIAのRTX 4090のようなコンシューマー向けGPUから、データセンター向けのNVIDIA H100や最新の**NVIDIA B200 (Blackwell)**に至るまで、演算性能は飛躍的に向上しました。しかし、電気信号による通信には物理的な限界があります。
電気信号を銅線で送る場合、信号の周波数が高くなればなるほど「伝送損失(信号の減衰)」と「熱の発生」が激しくなります。例えば、112Gbpsや224Gbpsといった超高速通信を電気的に行おうとすると、信号が劇的に劣化するため、非常に強力な増幅器や補正回路が必要となり、結果として消費電力が跳ね上がります。
最新のハイエンドGPUは、TDP(熱設計電力)が700Wを超える製品が登場しています。この電力の多くは演算そのものではなく、膨大なデータをメモリや他のGPUへ転送するためのI/O(入出力)部分で消費されています。1ビットのデータを送るのに必要なエネルギー(pJ/bit)を削減しなければ、データセンターの電力消費は維持不可能なレベルに達します。
電気信号は高速であればあるほど、伝送できる距離が極めて短くなります。数センチメートル離れたチップ同士の通信であっても、電気的なロスは無視できず、これがシステム全体の遅延(レイテンシ)を増大させています。光信号であれば、理論上は数メートルから数キロメートルまで、信号劣化をほとんど気にせず高速転送が可能です。
光インターコネクトを実現するためには、単に光ファイバーを繋げば良いわけではなく、電気信号を光信号に変換し、再び電気に戻す仕組みをチップレベルで実装する必要があります。
これは、半導体製造プロセス(CMOSプロセス)を用いて、シリコン基板上に光回路を形成する技術です。これにより、光の経路を制御する「導波路」や、光を出す「変調器」をチップ上に集積できます。
従来の光通信は、基板の端にある「光トランシーバー(プラグインモジュール)」で電気を光に変換していました。しかし、CPOは光エンジンのチップを、GPUやスイッチチップと同じパッケージ内に封入(Co-Package)する技術です。これにより、電気信号が走る距離を数ミリメートル単位まで短縮し、消費電力を劇的に削減します。
Ayar Labs社が開発しているTeraPHYのような光I/Oチップは、CPUやGPUのダイ(ダイシングされた半導体)のすぐ隣に配置され、メモリ(HBMなど)や他のプロセッサとの間を光で結びます。これにより、従来の電気的なSerDes(シリアライザ/デシリアライザ)よりも圧倒的に高い帯域幅を実現します。
光インターコネクトおよび関連する超高速通信技術は、すでに最先端のハードウェアに導入され始めています。
| 製品・技術名 | 開発元 | 主な特徴・役割 | 関連スペック (例) |
|---|---|---|---|
| NVIDIA B200 (Blackwell) | NVIDIA | 第5世代NVLink搭載。光的な接続性を強化したクラスター構成 | 帯域幅: 1.8TB/s (NVLink) |
| Intel Gaudi 3 | Intel | 高速イーサネット接続を最適化したAIアクセラレータ | 800Gbps Ethernetポート搭載 |
| Broadcom Tomahawk 5 | Broadcom | 超大規模データセンター向けスイッチチップ | スループット: 51.2Tbps |
| Ayar Labs TeraPHY | Ayar Labs | チップ間光I/Oチップ。電気的なI/Oを光に置換 | エネルギー効率: $\approx$ 5pJ/bit以下 |
| NVIDIA H100 | NVIDIA | 第4世代NVLinkによりGPU間を高速接続 | HBM3メモリ帯域: 3.35TB/s |
光インターコネクトが目指す、あるいは実現している数値的な目標は以下の通りです。
光インターコネクトは、単なる「速い通信」ではなく、コンピュータのアーキテクチャそのものを変える可能性を秘めています。
これまでメモリ(RAM)はCPUのすぐ隣に配置されていましたが、光インターコネクトを用いれば、数メートル離れた場所にある「メモリ専用サーバー」から、あたかもローカルメモリであるかのような低遅延でアクセスできるようになります。これはCXL (Compute Express Link) 規格と光通信を組み合わせることで、2025年以降に実用化が進むと予想されています。
次世代のプロセッサは、複数の小さなチップ(チップレット)を組み合わせる構造になります。2026年までには、チップレット間の接続(UCIeなどの規格)に光インターコネクトを組み込み、パッケージ内部で光が飛び交う「フォトニック・チップレット」が主流になると考えられています。
AIモデルの巨大化に伴い、データセンターの電力消費は国家レベルの課題となっています。光インターコネクトへの移行により、データ転送に伴う電力消費を現状の1/10以下に削減できれば、同じ電力枠で10倍以上の演算能力を確保できる計算になります。
Q1: 光インターコネクトは、家庭用の自作PCに搭載されるようになりますか? A: 短期的(2025年〜2027年頃)には難しいと考えられます。光インターコネクトは非常に高価なシリコンフォトニクス技術や精密な光アライメントが必要であり、現在は数千万円から数億円するAIサーバー向けに特化しています。ただし、将来的にメモリプーリングなどの技術が普及すれば、マザーボード上のメモリバスが光化される可能性は十分にあります。
Q2: 今の光ファイバーLAN(SFP+やQSFP)と何が違うのですか? A: 決定的な違いは「変換を行う場所」です。現在のLANは、マザーボード上の電気回路 $\rightarrow$ 光トランシーバー(端子) $\rightarrow$ 光ファイバーという経路です。光インターコネクト(特にCPO)は、GPUやCPUのダイのすぐ横、あるいはパッケージ内部まで光回路を組み込みます。これにより、変換に伴う電力ロスと遅延を極限まで減らしている点が異なります。
Q3: 光インターコネクトが普及すると、CPUやGPUの性能は上がりますか? A: 演算コア自体のクロック周波数が上がるわけではありませんが、「実効性能」は劇的に向上します。どれだけ速い演算器を持っていても、データの供給が遅ければ性能は発揮できません(これをメモリウォールと呼びます)。光インターコネクトによってデータの供給速度が飛躍的に向上するため、結果としてAI学習や推論の処理時間は大幅に短縮されます。