ARM CPU行列演算拡張。Apple AMX(Advanced Matrix Extension・M1-M4・非公開・Accelerate framework経由)・AMX2(M4 enhance・BF16対応)・ARM NEON(SIMD 128bit)・ARM SVE(Scalable Vector Extension・Grace Hopper)・SVE2(Neoverse V2)・MLX(Apple ML framework)・MPS(Metal Performance Shaders)・CoreML対応、2026年M5 AMX3 + Neural Engine Transformer最適化。
Apple AMX/NEON/SVE2 は ARM ベースの CPU に組み込まれた行列演算拡張で、機械学習や画像処理の高速化を目的としている。M1 から M5 までの Apple シリーズで実装され、NEON は 128bit SIMD、SVE は可変長ベクトル、SVE2 は Neoverse V2 で拡張された。Accelerate フレームワークや Metal Performance Shaders (MPS) を通じて、CoreML との連携が可能である。2026年に登場予定の M5 AMX3 では Neural Engine が Transformer モデルに最適化される見込みだ。
| 製品 | AMX | AMX2 | NEON | SVE | SVE2 | 主なベクトル長 | 主な用途 |
|---|---|---|---|---|---|---|---|
| M1 | あり | なし | あり | なし | なし | 128bit | 画像処理 |
| M2 | あり | なし | あり | あり | なし | 256bit | AI 推論 |
| M3 | あり | あり | あり | あり | なし | 512bit | データ解析 |
| M4 | あり | あり | あり | あり | あり | 1.024bit | 高精度計算 |
| M5 | あり | あり | あり | あり | あり | 2.048bit | 次世代 AI |
*数値はベクトル長を示し、実際のスループットは 1.2GHz から 3.0GHz のクロックで 10.0GHz 以上に達する場合もある。
Q1. AMX と NEON の主な違いは何ですか?
A1. AMX は 128bit 行列演算専用で高速化を図り、NEON は 128bit SIMD で汎用演算を行う。
Q2. SVE2 はどのような場面で有効ですか?
A2. 大規模データセットの行列演算や 64bit 以上のベクトル長が必要な AI モデルで効果的。
Q3. M5 の Neural Engine はどのくらい高速ですか?
A3. AMX3 と組み合わせると Transformer 推論で 4x 以上のスループット向上が報告されている。
Apple の AMX/NEON/SVE2 は、M1 から M5 までの CPU で段階的に拡張され、機械学習や高精度計算に不可欠なハードウェアを提供している。2025年・2026年のリリーススケジュールを踏まえ、次世代 AI アプリケーションを想定した自作PC構築では、ベクトル長・クロック・TDP などのスペックを総合的に評価することが重要だ。最新の AMX3 と Neural Engine の組み合わせにより、Transformer などの大規模モデルでも高速推論が可能になるため、今後の AI エコシステムにおける競争力を高める鍵となる。