2024年Microsoft公開のCustom AI Accelerator。Maia 100 SoC+TSMC N5+105B transistor+1.6TB/s HBM2e+800Gbps Network+Azure OpenAI inference+GPT-4 service向け。
Microsoft Maia 100は2024年第1四半期から本格稼働を開始したMicrosoft Azure社内専用のカスタムAIアクセラレータ。2023年11月のMicrosoft Igniteで発表され、2024年に量産化されてAzure OpenAI Service上のGPT-4・GPT-4 Turbo推論の主力基盤として配備された。同時発表されたMicrosoft Cobalt 100(汎用ARMサーバーCPU)とペアで運用される設計で、Microsoft社のAIインフラ垂直統合戦略の中核を担う。TSMC N5プロセスで製造、105B transistorと業界最大級のチップで、HBM2e 64GB+1.6TB/s帯域+800Gbps相互接続を備えた強力なAI推論ハードウェア。GPT-4の推論コストを大幅削減し、Microsoftの巨額NVIDIAGPU調達費を圧縮する戦略的役割を担う。
| 項目 | Maia 100 | NVIDIA H100 SXM | AWS Inferentia2 | Google TPU v5p |
|---|---|---|---|---|
| プロセス | TSMC N5 |
| TSMC N4 |
| TSMC N7 |
| TSMC N5 |
| Transistor | 105B | 80B | 不明 | 不明 |
| 演算性能 | ~1.0 PFLOPS BF16 | 1.51 PFLOPS BF16 | 0.19 PFLOPS BF16 | 0.46 PFLOPS BF16 |
| メモリ | 64GB HBM2e | 80GB HBM3 | 32GB HBM | 95GB HBM2e |
| メモリ帯域 | 1.6 TB/s | 3.35 TB/s | 0.82 TB/s | 2.76 TB/s |
| 接続 | 800Gbps Network | NVLink 900GB/s | NeuronLink 192GB/s | ICI 3D-Torus |
| TDP | ~700W | 700W | ~25W | ~270W |
| 用途 | Azure社内AI推論 | 汎用 | AWS社内/外販 | Google Cloud |
| 提供形態 | Azure社内のみ | OEM/Cloud | AWS Inferentia2 EC2 | Google Cloud TPU |
Maia 100はMicrosoft Azure社内利用専用で、自作PCには搭載不可能。一般ユーザーがアクセスする経路はAzure OpenAI Service・Microsoft Copilot Pro/Enterprise経由のみで、推論HWの違いを意識する必要はない。AI Accelerator市場の文脈で重要なのは、Microsoft・Meta・Amazon・Google・OpenAIといった大手AI企業が、それぞれ独自カスタムシリコンに投資する垂直統合の流れ。NVIDIAGPU依存度低減と推論コスト最適化が共通の目的で、Maia 100はその中で「Microsoftの選択肢」を表現する存在。Microsoft+TSMC+OpenAIのトリプル提携でハードウェア・ソフトウェア・モデルの一気通貫設計を実現し、GPT-4の推論コストを大幅削減した点が業界へのインパクト。OpenAIのo3シリーズ等、推論時間の長いReasoning Modelの登場で、推論HW最適化はさらに重要性を増す。
Microsoft Cobalt 100との違い: Cobalt 100はARM-basedの汎用サーバーCPU(128 Neoverse N2 cores)、Maia 100はAI推論専用GPU相当。両者ペアで「ARMサーバー+独自AIチップ」のフルスタック垂直統合を構成。役割分担は明確。 NVIDIA H100との違い: H100は汎用CUDA Ecosystem+1.51 PFLOPS BF16+OEM販売、Maia 100はAzure社内専用+~1.0 PFLOPS+OpenAI共同最適化。性能はH100が上だが、Microsoft特化Workload(GPT-4推論)で実効性能が逆転する場面あり。
Q1: Maia 100は外販されますか? A: 外販予定なし、Azure社内利用のみ。Microsoft+TSMC+OpenAIのクローズドエコシステムで運用され、競合優位性を保つ戦略。一方、Azure OpenAI ServiceはMaia 100経由で全世界に提供される。
Q2: GPT-4 InferenceがMaia 100でどれだけ高速化された? A: 公式数字は非開示だが、業界アナリスト推定でレイテンシ20-30%改善、コスト40%削減。OpenAIモデルカーネルのMaia向け最適化と液冷システムの組み合わせ効果。
Q3: Maia 200はいつ登場? A: Microsoft公式発表なし、業界推測で2025年末〜2026年。Maia 100→200で性能2倍・HBM3採用・5nm→3nm移行が予想される。OpenAI o3/o4・GPT-5世代モデル対応が主目的。