概要
Meta MTIA v2は2024年4月にMeta社が発表したMeta社内AI推論用カスタムシリコン第2世代。MTIA(Meta Training and Inference Accelerator)v1(2023年5月発表)の後継で、TSMC 5nmプロセスで製造、前世代比3倍の演算性能と6倍のメモリ帯域を実現。Facebook/Instagram/Threadsの広告レコメンデーションモデル(DLRM v2系)とLlama 3推論を主用途に、Meta社の大規模インフラに統合配備されている。Grand Teton AIサーバープラットフォームに搭載され、Open Compute Project(OCP)準拠の規格でMeta社データセンターに大量導入。NVIDIA H100依存からの脱却と、Meta特有のWorkload(SparseなRecommendation Embedding)に最適化された独自設計が特徴。
主な特徴・仕組み
- TSMC 5nm製造: MTIA v1(7nm)から世代スキップ、トランジスタ密度2倍向上
- 演算性能: BF16/FP16 354 TFLOPS、INT8 708 TOPS、v1比3倍向上
- オンチップキャッシュ: 256MB SRAM、Sparse Embedding Lookupに最適化
- LPDDR5メモリ: 128GB搭載、204.8 GB/s帯域、HBMに比べ低コスト・低消費電力
- PCIe Gen5 x16: ホストCPU(AMD EPYC等)との接続、64 GB/s帯域
- Grand Teton Server: Meta独自AIサーバープラットフォーム、72x MTIA v2搭載可能
- Recommendation Model最適化: DLRM(Deep Learning Recommendation Model)Sparse-Dense Hybrid Architectureに特化
- Llama 3推論: Meta社内のFacebook/Instagram/Threads全AIサービスのLlama 3呼び出しを処理
- 省電力設計: 1チップ90W TDP、NVIDIA H100(700W)比で1/8の電力消費
- Open Compute Project: OCP規格準拠、業界他社のデータセンター転用可能性
- Open Source実装: Meta社内利用が主、外販なし(クラウドサービス展開予定なし)
スペック比較表
| 項目 | MTIA v2 | MTIA v1 (前世代) | NVIDIA H100 PCIe | Google TPU v5e |
|---|
| プロセス |