概要
Meta Llama 3.3 70B は Meta が2024年12月6日発売したオープンウェイト LLM Llama 3.3 70B-Instruct。70B パラメータ・Llama 3.1 405B 同等性能 (パラメータ-83%・効率大幅向上)・コンテキスト 128K tokens + 出力 4K tokens・無料 + ローカル動作 + Hugging Face Llama 3.3 ライセンス・Llama 3 ファミリー (70B + 1B/3B エッジ + Llama 4 予定 2025) 主流。Llama 3.3 70B は Meta オープンウェイト LLM の2024年フラッグシップ廉価版で、「Llama 3 (8B/70B/405B・2024年7月) → Llama 3.1 (8B/70B/405B・改良版) → Llama 3.2 (1B/3B エッジ・11B/90B Vision・2024年9月) → Llama 3.3 70B (2024年12月)」の系譜上で「405B 同等性能 + 70B パラメータ」で大ヒット。Llama 3.3 70B の革新点: ① 70B で Llama 3.1 405B 同等性能 でパラメータ-83% + 推論コスト大幅低下 ② コンテキスト 128K tokens (Llama 3.1 と同) ③ オープンウェイト + 商用利用可能 (Llama 3.3 ライセンス・月7億 active user 以下なら無料商用 OK) ④ 8言語対応 (英語 + ドイツ語 + フランス語 + イタリア語 + ポルトガル語 + ヒンディー語 + スペイン語 + タイ語) ⑤ Hugging Face + Ollama + LM Studio + vLLM 等の主要プラットフォーム標準対応。主要利用: ① 自作PC ローカル LLM (Ollama + LM Studio + RTX 5090 32GB VRAM + Llama 3.3 70B Q4_K_M) ② Mac mini M4 / MacBook Pro M4 Max (64-128GB 統合メモリ) ③ エンタープライズ オンプレミス LLM (データプライバシー重視) ④ クラウド推論 (AWS Bedrock + Together AI + Groq + Replicate) ⑤ オープンソース AI コミュニティ + 研究。
主な特徴・仕組み
- 発売: Meta (米国)・2024年12月6日
- モデル: Llama 3.3 70B-Instruct
- アーキテクチャ: Transformer (Decoder-only)
- パラメータ: 70B (Llama 3.1 70B と同・効率向上)
- コンテキスト: 128K tokens
- 出力: 4K tokens
- 訓練データ: 2024年12月まで (15T tokens 訓練)
- 対応言語: 8言語 (英 + 独 + 仏 + 伊 + 葡 + 印 + 西 + 泰)
- ライセンス: Llama 3.3 ライセンス (月7億 active user 以下無料商用 OK)
- 対応プラットフォーム: Hugging Face + Ollama + LM Studio + vLLM + AWS Bedrock + Together AI
- 量子化: Q2-Q8 (FP16 + INT8 + Q4_K_M 等の各種)
- ローカル推論要件: RTX 5090 32GB VRAM + DDR5-6400 64GB (Q4_K_M) ・MacBook Pro M4 Max 64-128GB 統合メモリ
- 競合: Mistral Large 2・DeepSeek-V3・Qwen3 235B・Claude/GPT (クラウド)
スペック比較表
| LLM | パラメータ | コンテキスト | ライセンス |
|---|
| Llama 3.3 70B |