Meta AI 2024年4月発表のオープンソース LLM。8B/70B/405B 3 サイズ展開・Apache 2.0 License・GPT-4 同等性能 (405B)・Hugging Face 公開・累計5億+ download。
Meta Llama 3 は Meta AI が2024年4月18日発表したオープンソース LLM。Llama 2 (2023年7月) 後継・8B (約8GB VRAM) / 70B (約40GB) / 405B (約220GB) の3 サイズ展開・Apache 2.0 ライク Llama License (商用利用可・MAU 700M 以下条件)・GPT-4 同等性能 (405B 版) ・Hugging Face 公開 + 累計5億+ download。Llama 3.1 (2024/7・コンテキスト128K)→Llama 3.2 (2024/9・マルチモーダル+1B/3B/11B/90B)→Llama 3.3 (2024/12・70B のみ・性能向上で 405B 並み) と短期間で改良更新。Meta AI 主導のオープン LLM 革命で、OpenAI GPT-4 + Anthropic Claude 3 + Google Gemini Ultra のクローズドソースに対する OSS 最強対抗馬として2024年に確立。Ollama (https://ollama.com)・llama.cpp (Georgi Gerganov)・LM Studio (LM Studio AI)・Hugging Face Transformers 経由で誰でもローカル動作可能で、自作 PC + GPU 構成で GPT-4 並み AI を月額費用ゼロで運用可能になった。
| サイズ | 発表年 | パラメータ | 必要 VRAM (Q4_K_M) | 用途 |
|---|---|---|---|---|
| Llama 3 8B | 2024/4 |
| 8B |
| 6GB |
| エントリ自作PC |
| Llama 3 70B | 2024/4 | 70B | 48GB | デスクトップAI |
| Llama 3.1 405B | 2024/7 | 405B | 256GB | サーバ AI |
| Llama 3.2 1B | 2024/9 | 1B | 1GB | スマホ AI |
| Llama 3.2 11B Vision | 2024/9 | 11B | 8GB | マルチモーダル |
| Llama 3.3 70B | 2024/12 | 70B | 48GB | 405B 並み 高効率 |
Meta Llama 3 は2026年現在 オープンソース LLM の業界標準で、自作 PC + RTX GPU でローカル AI 推論を実現する革命的モデル。Llama 3.3 70B Q4_K_M (39GB) は RTX 5090 32GB 単体不可 だがRTX 5090 + RTX 4090 24GB の2枚構成 (合計56GB) または MacBook Pro M4 Max 64GB Unified Memory で完全動作可能。Llama 3 8B Q4_K_M (4.7GB) は GTX 1660 6GB+ で動作で、超エントリー自作 PC でも GPT-3.5 並み AI 体験可能。月額費用ゼロで動作する点が ChatGPT Plus ($20) /Claude Pro ($20) /Gemini Advanced ($19.99) を完全代替可能な選択肢。Ollama (https://ollama.com・無料) で ollama run llama3.3 1コマンドで70B モデル即起動・LM Studio は GUI で初心者向け、llama.cpp は最先端最高速。プライバシ + オフライン用途では Llama 3 ローカル推論が圧倒的に優れ、医療データ + 機密文書処理 + コーディング etc. でクラウド AI 利用不可場面で活躍。Llama 3.2 マルチモーダル (11B/90B Vision) は画像説明 + OCR + 図解理解に対応で、Claude Sonnet マルチモーダル機能をローカル代替可能。
Q1: Llama 3 と GPT-4 どちらが優秀? A: 405B 版は GPT-4 同等の MMLU/HumanEval スコア・8B/70B はGPT-3.5 〜 GPT-4 mini 級。クラウド AI ($20-$200/月) との比較では月額費用ゼロが圧倒的優位。
Q2: ローカル動作の必要構成は? A: 8B (Q4_K_M 4.7GB) は GTX 1660 6GB+・70B (Q4_K_M 39GB) は RTX 4090 24GB ×2 + or M3 Max 64GB・405B は サーバ専用 GPU 8×H100。
Q3: Llama 3 vs 3.1 vs 3.2 vs 3.3 違い? A: 3.0 (2024/4) は初代・3.1 (7月) はコンテキスト 128K + 405B 追加・3.2 (9月) はマルチモーダル+小型版・3.3 (12月) は70B のみ・405B 並み性能で大幅効率化。