Meta Llama 3とは？（メタラマスリー）わかりやすく解説

Q: Meta Llama 3とは？

Meta AI 2024年4月発表のオープンソース LLM。8B/70B/405B 3 サイズ展開・Apache 2.0 License・GPT-4 同等性能 (405B)・Hugging Face 公開・累計5億+ download。

概要

Meta Llama 3 は Meta AI が2024年4月18日発表したオープンソース LLM。Llama 2 (2023年7月) 後継・8B (約8GB VRAM) / 70B (約40GB) / 405B (約220GB) の3 サイズ展開・Apache 2.0 ライク Llama License (商用利用可・MAU 700M 以下条件)・GPT-4 同等性能 (405B 版) ・Hugging Face 公開 + 累計5億+ download。Llama 3.1 (2024/7・コンテキスト128K)→Llama 3.2 (2024/9・マルチモーダル+1B/3B/11B/90B)→Llama 3.3 (2024/12・70B のみ・性能向上で 405B 並み) と短期間で改良更新。Meta AI 主導のオープン LLM 革命で、OpenAI GPT-4 + Anthropic Claude 3 + Google Gemini Ultra のクローズドソースに対する OSS 最強対抗馬として2024年に確立。Ollama (https://ollama.com)・llama.cpp (Georgi Gerganov)・LM Studio (LM Studio AI)・Hugging Face Transformers 経由で誰でもローカル動作可能で、自作 PC + GPU 構成で GPT-4 並み AI を月額費用ゼロで運用可能になった。

主な特徴・仕組み

発表: Meta AI・2024年4月18日 (Llama 3 8B/70B)
License: Llama 3 Community License (Apache 2.0 派生・商用利用可)
サイズ: 8B/70B/405B (3 種類)
コンテキスト: 8K (Llama 3) → 128K (Llama 3.1+)
学習データ: 15兆 tokens (Llama 2 の 2.5倍)
マルチモーダル: Llama 3.2 (2024/9) で画像対応 (11B/90B・Vision モデル)
対応ランタイム: Ollama・llama.cpp・LM Studio・vLLM・SGLang・Hugging Face TGI
量子化: GGUF 4bit (Q4_K_M) で 8B = 4.7GB・70B = 39GB・405B = 220GB
推論速度: 8B Q4_K_M で RTX 4090 上 100 tokens/秒・70B で 30 tokens/秒
必要 GPU VRAM: 8B = 6GB・70B = 48GB・405B = 256GB
競合: Mistral Large 2・Qwen 2.5 72B・DeepSeek V3 (671B MoE)

スペック比較表

サイズ	発表年	パラメータ	必要 VRAM (Q4_K_M)	用途
Llama 3 8B	2024/4

メニュー

Meta Llama 3（メタラマスリー）

メニュー

Meta Llama 3（メタラマスリー）

概要

主な特徴・仕組み

スペック比較表

この用語に関連するコンテンツ

具体例・対応製品

自作PCでの選び方・注意点

関連用語との違い

よくある質問（FAQ）