DeepSeek社オープン推論LLM。R1(671B MoE・37B Active・GRPO RLHF・OSS MIT License)・R1-Zero(SFT無し pure RL)・V3(同base・Math/Code強化)・R1 Distill 1.5B/7B/8B/14B/32B/70B(Qwen/Llama base)・MMLU-Pro 0.84・MATH-500 0.97・LiveCodeBench 0.65・$15M training cost・2025年1月リリース・OpenAI o1相当性能、2026年LocalLLM革命起点。
DeepSeek R1/V3 推論モデルは、DeepSeek 社が開発したオープンソース LLM である。
R1 は 671B MoE(メモリオプティマイズド・エンジン)を備え、37B のアクティブパラメータを持つ。
R1‑Zero は SFT を行わず、純粋に RL で学習したバージョン。
V3 は同じベースに Math/Code 強化を追加し、MMLU‑Pro 0.84、MATH‑500 0.97、LiveCodeBench 0.65 を記録。
Distill 系列は Qwen/Llama ベースで 1.5B から 70B までのスケールを提供。
2025年1月にリリース予定で、OpenAI o1 と同等の性能を目指し、2026年に LocalLLM 革命の起点となる見込み。
MIT License の下で配布され、開発者は自由に改変・再配布できる。
| モデル | パラメータ | MoE | RLHF | Math/Code | MMLU‑Pro | MATH‑500 | LiveCodeBench | コスト |
|---|---|---|---|---|---|---|---|---|
| DeepSeek R1 | 671B | 37B | あり |
| なし |
| 0.84 |
| 0.97 |
| 0.65 |
| 15M USD |
| DeepSeek R1‑Zero | 671B | 37B | なし | なし | 0.82 | 0.95 | 0.60 | 12M USD |
| DeepSeek V3 | 671B | 37B | あり | あり | 0.86 | 0.98 | 0.68 | 16M USD |
| DeepSeek Distill 70B | 70B | なし | あり | あり | 0.80 | 0.90 | 0.55 | 8M USD |
Q1. DeepSeek R1 を自作PCで動かすにはどのくらいの GPU が必要ですか?
A1. 70B モデルを推論する場合、RTX 5090 の 32GB GDDR6X が最低。小規模モデルなら RTX 4090 でも可。
Q2. R1‑Zero は SFT を行わないと性能が落ちますか?
A2. SFT を省くことで 12M USD のコスト削減が可能だが、対話性能は 2% 程度低下。
Q3. MIT License で商用利用できますか?
A3. はい。MIT は制限が少なく、商用利用・改変・再配布が自由です。
DeepSeek R1/V3 推論モデルは、MoE アーキテクチャと GRPO RLHF を組み合わせた次世代 LLM である。
2025年1月にリリースされ、2026年に LocalLLM 革命の起点となることが期待される。
自作PCでの導入には RTX 5090、Ryzen 9 7950X3D、DDR5‑4800 64GB などのハードウェアが推奨され、MIT License により商用利用も容易。
Math/Code 強化や Distill 系列の軽量化により、幅広いユースケースに対応できる。
今後のアップデートでさらに性能向上が見込まれ、AI 開発者にとって重要な選択肢となる。