DeepSeek発中国LLMシリーズ。DeepSeek V3/V3.1(671B MoE・37B active)・R1(推論特化・OpenAI o1対抗)・R1 Distill(1.5/7/14/32/70B)・V3-0324・Coder V2/V3・Prover・VL2・Janus Pro・Math・DeepSeek V4(2026年Q2予定)、FP8 training・Multi-head Latent Attention(MLA)独自、2026年OSS MoE定番。
DeepSeek は中国発の大規模言語モデル(LLM)シリーズで、2025年に登場した V3 系列から、2026年に予定される V4 までを含む。
V3 系列は 671B パラメータを備え、37B がアクティブに動作する MoE(Mixture of Experts)構造を採用。
R1 系列は推論特化型で、OpenAI の o1 を凌駕する性能を目指し、R1 Distill では 1.5B、7B、14B、32B、70B の 5 つのサイズが提供される。
V3-0324 は 2025年12月にリリースされた改良版で、Coder V2/V3、Prover、VL2、Janus Pro、Math などの専門タスク向けモデルが統合されている。
2026年Q2に予定される V4 は FP8 トレーニングと Multi‑Head Latent Attention(MLA)を採用し、OSS MoE の定番化を図る。
| モデル | パラメータ | アクティブ | 推論速度 | 主な用途 |
|---|---|---|---|---|
| DeepSeek V3 | 671B | 37B | 1.2×10⁶ tokens/s | 大規模対話 |
| DeepSeek R1 | 70B | 70B | 2.5×10⁶ tokens/s | 低レイテンシ推論 |
| DeepSeek V3‑0324 | 671B | 37B | 1.4×10⁶ tokens/s | コード生成 |
| DeepSeek V4 | 1.0T | 1.0T | 3.0×10⁶ tokens/s | 次世代総合AI |
Q1. DeepSeek V4 はいつリリースされますか?
A1. 2026年Q2を予定。FP8 トレーニングと MLA が導入される。
Q2. R1 Distill の 1.5B モデルはどのような用途に適していますか?
A2. 小規模対話やエッジデバイス向けで、低レイテンシと省電力を重視。
Q3. DeepSeek の MoE 構造はどのように動作しますか?
A3. 671B パラメータのうち 37B が同時にアクティブになり、タスクに応じて専門層が選択される。
DeepSeek 系列は 2025年から 2026年にかけて、MoE、MLA、FP8 などの先進技術を組み合わせ、次世代 AI の性能を牽引する。
自作PCでの構築は GPU、CPU、メモリ、ストレージを高性能に揃え、推論速度と省電力を両立させることが鍵。
V4 の登場でさらに高速化と汎用性が向上し、2026年以降の AI エコシステムに大きな影響を与えることが期待される。