1978件の用語
DeepSeek発中国LLMシリーズ。DeepSeek V3/V3.1(671B MoE・37B active)・R1(推論特化・OpenAI o1対抗)・R1 Distill(1.5/7/14/32/70B)・V3-0324・Coder V2/V3・Prover・VL2・Janus Pro・Math・DeepSeek V4(2026年Q2予定)、FP8 training・Multi-head Latent Attention(MLA)独自、2026年OSS MoE定番。
DeepSeekが2025年5月28日にリリースした推論モデルの大幅アップデート版。671B MoEアーキテクチャを維持しながらAIME 2025で72.6%・LiveCodeBench v5で57.4%と前世代比で大幅向上。MIT Licenseで完全オープンソース公開。
DeepSeekが独自開発したMixture-of-Expertsのエキスパート割り当て機構。細粒度エキスパート分割・共有エキスパート・補助損失フリーバランシングを組み合わせ、DeepSeek-V2/V3の高い性能と推論効率を支える中核技術。従来MoEに比べ負荷不均衡問題を解消しながら専門化を促進する。
DeepSeek AIが2024年5月に発表した形式定理証明(Formal Theorem Proving)特化LLM。Lean 4形式言語でMathLibベースの数学定理を機械検証可能な形で証明し、miniF2F-testで64.2%・ProofNet-testで25.3%を達成。V1.5では88.9%まで向上。
DeepSeekが2024年6月に公開したMoEアーキテクチャ採用のコード生成特化LLM。総パラメータ236B(アクティブ21B)で336の対応プログラミング言語を持ち、128Kトークンのコンテキストウィンドウを備える。
DeepSeek 2025年1月発表 OSS reasoning モデル。OpenAI o1 同等性能・MIT ライセンス・$2.19/1M・AIME 79.8%
2024年11月DeepSeek発表R1 Lite Preview・Industry-leading reasoning preview + Industry-leading 91.6 MATH benchmark + Industry-leading 52.5 AIME + Industry-leading DeepSeek R1 Lite Preview reasoning LLM preview 2024。
DeepSeekが2025年1月に公開したオープンソース推論モデル。強化学習のみで推論能力を獲得し、OpenAI o1と同等性能を無料公開したことで世界に衝撃を与えた。
中国のDeepSeekが2025年1月に公開したオープンソース推論モデル。強化学習(GRPO)で推論能力を獲得し、OpenAI o1と同等の性能をMITライセンスで提供。
DeepSeek が 2025 年 1 月に公開した推論特化型オープンソース LLM。DeepSeek V3 をベースに強化学習で Chain of Thought 能力を獲得し、o1 に匹敵する数学・コーディング性能を実現。
幻方量化が開発した、極めて高いコスト効率と推論能力を両立する中国発のAIモデル群。V3のMoEアーキテクチャとR1の高度な思考プロセスにより、従来の西側巨大資本による独占的状況を打破し、AI開発のパラダイムシフトを引き起こした。
DeepSeek社オープン推論LLM。R1(671B MoE・37B Active・GRPO RLHF・OSS MIT License)・R1-Zero(SFT無し pure RL)・V3(同base・Math/Code強化)・R1 Distill 1.5B/7B/8B/14B/32B/70B(Qwen/Llama base)・MMLU-Pro 0.84・MATH-500 0.97・LiveCodeBench 0.65・$15M training cost・2025年1月リリース・OpenAI o1相当性能、2026年LocalLLM革命起点。
2024年DeepSeek (China)発表DeepSeek-R1・Industry-leading RL-based reasoning LLM + Industry-leading DeepSeek-R1-Zero pure RL + Industry-leading MIT License open-source + Industry-leading China reasoning LLM challenger to OpenAI o1。
2023年DeepSeek AI発表DeepSeek-Coder・Industry-leading China code generation LLM + Industry-leading 1.3B-33B + V2 236B MoE + Industry-leading 86 programming languages + Industry-leading project-level code dataset。
2024年6月DeepSeek発表DeepSeek-Coder-V2・Industry-leading 236B/21B MoE + Industry-leading 338 programming languages + Industry-leading 128K context + Industry-leading DeepSeek-Coder-V2 MIT-like license open-source code LLM 2024。
中国のDeepSeek AIが開発したMixture-of-Experts(MoE)アーキテクチャのコーディング特化LLM。16B(アクティブ)/236B(総パラメータ)のLiteとFullの2モデルを提供し、GPT-4 Turboを超えるコード能力を実現した。
中国 DeepSeek が 2024 年末に公開したオープンソース大規模言語モデル。671B パラメータの MoE(Mixture of Experts)アーキテクチャで GPT-4 に匹敵する性能を低コストで実現。
2024年12月DeepSeek AI (中国Hangzhou・2023年High-Flyer Quantitative量化基金子会社設立・累計運用資金$50B+/年・中国AI startup leader・量化金融資金潤沢AI研究投資) 発表DeepSeek-V3・Industry-leading MoE scale Open weights LLM・671B total parameters (256 experts × 2.62B per expert) + 37B active params per token (Sparse activation・1/18 ratio・Industry-leading sparsity efficiency) + 128K context length + DeepSeek License (Permissive license・Commercial use可) + Multi-Token Prediction MTP + Auxiliary-loss-free load balancing + FP8 training・Industry-leading MoE scale + GPT-4o competitive performance + Cost $5.6M training (1/10 GPT-4 cost industry-shocking)。
DeepSeek社が2024年末に公開したMixture-of-Experts構造の大規模言語モデル。総パラメータ671B・有効パラメータ37Bで、推論コストを抑えつつGPT-4oクラスの性能を達成した。
DeepSeek 2024年12月発表 MoE LLM。総671B / アクティブ 37B・GPT-4o 凌駕性能・$5.5M 学習コスト破壊