1978件の用語
1989年Yann LeCun発表Optimal Brain Damage paper先駆け・Industry-leading Weight Magnitude Pruning Baseline paradigm + Industry-leading simple weight magnitude criterion + Industry-leading 35+ years foundational pruning paradigm + Industry-leading neural network pruning Baseline paradigm Pioneer。
2024年2月Magnific AI公開(Freepik 2024-08買収)。Pro 業界Pro Mainstream AI Upscale Top + Pro Hallucination Mode Pro Famous + Pro Javi Lopez + Emilio Nicolás Pro Co-founders + Pro $39/月 + Pro 4x-16x Upscale + Pro Freepik $1B Valuation買収 + 2025-Pro Magnific AI 2.0 + 累計2024-2025年Heritage。
Zhangら(2024)が提案したアライメントデータ生成手法。LLMのpre-query template(システムプロンプト+ユーザーターンの空行)だけを与えてLLM自身に質問を自己補完させ、大量のQ&A合成データを抽出する。
プロンプトを用意せず、LLMのデコード機構を直接利用して指示と応答を同時生成する合成データ手法。LLMに「Human:」だけを与えると自動的に指示を補完し続ける性質を利用し、大量の自然な指示データを低コストで生成できる。
事前学習済みLLMにシステムプロンプトなしで推論させ、モデル自身が生成した高品質instructionデータを自動収集する合成データ手法。
2024年6月UW + Tsinghua発表Magpie・Industry-leading aligned LLM self-synthesis + Industry-leading 4M synthetic instructions + Industry-leading no human seed needed + Industry-leading UW Magpie alignment-data synthetic instruction generation 2024。
2024年Xu et al. + UCLA発表Magpie paper・Industry-leading Aligned LLM self-synthesis paradigm + Industry-leading Magpie pre-query self-synthesis + Industry-leading UCLA 2024年latest data augmentation。
Carnegie Learningが開発した数学特化型AI適応学習システムで、個々の学習者のつまずきパターンをモデル化し最適な問題と解説を動的に提供する。
Mistral AI が 2025 年 9 月公開した推論特化型 LLM。Chain of Thought を内蔵化し、数学・コード・論理推論ベンチで大型モデルに匹敵する性能を 24B クラスのオープンウェイトで実現。
2024年Magic Patterns公開Magic Patterns。Pro 業界Pro Mainstream Designer向けAI UI Generator Top + Pro 米国SF + Alex Danilowicz Pro Co-founder + Pro Figma連携Pro Famous + Pro React/Tailwind/shadcn生成 + Pro $20/月 Pro Plan + 累計2023-2026年3年Heritage継承代表機。
テキスト指示による画像編集のための高品質人手アノテーションデータセットおよびモデル。Amazon MTurkによる精密な人手編集ペア9,316枚を収録し、InstructPix2Pixの精度を大幅に向上させたNeurIPS 2023採択研究。Zhejiang University発。
Machine Learning Opsは、人工知能・機械学習分野における重要な概念・技術です。
コードと数学推論を統合したLLM。19.2Bトークンの数学+コードデータセット(MathCode-Pile)で学習し、PythonコードをChain-of-Thought推論ツールとして活用して競技数学・STEM問題を解く。
上海AI研究院が開発したProcess Reward Modelの自動アノテーション手法。人手ラベルなしにモンテカルロ木探索(MCTS)でステップ単位の正誤確率を推定し、大規模PRMデータセットを低コストで構築する。
GoogleがCC-100から構築した419言語対応の大規模多言語Webコーパス。低リソース言語を含む高品質なデータセットで、多言語LLM・翻訳モデルの事前学習基盤として広く活用される。
2024年Monica (China)発表Manus・Industry-leading autonomous task agent + Industry-leading Claude+browser+code multi-agent + Industry-leading China agent flagship + Industry-leading Manus AI viral 2025年3月。
2024年Alibaba MarcoPolo team発表Marco-o1・Industry-leading open o1-like reasoning + Industry-leading MCTS Monte Carlo Tree Search + Industry-leading Qwen2-7B-based + Industry-leading Alibaba MarcoPolo open reasoning challenger。
2024年MultiOn公開MultiOn API。Pro 業界Pro Mainstream Web Agent SaaS API先駆 + Pro 米国SF MultiOn + Pro 2022-MultiOn設立Div Garg Stanford大博士 + Pro Web Browse Multi-step Agent + Pro Retriever Architecture + Pro Agent Q推論 + Pro $0.01/step + 累計2022-2026年4年Heritage継承代表機。
2024年成熟Multi-Query Attention・Industry-leading single KV head shared across queries + Industry-leading 10x+ KV cache reduction + Industry-leading inference speedup + Industry-leading Noam Shazeer Google MQA fast inference attention 2024。
全QueryヘッドがKey/Valueヘッドを1つ共有するアテンション機構。KVキャッシュを最小化することで推論速度を大幅に向上させるが、モデル品質はMHAより若干低下する傾向がある。