2472件の用語
2023年Subhabrata Mukherjee et al. (Microsoft)発表Orca・Industry-leading explanation tuning + Industry-leading GPT-4 teacher model + Industry-leading step-by-step reasoning trace + Industry-leading Orca + Orca 2 progressive learning。
OrcaはMicrosoft Researchが2023年に発表した、GPT-4の詳細な推論プロセス(思考の連鎖)を教師データとして小型LLMに蒸留するInstruction Tuning手法であり、推論能力の効率的な転移を実現した。
MicrosoftのOrca論文が提案した、GPT-4の思考過程(Chain-of-Thought)ごと模倣する合成データ生成スタイル。単なる回答ではなく推論プロセス全体を小型モデルに蒸留する手法で、少量高品質データの優位性を示した。
Canopy Labsが2025年2月に公開した30億パラメータの会話型テキスト音声合成モデル。LLaMA-3をベースに音声トークンを組み込み、[laugh]・[sigh]等の感情タグで表現豊かな自然音声を生成できる。
Canopi AIが公開した3Bパラメータのオープンソース音声合成モデル。感情タグ・笑い・ため息などの非言語音声表現に対応し、人間らしい音声品質を実現。
Allen Institute for AIが2024年に公開した完全オープンソースのMoEモデル。7B相当の総パラメータで1B有効パラメータを使用。学習データ・コード・重みすべてを公開した透明性の高いモデル。
Allen Institute for AIが開発したオープンソースドキュメントパーシングLLM。学術・Web文書のPDFを高精度にMarkdownへ変換し、LLM学習データ品質向上を目的として設計された。
2024年Q2 Google DeepMind共同発表Online DPO paper・Industry-emerging Online Direct Preference Optimization paradigm + Industry-leading Online preference learning Industry-emerging paradigm Pioneer + Industry-leading Online DPO Industry-emerging continuous learning paradigm + Industry-leading Google DeepMind academic + Industrial integrated research foundation。
Anysphere 2023年3月公開AI Code Editor Cursor。VS Code Fork + Multi-LLM(Claude 3.5/GPT-4o/o1) Native + Composer Multi-File Edit + Tab Code Completion・$0(無料) + $20/月Pro、Pro Programmer業界AI Code Editor Top。
Anysphere 2023年発売の AI 統合開発環境 (IDE)。VS Code フォーク + GPT-4 + Claude 3.5 Sonnet 統合・$20/月から・「AI コーディング業界主流」.
AI Code Editor(2023-2026年)。Cursor($20/mo Pro・$40/mo Business・VS Code fork・Claude Sonnet 4.6/Opus/Gemini/GPT-4o・Agent/Chat/Tab・@Docs @Codebase @Web)・Windsurf(Codeium製・Cascade agent・$15/mo Pro)・Zed(OSS・Rust・AI統合)・GitHub Copilot Workspace・JetBrains AI Assistant・Continue.dev(OSS extension)・Aider CLI・Cline(VS Code extension・OSS)・2026年Cursor+Windsurf主流、Copilot存在感低下、Claude Code補完。
2023年Anysphere公開Cursor AI。Pro 業界Pro Mainstream AI IDE Top + Pro 米国SF Anysphere + Pro VSCode Fork基盤 + Pro Claude/GPT-4/Gemini対応 + Pro Composer + Pro Tab Completion + Pro $9B Valuation Pro Famous + 累計2022-2026年4年Heritage継承代表機。
2024年Anysphere公開Cursor Composer Multi-file編集機能。Pro 業界Pro Mainstream Multi-file AI編集Composer先駆 + Pro 米国SF Anysphere + Pro 2022-Anysphere設立 + Pro Multi-file Edit + Agent Mode + Pro Tab補完 + Pro Pro Plan $20/月 + 累計2022-2026年4年Heritage継承代表機。
2024年Cursor (Anysphere)発表Composer Agent・Industry-leading AI code editor agent + Industry-leading multi-file editing + Industry-leading Claude+GPT switchable + Industry-leading Cursor IDE agent flagship。
2024年5月公開Cartesia Sonic。Pro Sub-100ms Latency Pro Famous類無し + Pro 元Stanford SSM(Mamba)研究設立 + Pro Mamba Architecture Voice AI業界出発点 + Pro Real-time Voice AI業界Top独占 + 2024-09 Sonic Turbo + 2025-Pro Sonic 2.0公開 + 累計2024-2025年Heritage。
LLMアプリケーションにガードレール機能をAPIとして提供するサービス。AWS Bedrock Guardrails・Azure AI Content Safety・NVIDIA NeMo Guardrailsなど、入出力検査をマネージドAPIで統合する。
LLM の出力を検証・構造化するオープンソースフレームワーク。50以上の組み込みバリデータ(PII検出・有害性フィルタ・JSON スキーマ準拠・事実性チェック等)を提供し、出力が仕様に合致しない場合の自動再試行・修正機能を備える。Guardrails Hub でコミュニティ製バリデータを共有・再利用できる。
KTO(Kahneman-Tversky Optimization)は、ペア化された選好データではなく個別の「良い/悪い」バイナリフィードバックから直接LLMを最適化する手法で、プロスペクト理論に基づく損失関数を使用する
ALiBiを一般化したTransformerの相対位置エンコーディング手法。対数(log)または冪乗(power)カーネル関数を用いて距離に応じた注意バイアスを生成し、ALiBiより豊かな位置表現と長さ外挿能力を実現する。
MicrosoftリサーチチームがLLMの生成フローをプログラム的に制御するために開発したPythonライブラリ。テンプレート構文でLLM呼び出しと条件分岐・ループを混在させた「制御可能生成」を実現。