2472件の用語
Microsoft Research が開発したマルチエージェント会話フレームワーク。複数のLLMエージェントが会話形式で協調・議論・タスク実行する仕組みを提供し、コード生成・数学問題・リサーチ等の複雑なタスクを自動化する。2024年にv0.4で大規模リアーキテクチャ。
2024年Microsoft Research発表AutoGen v0.4・Industry-leading multi-agent conversation framework + Industry-leading code execution agents + Industry-leading 35,000+ GitHub stars + Industry-leading Microsoft Research AutoGen MIT multi-agent conversation framework 2024。
2023年Microsoft Research発表AutoGen・Industry-leading multi-agent conversation framework + Industry-leading agent-to-agent conversation + Industry-leading Microsoft research-grade + Industry-leading 30k+ GitHub stars。
マルチエージェントフレームワーク。Microsoft Autogen 0.4(Python・Conversation-based・AgentChat)・CrewAI(Role-based・Sequential/Hierarchical・Process)・LangGraph(Graph-based・LangChain)・MetaGPT(SOP・Software Company simulate)・Swarm(OpenAI Cookbook experimental)・AgentNetwork・Phidata・BabyAGI・AutoGPT(legacy)・SuperAGI・Devin AI・2026年Claude Agent SDK + Subagents主流、Enterprise採用拡大。
Liu et al.(2023)が提案した人間が読める自然なjailbreak promptを自動生成するLLM攻撃手法。GCGが意味不明なsuffixを生成するのに対し、AutoDANは遺伝的アルゴリズムで自然言語として読めるjailbreak promptを進化させる。perplexity filterをバイパスできる。
Overfitting(オーバーフィット)は、人工知能(AI)や機械学習において避けて通れない課題であり、モデルの汎化性能を大きく損なう可能性のある現象です。本稿では、Overfittingの基本概念から、具体的な種類、選択・購入ガイド、実際の取り扱い方法までを網羅的に解説します。PC自作に関わるAI・機械学習の応用例にも触れながら、初心者から上級者まで理解を深めることを目指します。
オープンソースのLLM強化学習訓練フレームワーク。PPO・GRPO・DPO・KTO等のRL/Preferenceアルゴリズムを統一的に実装し、DeepSpeed ZeROとvLLMを組み合わせて7B〜70B規模モデルのポストトレーニングを容易にする。
2015年Sam Altman + Elon Musk + Greg Brockman + Ilya Sutskever等7人共同創業OpenAI。米国SF + Pro Famous Non-profit→For-profit Pivot + Pro GPT-3 2020 + Pro ChatGPT 2022-11-30 Pro Mainstream革命 + Pro GPT-4 2023-03 + Pro o1/o3 2024-2025 + Pro Microsoft連携 + Pro Mainstream LLM業界Top独占代表機。
OpenAIが2025年4月に一般公開した最上位推論モデル。ARC-AGI-1で87.7%を達成し、PhD水準の科学・数学・コーディング課題を自律的に解く能力を持つ。
OpenAIが2025年4月にo3と同時リリースした軽量高速推論モデル。入力$1.10/1Mとo3の約9分の1のコストで、数学・コーディング性能はo1-proを上回る費用対効果特化型。
OpenAI 2024年発表の Agent 開発 SDK。Swarm (実験版) → Agents SDK 商用版・Python + JS 対応・「OpenAI 公式エージェント開発主流 SDK」.
OpenAI Agent構築SDK(2025年3月)。Agents SDK(Python)・Handoffs(Agent間委譲)・Guardrails(入力/出力検証)・Tracing(完全可視化)・Responses API・Computer Use Tool(GPT-4.1 + o3)・Web Search Tool・File Search Tool・Code Interpreter・Operator($200 ChatGPT Pro)・Deep Research・Realtime API・2026年Claude Agent SDK/Gemini Agent Toolkit競合。
OpenAIが提供する、大規模言語モデル(LLM)をはじめとする高度なAI機能を外部アプリケーションへ統合するためのインターフェース。テキスト生成、画像解析、音声認識などのマルチモーダル機能をプログラム経由で利用可能にする基盤技術。
OpenAIが2025年にリリースしたo1の後継推論モデル。ARC-AGI-1で87.5%を達成し、抽象的推論・視覚的パターン認識でも人間専門家レベルの性能を示す。o3-miniとともに推論モデルシリーズの最高峰。
OpenAIが2025年1月に公開した推論特化の小型モデル。連鎖思考(Chain-of-Thought)を内部で実行し、数学・科学・コーディング問題でo1を上回るコストパフォーマンスを実現。
OpenAIが2024年9月にリリースした推論特化型LLM。応答前に内部で長時間思考(Chain-of-Thought)を行い、数学・科学・コーディングで従来モデルを大幅に超える性能を発揮する。
2024年OpenAI発表o1・Industry-leading test-time compute scaling LLM + Industry-leading chain-of-thought reasoning native + Industry-leading o1-preview/mini + Industry-leading OpenAI reasoning LLM founder。
OpenAIが開発した、Chain-of-Thought(思考の連鎖)を内部的に実行する推論特化型モデル。回答生成前に自己検証と修正プロセスを経ることで、数学やプログラミング等の高度な論理的課題解決に長けている。
OpenAI Reasoning Model Series(2024年9月-)。o1-preview/o1(Strawberry・Chain-of-Thought内部化・$15/$60 per M token)・o1-mini(推論特化・Math/Code)・o3(2024年12月発表・AGI benchmark記録)・o3-mini・o4(2025年Q4予想)・Anthropic Claude Extended Thinking・DeepSeek-R1(OSS reasoning・2025年1月)・Google Gemini 2.0 Thinking・推論時間scaling law・Test-time compute・2026年reasoning model主流、science/math domain超人化。
OpenAI 2024年9月発表 chain-of-thought RL 学習 reasoning モデル。AIME 83%・Codeforces 89 percentile・PhD レベル数学/コード