2472件の用語
Agentic RAGにおいてエージェントが生成した回答の品質を自己評価し、不足・誤り・矛盾を検出して自律的に修正する機能。CRAG・Self-RAG等の手法が代表的。
Agentic RAGにおいてエージェントが複数の検索・推論ステップを連鎖的に実行し、単一ステップでは到達できない深い分析や複合的な回答を生成する技術。
AI Agent Framework比較。Anthropic MCP (Model Context Protocol・Claude Desktop+SDK)・OpenAI Function Calling・LangGraph 0.2 (Stateful)・PydanticAI 0.2 (Type-Safe)・LlamaIndex Agent Workflows・Microsoft Magentic-One・AutoGen v0.4・CrewAI 0.86・Swarms・smolagents (HF)・Bee Agent (IBM)・Mastra (Vercel)・Agentic 1.x・¥0 OSS、2026年MCP標準化加速。
2024年成熟AgentBench・Industry-leading LLM-as-Agent benchmark + Industry-leading 8 distinct environments + Industry-leading API+Sim+OS+DB+KG+Card+CodeKG+Lateral + Industry-leading Tsinghua + UC Berkeley AgentBench LLM-as-Agent benchmark 2024。
AI Agent評価Benchmark。SWE-Bench Verified (500 GitHub Issues・Claude 3.7 Sonnet 49.3%・o3 71.7%)・SWE-Bench Lite・Aider Polyglot Bench (5 言語・Claude 3.5 Sonnet 49% / o1 72%)・τ-bench (Tool-Use・Tau-Bench)・GAIA・WebArena (Web Agent)・MLE-Bench (Kaggle 75 ML Tasks)・OSWorld (Computer Use)・Cybench (CTF Cyber)・¥0 OSS、2026年Computer Use Agent Bench拡大。
HKUSTと北京大学が2023年に共同開発したアラビア語特化LLM。Llama 2をベースにアラビア語コーパスで継続事前訓練とinstruction tuningを実施し、AceValベンチマークでGPT-3.5に匹敵するアラビア語性能を達成した。
AWS が 2023 年公開した第 2 世代 AI 推論特化 ASIC アクセラレータ。チップあたり 190 TFLOPS + 32GB HBM2e、Stable Diffusion / Llama 2 等の推論で同等 GPU 比 4 倍コスト効率、AWS EC2 Inf2 インスタンス搭載。
Amazon Web Services が開発した第2世代 AI 学習専用チップ Trainium2。前世代比で性能 4 倍、エネルギー効率 2 倍を実現し、EC2 UltraCluster で最大 10 万チップの超大規模学習クラスタを構成できる。
2024年AWS公開のCustom AI Training Accelerator第2世代。1.3PFLOPS BF16+96GB HBM3+UltraServer 64chip+Trn2 EC2 Instance+EFA v3+Neuron SDK 2.20を搭載。
Activation-aware Weight Quantization。活性化の大きさから重要な重みチャネルを特定して保護し、4bit量子化の精度劣化を抑えるLLM量子化手法。GPTQより高精度とされGPU推論で広く採用される。
2023年Lin et al. (MIT)発表AWQ・Industry-leading activation-aware weight quantization LLM + Industry-leading 4-bit quantization + Industry-leading salient channel protection + Industry-leading LLaMA/Mistral production quantization。
2025年Q1 AWS re:Invent 2024発表のTrainium 3・AWS第3世代AI training chip (Trainium 1 2022 + Trainium 2 2024 後継)・2倍 Trainium 2 性能 + 40% energy efficiency improvement + 3nm process (TSMC 3nm) + HBM3e + NeuronLink 4x bandwidth + AWS Trn3 instance + AWS Bedrock LLM training infrastructure・Anthropic Claude 4 training partner + AWS Strategic Investment $4B+ Anthropic投資協力・NVIDIA H100/Microsoft Maia 200/Google Trillium TPU v6競合のAWS AI Sovereignty hardware。
2023年MIT-Han-Lab公開AWQ(Activation-aware Weight Quantization)量子化アルゴリズム。Pro 業界Pro Mainstream Activation-aware Weight量子化先駆 + Pro 米国MIT-Han-Lab Ji Lin et al + Pro 2023-06 AWQ論文公開 + Pro Salient Channels保護 + Pro 4bit GPU特化 + Pro AutoAWQ + 累計2023-2026年3年Heritage継承代表機。
Agent-to-Agent通信標準。Google A2A(2025年4月策定・Agent Card・Task/Message)・OpenAI Agents SDK Handoff・AutoGen GroupChat・LangGraph Supervisor・CrewAI Crew・MCP Server chaining・Swarm Orchestrator・Temporal Agent Loop対応、2026年マルチAgent連携標準化進行、Mega Agent構成可能。
LLMのAPI呼び出し精度を評価するためのベンチマーク群。ASTベースの意味的正確性評価やWin Rateを用いてツール呼び出し能力を定量化する。
Zhou et al.(2022)が提案した自動プロンプト設計手法。LLM に入出力例から指示文を逆生成させ、候補を評価・選別することで人手設計を不要にする。
2024年Q2 Argilla + Hugging Face共同発表APO paper・Industry-emerging Anchored Preference Optimization paradigm + Industry-leading Anchored DPO variant paradigm Pioneer + Industry-leading APO-zero + APO-down variants Industry-leading preference optimization Industry-emerging paradigm + Industry-leading Argilla data quality + Hugging Face TRL library Industry-leading Open-source ecosystem foundation。
Zettelkasten型の構造化メモリネットワークをLLMエージェントに導入した研究。記憶をノードとリンクで管理し、関連記憶間の有機的な結合と文脈伝播によって人間の連想記憶に近い動作を実現する。
Sparse MoE モデルにおいて、各エキスパートネットワークが学習を通じて特定の入力パターンやタスク領域に特化する現象。適切な専門化が起こるとモデル容量を効率的に活用でき、性能が向上する。
Expert System は1970年代後半-1980年代に隆盛した知識ベース AI システムで Mycin (1972年-Stanford・抗生物質処方診断)・XCON/R1 (1978年DEC・コンピュータ構成自動化)・DENDRAL (1965年-Stanford・化学構造分析)・Prolog 言語 (1972年) 採用しAI 第1冬 (1969-1980年代) からの復活を担った歴史的 AI 技術。