1978件の用語
2024年Egiazarian et al. (Yandex)発表AQLM・Industry-leading 2-bit additive quantization LLM + Industry-leading learned codebooks + Industry-leading vector quantization + Industry-leading LLaMA-2 70B 2-bit production via Yandex。
LLMの重みを2〜3ビットに極端圧縮しながら品質を維持する加算型量子化手法。複数のコードブックから学習済みコードワードを加算して重みを近似することで、GPTQ・AWQより低ビット数での高品質推論を実現する。
Artificial General Intelligence・汎用人工知能。OpenAI(目標2027-2030)・DeepMind Gemini・Anthropic Claude Opus 4.7・xAI Grok 5・Meta FAIR・SSI・Mira Murati TML・Google Astraが目標設定、ARC-AGI-2 Prize(Karpathy・2025年)・FrontierMath・Humanity's Last Exam評価指標。
AGI Timeline議論。Compute Bottleneck (Capex $1T・Power 5GW)・Data Wall (Pretraining Token不足・Synthetic Data依存)・Test-Time Compute Scaling (o1/o3 突破口)・Reasoning RL Scaling・Leopold Aschenbrenner Situational Awareness 2027 AGI予測・Daniel Kokotajlo AI 2027・METR Time Horizon・Dario Amodei (Anthropic) Powerful AI 2026-2027・Sam Altman Brilliant Friend・¥0 知識・Bitter Lesson Sutton、2026年AGI Definition論議活発化。
LLM が自律的にタスクを計画・実行する次世代 AI アプローチ。単発の質問応答ではなく、目標達成に向けて複数ステップを自律的に進める AI エージェントの総称。
Agentic AI実行Agent。Anthropic Computer Use (Claude 3.5 Sonnet・Screenshot+Click+Type)・OpenAI Operator (Browser Agent・$200/月 Pro)・Google Project Mariner (Browser Agent)・Microsoft Magentic-One・Devin AI ($500/月 Cognition)・Manus (中国・話題)・Replit Agent V2・Vercel v0・Bolt.new・Cursor Composer Agent・Cline 3.x・¥¥¥¥¥/月、2026年Computer Use+Browser Agent本格普及。
自律型AI多段実行基盤。Claude Agent SDK・OpenAI Agents SDK・LangGraph 0.3・AutoGen 0.7・CrewAI・Mastra・Vercel AI SDK・Pydantic AIが代表、Tool use+Memory+Planning+Human-in-the-loopを統合、2026年はMCP(Model Context Protocol)標準化で相互運用加速。
AI Agent Framework比較。Anthropic MCP (Model Context Protocol・Claude Desktop+SDK)・OpenAI Function Calling・LangGraph 0.2 (Stateful)・PydanticAI 0.2 (Type-Safe)・LlamaIndex Agent Workflows・Microsoft Magentic-One・AutoGen v0.4・CrewAI 0.86・Swarms・smolagents (HF)・Bee Agent (IBM)・Mastra (Vercel)・Agentic 1.x・¥0 OSS、2026年MCP標準化加速。
2024年成熟AgentBench・Industry-leading LLM-as-Agent benchmark + Industry-leading 8 distinct environments + Industry-leading API+Sim+OS+DB+KG+Card+CodeKG+Lateral + Industry-leading Tsinghua + UC Berkeley AgentBench LLM-as-Agent benchmark 2024。
AI Agent評価Benchmark。SWE-Bench Verified (500 GitHub Issues・Claude 3.7 Sonnet 49.3%・o3 71.7%)・SWE-Bench Lite・Aider Polyglot Bench (5 言語・Claude 3.5 Sonnet 49% / o1 72%)・τ-bench (Tool-Use・Tau-Bench)・GAIA・WebArena (Web Agent)・MLE-Bench (Kaggle 75 ML Tasks)・OSWorld (Computer Use)・Cybench (CTF Cyber)・¥0 OSS、2026年Computer Use Agent Bench拡大。
Claude/GPT 等の LLM を使った自律エージェント実行ループの汎用フレームワーク。タスク分解・ツール呼出・記憶管理・終了条件判定を組み合わせた繰返し制御構造の実装パターン。
HKUSTと北京大学が2023年に共同開発したアラビア語特化LLM。Llama 2をベースにアラビア語コーパスで継続事前訓練とinstruction tuningを実施し、AceValベンチマークでGPT-3.5に匹敵するアラビア語性能を達成した。
AWS が 2023 年公開した第 2 世代 AI 推論特化 ASIC アクセラレータ。チップあたり 190 TFLOPS + 32GB HBM2e、Stable Diffusion / Llama 2 等の推論で同等 GPU 比 4 倍コスト効率、AWS EC2 Inf2 インスタンス搭載。
2024年AWS公開のCustom AI Training Accelerator第2世代。1.3PFLOPS BF16+96GB HBM3+UltraServer 64chip+Trn2 EC2 Instance+EFA v3+Neuron SDK 2.20を搭載。
Activation-aware Weight Quantization。活性化の大きさから重要な重みチャネルを特定して保護し、4bit量子化の精度劣化を抑えるLLM量子化手法。GPTQより高精度とされGPU推論で広く採用される。
2023年Lin et al. (MIT)発表AWQ・Industry-leading activation-aware weight quantization LLM + Industry-leading 4-bit quantization + Industry-leading salient channel protection + Industry-leading LLaMA/Mistral production quantization。
2025年Q1 AWS re:Invent 2024発表のTrainium 3・AWS第3世代AI training chip (Trainium 1 2022 + Trainium 2 2024 後継)・2倍 Trainium 2 性能 + 40% energy efficiency improvement + 3nm process (TSMC 3nm) + HBM3e + NeuronLink 4x bandwidth + AWS Trn3 instance + AWS Bedrock LLM training infrastructure・Anthropic Claude 4 training partner + AWS Strategic Investment $4B+ Anthropic投資協力・NVIDIA H100/Microsoft Maia 200/Google Trillium TPU v6競合のAWS AI Sovereignty hardware。
2023年MIT-Han-Lab公開AWQ(Activation-aware Weight Quantization)量子化アルゴリズム。Pro 業界Pro Mainstream Activation-aware Weight量子化先駆 + Pro 米国MIT-Han-Lab Ji Lin et al + Pro 2023-06 AWQ論文公開 + Pro Salient Channels保護 + Pro 4bit GPU特化 + Pro AutoAWQ + 累計2023-2026年3年Heritage継承代表機。
Agent-to-Agent通信標準。Google A2A(2025年4月策定・Agent Card・Task/Message)・OpenAI Agents SDK Handoff・AutoGen GroupChat・LangGraph Supervisor・CrewAI Crew・MCP Server chaining・Swarm Orchestrator・Temporal Agent Loop対応、2026年マルチAgent連携標準化進行、Mega Agent構成可能。
LLMのAPI呼び出し精度を評価するためのベンチマーク群。ASTベースの意味的正確性評価やWin Rateを用いてツール呼び出し能力を定量化する。