513件の用語
AI Inference API 6年史 2020-2026。OpenAI API (2020年6月 GPT-3 Beta・初Mainstream LLM API・現GPT-4o+o1+o3+o3-pro+GPT-5 2025年8月+ChatGPT Plus)・Anthropic API (2022年9月 Claude 1.0 Beta→Claude 2.0 2023年7月→Claude 3 Opus/Sonnet/Haiku 2024年3月→Claude 3.5 Sonnet 2024年6月→Claude 4 Sonnet 4.5/4.6/4.7+Opus 4.7 2025-26)・Google AI Studio→Vertex AI Gemini API (2023年12月 Gemini Pro→Gemini 1.5 Pro/Flash→2.0+2.5 Pro+Flash・Live API・Gemini 3 Pro+Flash 2025年)・Cohere (2019 Aidan Gomez Transformer論文共著・Embed+Rerank+Command R+ Command A 2025)・Mistral AI (2023年5月 Mistral 7B+Mixtral 8x7B+Large 2024+Magistral・La Plateforme API)・Replicate (2019 Andreas Jansson+Ben Firshman Docker元・Cog Container Open Source Model Hub・SDXL+Flux+LLaMA+SAM)・Together AI (2022 Vipul Ved Prakash・Open Source Models Inference・JuiceFS+TogetherDB)・Groq (2016 Jonathan Ross Google TPU設計・LPU Language Processing Unit Inference・LLaMA 70B 500+ tokens/sec 神速度)・Cerebras (2016 Wafer-scale CS-3+CS-4 2024+Inference 2024年8月 Free Beta・LLaMA 3.1 70B 1800 tokens/sec)・Fireworks AI+OctoAI (2024年Octo NVIDIA買収)・SambaNova (2017 Sun Microsystems創業者)・Lambda Labs (2012 GPU Cloud)+Lambda Inference・xAI Grok API (2023 Elon Musk・Grok 2+3+4+5 2024-25)・Hugging Face Inference API+Inference Endpoint・Modal Labs+RunPod+Vast.ai+Lambda・LLaMA 4 Scout/Maverick (Meta 2025)・¥¥¥¥¥/M Tokens 2026 OpenAI+Anthropic+Google Gemini 3強+Groq速度+Cerebras新興+Open Source Indie。
AI動画生成サービス。OpenAI Sora 2 (4K60 Pro)・Runway Gen-4・Kling AI 2.0/Kling Master・Hailuo MiniMax T2V-01-Director・Luma Dream Machine 1.6 Ray2・Pika 2.1・HeyGen Avatar・Stability AI Stable Video Diffusion・LTX-Video・Mochi 1、2026年8sec→60sec拡張、商用フィルム制作実用。
AI Translation Service。DeepL Pro (Industry Default・¥¥¥¥1k/月)・DeepL Voice (Realtime Voice 2024)・Google Translate+Gemini・Microsoft Bing Translator・OpenAI ChatGPT Translate・Anthropic Claude Translate・Mirai Translator・XLF Translator・Lokalise AI・Crowdin AI Auto-Translate・Phrase TMS・LibreTranslate (FOSS)・OPUS-MT (Helsinki NLP)・MarianMT・¥0-¥¥¥¥¥¥/月・GPT-4o翻訳精度高・¥0 OSS、2026年DeepL Voice+Claude翻訳実用化。
AMD GPU計算オープンスタック。ROCm 6.4(2026年Q1)・HIP(CUDA互換API)・rocBLAS・MIOpen・rccl・PyTorch 2.7 ROCm/Windows対応・vLLM AMD・TensorFlow AMD・Triton AMD・MI300X/MI325X/MI355X対応、2026年AMD Instinct GPUがNVIDIA H200/B200対抗、$1B受注規模。
Artificial General Intelligence・汎用人工知能。OpenAI(目標2027-2030)・DeepMind Gemini・Anthropic Claude Opus 4.7・xAI Grok 5・Meta FAIR・SSI・Mira Murati TML・Google Astraが目標設定、ARC-AGI-2 Prize(Karpathy・2025年)・FrontierMath・Humanity's Last Exam評価指標。
AGI Timeline議論。Compute Bottleneck (Capex $1T・Power 5GW)・Data Wall (Pretraining Token不足・Synthetic Data依存)・Test-Time Compute Scaling (o1/o3 突破口)・Reasoning RL Scaling・Leopold Aschenbrenner Situational Awareness 2027 AGI予測・Daniel Kokotajlo AI 2027・METR Time Horizon・Dario Amodei (Anthropic) Powerful AI 2026-2027・Sam Altman Brilliant Friend・¥0 知識・Bitter Lesson Sutton、2026年AGI Definition論議活発化。
LLM が自律的にタスクを計画・実行する次世代 AI アプローチ。単発の質問応答ではなく、目標達成に向けて複数ステップを自律的に進める AI エージェントの総称。
Agentic AI実行Agent。Anthropic Computer Use (Claude 3.5 Sonnet・Screenshot+Click+Type)・OpenAI Operator (Browser Agent・$200/月 Pro)・Google Project Mariner (Browser Agent)・Microsoft Magentic-One・Devin AI ($500/月 Cognition)・Manus (中国・話題)・Replit Agent V2・Vercel v0・Bolt.new・Cursor Composer Agent・Cline 3.x・¥¥¥¥¥/月、2026年Computer Use+Browser Agent本格普及。
自律型AI多段実行基盤。Claude Agent SDK・OpenAI Agents SDK・LangGraph 0.3・AutoGen 0.7・CrewAI・Mastra・Vercel AI SDK・Pydantic AIが代表、Tool use+Memory+Planning+Human-in-the-loopを統合、2026年はMCP(Model Context Protocol)標準化で相互運用加速。
AI Agent Framework比較。Anthropic MCP (Model Context Protocol・Claude Desktop+SDK)・OpenAI Function Calling・LangGraph 0.2 (Stateful)・PydanticAI 0.2 (Type-Safe)・LlamaIndex Agent Workflows・Microsoft Magentic-One・AutoGen v0.4・CrewAI 0.86・Swarms・smolagents (HF)・Bee Agent (IBM)・Mastra (Vercel)・Agentic 1.x・¥0 OSS、2026年MCP標準化加速。
AI Agent評価Benchmark。SWE-Bench Verified (500 GitHub Issues・Claude 3.7 Sonnet 49.3%・o3 71.7%)・SWE-Bench Lite・Aider Polyglot Bench (5 言語・Claude 3.5 Sonnet 49% / o1 72%)・τ-bench (Tool-Use・Tau-Bench)・GAIA・WebArena (Web Agent)・MLE-Bench (Kaggle 75 ML Tasks)・OSWorld (Computer Use)・Cybench (CTF Cyber)・¥0 OSS、2026年Computer Use Agent Bench拡大。
Agent-to-Agent通信標準。Google A2A(2025年4月策定・Agent Card・Task/Message)・OpenAI Agents SDK Handoff・AutoGen GroupChat・LangGraph Supervisor・CrewAI Crew・MCP Server chaining・Swarm Orchestrator・Temporal Agent Loop対応、2026年マルチAgent連携標準化進行、Mega Agent構成可能。
Anthropic Claude Extended Thinking(2025年・Claude 3.7+)。Thinking budget設定(thinking.budget_tokens 1024-32k)・Visible thinking trace(reasoning可視化)・Interleaved thinking(2025年・tool use間挟む reasoning)・Math/Code/Science domain改善大(GPQA Diamond +10%)・Latency増加(thinking分・3-30s typical)・Pricing: thinking tokens billing対象($75/Mtok Opus output同価)・Anthropic SDK Python: thinking={"type":"enabled","budget_tokens":4096}・Streaming支援・2026年 reasoning model時代核機能、o1/o3類似実装。
Edge Aiは、人工知能・機械学習分野における重要な概念・技術です。
Edge AI NPU/Accelerator。Hailo-10H (40 TOPS Edge LLM)・Hailo-15 (28 TOPS Embedded)・Hailo-8L (Raspberry Pi AI Kit M.2)・Coral USB Accelerator/PCIe Edge TPU (Google・4 TOPS)・Rockchip RK3588 (6 TOPS NPU・Orange Pi 5 Plus)・MediaTek Genio・NXP i.MX 95・Texas Instruments TDA4VM・Sophon BM1684X・Movidius Myriad X (Intel・廃止)・¥¥3k-¥¥¥¥30k Edge Module、2026年家庭Edge AI普及。
Edge AI Compilerは、深層学習モデルをエッジデバイス向けに最適化する専用コンパイラです。モデル圧縮、量子化、グラフ最適化を自動実行し、推論速度を最大100倍高速化しながら、メモリ使用量を90%削減します。
端末/近端でのローカルAI実行。ONNX Runtime 1.20・TensorRT-LLM・Core ML 4・WebGPU・Apple Foundation Models on-device(18.2+)・Qualcomm AI Engine・MediaTek NeuroPilot・NPU TOPS比較・Phi-4 mini/Gemma 3/Qwen3 1.7B Edge LLMが2026年代表、プライバシー+低遅延用途。
クラウド経由せず端末側でAI推論を行うデバイス。Copilot+ PC・NVIDIA Jetson Orin・Raspberry Pi 5+AI Kitなどが2025-2026年の主流で、NPU搭載Snapdragon X Eliteも該当。
Neural Processing Unitの略称。AI・機械学習の推論処理に特化した専用プロセッサで、従来のCPU・GPUよりも高効率でニューラルネットワーク計算を実行する
AI推論専用プロセッサ。Intel Core Ultra 9 285K Neural Engine(13 TOPS)・Snapdragon X Elite Hexagon NPU(45 TOPS)・Apple M4 Neural Engine(38 TOPS)が代表で、Copilot+ PCの要件40 TOPS以上をクリア。