767件の用語
LLM推論性能指標。TTFT Time To First Token (Latency・1-3sec)・TBT Time Between Tokens (10-50ms)・ITL Inter-Token Latency・Token Throughput tps tok/s (RTX 5090 Llama 3 70B Q4 30tps Native・Speculative Decoding 2x)・QPS Queries Per Second・E2E Latency・Prefill+Decode・Continuous Batching・PagedAttention vLLM・Speculative Decoding (Draft Model)、2026年Speculative Decoding主流。
2026年AI推論Stack全俯瞰。Local: Ollama 0.5+/LM Studio 0.3.10/Jan 0.5/llama.cpp b4400+/MLX 0.21・Server: vLLM 0.7/SGLang 0.4/TGI 3.0/TensorRT-LLM 0.18/MLC LLM・Cloud: AWS Bedrock+SageMaker・GCP Vertex AI・Azure OpenAI Service・Together AI・Replicate・OpenRouter (300+ Model)・Hardware: RTX 5090/H200/B200/MI300X/M4 Max・Apple Silicon UMA・¥0 OSS-API・Speculative Decoding/MoE/MLA・FP4 Native、2026年Local 70B Q4家庭普及。
LLM を中核に、ツール使用、計画立案、自律的実行を組み合わせて複雑なタスクを遂行する AI システムの設計パターン。2024-2025 年に急速に発展した次世代 AI 応用の主要アーキテクチャ。
AI OS Integration 3年史 2024-2026。Microsoft Copilot+ PC (2024年5月発表→6月発売・Snapdragon X Elite/Plus・Windows 11 24H2・Recall+Click to Do+Live Captions+Cocreator+Image Creator・Recall機能Privacy炎上→2024年11月Limited Preview再リリース)・Microsoft Copilot (2023年2月 Bing Chat→Copilot 2023年9月→Copilot 365 2024年Premium $20/月+M365)・Apple Intelligence (2024年6月 WWDC発表→2024年10月 iOS 18.1/iPadOS 18.1/macOS Sequoia 15.1初Public・US English→2024年12月 ChatGPT統合+Image Playground+Genmoji+Writing Tools+Notification Summary+Siri再設計)・iOS 18.4 2025年4月 日本語対応・Apple Foundation Model 3B (Device-Side)+Server Foundation Model (Private Cloud Compute PCC)・Galaxy AI (2024年1月 Galaxy S24 Series発表→2024年7月Galaxy S25 Series・Live Translate+Note Assist+Browsing Assist+Generative Edit+Circle to Search)+Galaxy Unpacked AI Live Effect+S25 Edge AI 2025・Pixel AI (Google Tensor G3+G4+G5 Pixel 9/10・Magic Editor+Audio Magic Eraser+Best Take+Add Me Photo+Pixel Studio Image Gen+Pixel Screenshots+Pixel Recorder Transcribe+Call Notes+Live Translate)・Gemini Nano (Pixel+Galaxy On-device LLM 1.8B/3.25B+Gemini 2.0 Live API)・Xiaomi HyperOS 2 AI (2024 Mi 15 Series・LLaMA-based)+Vivo BlueLM+OPPO AndesGPT・Huawei HarmonyOS 5 NEXT AI Pangu Model (2024)・Honor Magic 7 AI Agent・Snapdragon X NPU 45 TOPS Copilot+ Required+ Apple A18 Neural Engine 38 TOPS+Apple M4 38 TOPS・¥0 Built-in OS-¥¥¥/月 Premium Add-on 2026 Apple Intelligence+Galaxy AI+Pixel AI+Microsoft Copilot+ PC 4勢力+中国メーカー独自LLM AI乱立。
LLM Observability+Tracing。Langfuse 3.x (FOSS+Cloud・LangChain統合)・Helicone (Proxy+Log+Eval)・Weights & Biases Weave (LLM Trace)・Arize Phoenix (FOSS)・LangSmith (LangChain Cloud)・Braintrust・PostHog LLM Analytics・OpenLLMetry (Traceloop)・MLflow LLM Tracking・Datadog LLM Observability・Honeycomb LLM Trace・LiteLLM Logging・¥0 OSS-¥¥¥¥¥¥/月、2026年Langfuse FOSS急成長。
Text-to-Music AIモデル。Suno v4.5/v5(1-4分曲・ステム分離・Vocals/Covers)・Udio v2・Stable Audio 2.5・MusicGen(Meta)・Riffusion・ElevenLabs Music・YuE(OSS・Hugging Face)・Lyria 2(Google)・Boomy・SongR・Mubert代表、2026年著作権議論進行+商用BGM代替。
Text-to-Speech AIモデル。ElevenLabs v3(multilingual・Voice Clone)・OpenAI tts-1-hd・Google Chirp3 HD・Kokoro TTS-82M(OSS)・Coqui XTTS v2・Suno Bark・MetaVoice-1B・Parler-TTS・Orpheus TTS 3B・Sesame AI CSM・Higgs Audio v2(2025)・Dia TTS 1.6B(Nari Labs)2026年代表、リアルタイム低遅延。
LLM学習用クラウドGPUホスティング。Lambda Labs H100 80GB SXM5 $2.49/h・CoreWeave H100 HGX・Paperspace・RunPod Pod H100・Vast.ai(consumer GPU)・Together AI・Fireworks AI・Modal(serverless GPU・fine-tuning)・Hugging Face Endpoints・Microsoft Azure ND GB200・Google Cloud TPU v5p・AWS Trainium 2・GB200 NVL72 $40000-50000/h、2026年スタートアップ+研究定番。
Stable Diffusion・Midjourney・DALL-Eなどテキストから画像を生成するAI技術
AI Calendar+Schedule。Reclaim.ai (Habits+Tasks Auto-Schedule・¥¥¥¥¥/月)・Motion (Project+Calendar Auto・¥¥¥¥¥/月)・Trevor AI (Time Block)・Fantastical 4 Premium (Mac/iOS・¥¥¥¥/月)・Akiflow (Unified Inbox)・Sunsama (Daily Planner)・Cron (Notion買収後Notion Calendar)・Fastmail Calendar・Vimcal・Zen Habits AI・SkedPal・¥¥¥¥-¥¥¥¥¥¥/月、2026年Notion Calendar+Reclaim主流。
NVIDIA AI Server。DGX H100 (8x H100 80GB)・DGX H200 (8x H200 141GB)・DGX B200 (8x B200 192GB HBM3e)・DGX GB200 NVL72 (72x B200 + 36x Grace CPU・1.4 ExaFLOPS FP4)・GB200 Superchip Switch・NVLink 5 (1.8TB/s/GPU)・Grace Hopper GH200・SuperPOD・SuperPOD GB200 NVL72×8 = 576 GPU・CoolerMaster液冷・¥¥¥¥¥¥¥ ($3M/NVL72)、2026年GB200大量出荷。
AI統合Creator ツール。Adobe Firefly 4(Generative Fill/Expand/Recolor)・Photoshop Neural Filter・Illustrator Generative Pattern・Premiere Pro Gen AI Extend・Runway Gen-4・Luma AI Dream Machine・Sora 2・Google Veo 3・Kling AI 2.0・Midjourney v7・DALL-E 4・Stable Diffusion 3.5が2026年代表。
GitHub Copilot・Claude Code・Cursorなどコード生成を支援するAIツール
AI Coding Agent比較。Claude Code (CLI・Anthropic Sonnet 4.6/Opus 4.7・MCP)・Cursor 0.45+ Composer/Agent・Aider 0.74 (Git Native)・Cline 3.x (旧Claude Dev・VSCode Extension)・RooCode・Roocoder・Continue.dev・Sweep AI・Devin AI (Cognition)・Replit Agent V2・Bolt.new (StackBlitz)・v0 by Vercel・Lovable・Codex CLI、2026年Agentic Coding競争激化。
LLM駆動IDE/CLIエージェント。Cursor Composer(Claude 3.5 Sonnet/o3)・Windsurf Cascade(Codeium・SuperComplete)・GitHub Copilot Workspace/Agent Mode・Claude Code(CLI・hooks/slash)・Aider(OSS)・Cline(VSCode)・OpenDevin/OpenHands・Replit Agent・Zed AI・Jetbrains AI Assistant・Continue.dev 1.0対応、2026年ペアプロ標準。
AI用Code Execution Sandbox。E2B Cloud Sandbox (FOSS+Cloud・Firecracker microVM)・Daytona Sandbox・CodeSandbox SDK (StackBlitz買収後)・Modal Sandbox・Hugging Face Spaces ZeroGPU Spaces・Replit Agent V2・Anthropic Code Execution (Claude API beta)・OpenAI Code Interpreter・Riza・StackBlitz WebContainers (Browser Native)・LightSpeed・¥0 OSS-¥¥¥¥¥/月、2026年E2B Anthropic統合急成長。
AI Code Review SaaS。CodeRabbit Pro (PR自動レビュー・GitHub/GitLab/Bitbucket・$15/dev/月)・Sourcery (Self-Hosted Pro)・Greptile (Codebase Q&A・Slack)・Codium AI (Test Generation)・Bito AI Code Review・Qodo (旧Codium AI)・Korbit AI・Pull Request Bot・Reviewpad (Maintenance)・Bitrise・$15-$50/dev/月・GitHub Copilot Code Review (内蔵)、2026年AI Review Mature期。
AI Compiler。Apache TVM 0.18 (Tensor Compile)・MLIR Multi-Level IR (LLVM)・IREE (Apache・MLIR Compilation)・OpenAI Triton 3.x (Python Kernel DSL・Native NVIDIA)・PyTorch torch.compile (TorchInductor+Triton)・JAX Pallas (TPU+GPU)・XLA (TF Native)・StableHLO・OpenVINO 2025・onnxruntime 1.20・¥0 OSS・cuDNN+TensorRT 10.7・¥0 OSS、2026年torch.compile+Triton主流。
AI Data+Model Compliance。Croissant Metadata (MLCommons)・Datasheet for Datasets (Gebru)・Model Card (Mitchell)・MLCommons AILuminate (Safety Benchmark)・MLPerf Inference・MLPerf Tiny・C2PA Content Credentials (AI画像識別)・SynthID (Google)・PROV-O W3C Provenance・MLCommons Power・Hugging Face Model Card+Dataset Card・¥0 OSS、2026年Croissant Standard普及。
AI Search Engine比較。Perplexity Pro (Sonar Large・Claude/GPT/o3 切替)・You.com Pro+/Genius・Phind 70B (Coding Search)・Brave Search Pro+ (CodeLLM)・Kagi Ultimate (Premium検索¥¥25/月)・Andi・Yahoo Pro・SearchGPT・Anthropic Claude Search・Google AI Overview・Bing Copilot・¥1k-¥4k/月、2026年Search Disrupt期。