11000件の用語
UC Berkeleyが開発したオープンソースLLM推論・サービングエンジン。PagedAttentionとContinuous Batchingを実装し、ナイーブなHuggingFace実装比で最大24倍のスループットを実現。2023年登場でGitHubスター4万超の事実上の標準サービングスタック。
UC BerkeleyのBDD研究室が開発したオープンソースLLM推論・サービングエンジン。PagedAttentionによる高効率KVキャッシュ管理とOpenAI互換APIサーバーを備え、HuggingFace Transformersより24倍のスループットを実現。研究から本番まで最も広く使われるLLM推論フレームワーク。
UC Berkeleyが開発した、PagedAttention技術を用いるLLM推論エンジン。OSの仮想メモリ管理に着想を得たKVキャッシュのブロック管理により、メモリ断片化を抑制し、極めて高いスループットと効率的なバッチ処理を実現する。
UC Berkeley 2023年公開の高速 LLM 推論エンジン。PagedAttention + 24倍高速・Apache 2.0 + 無料・「LLM 推論サーバ業界主流」.
高性能LLM推論サーバー。vLLM 0.6(UC Berkeley・PagedAttention・継続batch・FP8 KV cache・Throughput 10-30x)・SGLang(Structured Generation Lang・Prefix caching・Multi-LoRA)・Hugging Face TGI 3.0(Text Generation Inference・Rust)・NVIDIA TensorRT-LLM・LMDeploy(MMRazor)・Aphrodite Engine・Ollama(small scale)・vLLM A100/H100最適・tensor parallel TP=8・2026年 vLLM+SGLang主流、Enterprise TGI Docker。
vLLMが提供するOpenAI API互換のLLM推論サーバー。PagedAttentionによる高スループットと低レイテンシを実現し、GPUクラスタ上でLLaMA・Mistral等のオープンモデルを本番運用するためのデファクトスタンダード。
vLLMが実装するKVキャッシュのページング管理技術。OSの仮想メモリに着想を得てKVキャッシュを非連続ブロックで管理し、LLM推論スループットを大幅向上させる。
LLM高速推論バックエンド。vLLM 0.10(UC Berkeley・PagedAttention)・TGI(HuggingFace Text Generation Inference)・SGLang 0.4(RadixAttention・Tree Evict)・TensorRT-LLM・llama.cpp server・llama-swap・Ollama engine・LitServe・Triton Inference Server・Ray Serve代表、2026年continuous batching+FP8 KV Cache定番。
2024年Q3-Q4 vLLM Project (UC Berkeley Sky Computing Lab・2023年Open-source inference engine release以来 Industry-leading Open-source LLM inference engine・GitHub 30k+ stars・Industry-leading Open-source community + Production deployment Industry-wide adoption) Disaggregated Mode support addition・vLLM Disaggregated mode implementation・Industry-leading Open-source Disaggregated Inference implementation + Prefill-Decode separation deployment support + Industry-leading Open-source community adoption + Industry-wide Production deployment Industry-emerging paradigm support + Industry-leading Open-source paradigm shift adoption。
2024年UC Berkeley発表vLLM v0.6+・Industry-leading PagedAttention KV cache management + Industry-leading 24x throughput improvement + Industry-leading continuous batching + Industry-leading Apache 2.0 open source LLM serving framework。
2023年Woosuk Kwon et al. (UC Berkeley)発表vLLM・Industry-leading PagedAttention KV cache management + Industry-leading LLM inference high-throughput serving + Industry-leading vLLM open-source framework + Industry-leading SOSP 2023 best paper。
FiiO 2023年発表エントリー据置 DAC/ヘッドホンアンプ。CS43198 DAC・1.4W 出力・$129・初心者向け
2024年8月6日Figure公開Figure 02。Pro 業界Pro Mainstream Humanoid Robot Top + Pro OpenAI Partnership Pro Famous + Pro BMW工場稼働Pro Famous + Pro Brett Adcock Pro CEO主導 + Pro $675M Series B + Pro $2.6B Valuation + 2025-Pro Helix AI公開 + 累計2022-2025年3年Heritage。
WebGL技術を基盤としたブラウザ型共同編集デザインツール。リアルタイムでの複数人同時編集を実現し、UI/UXデザインの制作・共有・開発連携を一元化する、現代のデザインワークフローにおける標準プラットフォームです。
概要
ビデオグラフィックスアレイ。1987年に登場したアナログ映像伝送規格。青色の15ピンD-subコネクタが特徴で、長年PCの標準接続として使用された
I/O電圧。メモリとCPU間の信号伝送に使用される電圧
System Agent電圧。Intelプラットフォームでメモリコントローラーなどに供給される電圧
GPU分割仮想化技術。NVIDIA vGPU 18.0(B100/H100/L40S Multi-Instance GPU+MIG 7分割)・AMD MxGPU(W7800/W7900)・Intel Flex Series・VMware vSphere Bitfusion・Ubuntu MIG partitioningが代表、1枚GPU→複数VMで共有、クラウドGPUaaS基盤として2026年AIワークロード標準。
Physics Simulation Engine。NVIDIA PhysX 5 (FOSS BSD・Apex)・Bullet Physics 3.x (Erwin Coumans)・Box2D 3.0 (2D Default)・Chipmunk2D・Jolt Physics (Horizon Forbidden West・Multi-thread)・Rapier 0.20 (Rust・Dimforge)・XPBD eXtended Position-Based Dynamics・Havok (Microsoft買収)・Cannon.js (3D Web)・Verlet Physics・SoftBody+RigidBody+Cloth・¥0 OSS、2026年Jolt+Rapier主流化。