1978件の用語
UC Berkeleyが開発した、PagedAttention技術を用いるLLM推論エンジン。OSの仮想メモリ管理に着想を得たKVキャッシュのブロック管理により、メモリ断片化を抑制し、極めて高いスループットと効率的なバッチ処理を実現する。
UC Berkeley 2023年公開の高速 LLM 推論エンジン。PagedAttention + 24倍高速・Apache 2.0 + 無料・「LLM 推論サーバ業界主流」.
高性能LLM推論サーバー。vLLM 0.6(UC Berkeley・PagedAttention・継続batch・FP8 KV cache・Throughput 10-30x)・SGLang(Structured Generation Lang・Prefix caching・Multi-LoRA)・Hugging Face TGI 3.0(Text Generation Inference・Rust)・NVIDIA TensorRT-LLM・LMDeploy(MMRazor)・Aphrodite Engine・Ollama(small scale)・vLLM A100/H100最適・tensor parallel TP=8・2026年 vLLM+SGLang主流、Enterprise TGI Docker。
vLLMが提供するOpenAI API互換のLLM推論サーバー。PagedAttentionによる高スループットと低レイテンシを実現し、GPUクラスタ上でLLaMA・Mistral等のオープンモデルを本番運用するためのデファクトスタンダード。
vLLMが実装するKVキャッシュのページング管理技術。OSの仮想メモリに着想を得てKVキャッシュを非連続ブロックで管理し、LLM推論スループットを大幅向上させる。
LLM高速推論バックエンド。vLLM 0.10(UC Berkeley・PagedAttention)・TGI(HuggingFace Text Generation Inference)・SGLang 0.4(RadixAttention・Tree Evict)・TensorRT-LLM・llama.cpp server・llama-swap・Ollama engine・LitServe・Triton Inference Server・Ray Serve代表、2026年continuous batching+FP8 KV Cache定番。
2024年Q3-Q4 vLLM Project (UC Berkeley Sky Computing Lab・2023年Open-source inference engine release以来 Industry-leading Open-source LLM inference engine・GitHub 30k+ stars・Industry-leading Open-source community + Production deployment Industry-wide adoption) Disaggregated Mode support addition・vLLM Disaggregated mode implementation・Industry-leading Open-source Disaggregated Inference implementation + Prefill-Decode separation deployment support + Industry-leading Open-source community adoption + Industry-wide Production deployment Industry-emerging paradigm support + Industry-leading Open-source paradigm shift adoption。
2024年UC Berkeley発表vLLM v0.6+・Industry-leading PagedAttention KV cache management + Industry-leading 24x throughput improvement + Industry-leading continuous batching + Industry-leading Apache 2.0 open source LLM serving framework。
2023年Woosuk Kwon et al. (UC Berkeley)発表vLLM・Industry-leading PagedAttention KV cache management + Industry-leading LLM inference high-throughput serving + Industry-leading vLLM open-source framework + Industry-leading SOSP 2023 best paper。
2024年12月公開Fish Audio S1。Pro Open Source TTS Top + Pro 中国Mainstream Voice AI + Pro 4B Parameters + Pro Multilingual対応 + Pro Voice Cloning + Pro CC BY-NC-SA License + Pro Hugging Face公開 + 累計2023-2025年2年Heritage Pro Open Source Voice AI業界Top独占。
Fish Audioが開発したオープンソースのゼロショット音声クローニングTTSモデル。10秒以下の参照音声から高品質な音声複製を行い、多言語に対応。
コードLLMのプリトレーニング目的の一種。テキストの先頭(Prefix)と末尾(Suffix)を与え、中間部分(Middle)を生成する能力を学習する手法。SPMフォーマットが主流。
金融マルチタスク指示チューニングLLM。LLaMAをベースにMFTInstruct(136,000件の金融指示データ)でSFT学習し、多様な金融NLPタスクに単一モデルで対応する。
オープンソースの金融特化LLM。LLaMAやMistralをベースに金融テキストでファインチューニングし、誰でも再現・カスタマイズ可能な金融AI基盤を提供する。
金融テキスト解析に特化したBERTモデル。Financial PhraseBank等の金融コーパスで事前学習を継続し、感情分析・NER・質疑応答で高精度を実現する。
Federated Learningは、人工知能・機械学習分野における重要な概念・技術であり、分散型学習の枠組みを提供する革新的なアプローチです。この技術は、データを中央集権的に収集せずに、エッジデバイスやクライアント端末上でローカルに保持されたデータを活用してモデルを学習する仕組みを実現します。特にプライバシー保護やデータの非効率な転送を回避するという利点から、IoT機器、スマートフォン、医療機
Federated Learning Framework。TensorFlow Federated TFF・PySyft (OpenMined・PyTorch)・Flower 1.13 (FOSS Multi-Framework)・FedML 0.8 (Backbone+Cross-Device+Cross-Silo)・FATE Federated AI Technology Enabler (WeBank・中国)・OpenFL (Intel)・PaddleFL (Baidu)・NVIDIA FLARE 2.5・Substra (Owkin)・FedScale・¥0 OSS、2026年Flower+FedML普及拡大。
2020年Photoroom設立(2019-Beta公開)。Pro 業界Pro Mainstream Mobile Background Removal Top + Pro Matthieu Rouif Pro CEO主導 + Pro 元GoPro/Apple + Pro iOS/Android対応 + Pro 累計世界月間1億+ Download + Pro $43M Series A + Pro $500M Valuation + 2024-Pro AI Image Generator + 累計2019-2025年6年Heritage。
BRIGHTは、単なる情報検索能力(Retrieval)だけでなく、取得したコンテキストを基に高度な推論や複雑な思考プロセスを要求するRAGシステムを評価するためのベンチマークです。
2024年Q4 Browser-Use (オーストリアGregor Zunic + Magnus Müller共同創業・GitHub 30k+ stars Industry-leading Open-source Browser Agent library) 発表Browser-Use・Industry-leading Python Open-source Browser Agent library・LLM-powered web browsing automation + Playwright/Selenium integration + Industry-leading Open-source Browser Agent Pioneer + Industry-emerging Browser Agent Industry-leading framework + Claude + GPT + Gemini + 多LLM integration agnostic + Industry-leading Open-source Browser Agent ecosystem alignment。