1978件の用語
ローカルLLM推論サーバー。llama.cpp(Georgi Gerganov・C++・CPU+GPU CUDA/Metal/Vulkan)・GGUF format(軽量・量子化Q4_K_M推奨)・llama-server(OpenAI互換API)・Ollama(llama.cpp wrapper・Model Hub)・LM Studio(GUI)・llamafile(単一バイナリ)・llama-swap(自動切替)・Text Generation Web UI・KoboldCpp・vLLM(Python・高速)・SGLang・Aphrodite Engine・2026年M4 Max+Ollama定着。
llama.cppが実装する独自文法記述フォーマットGBNF(GGML BNF)を使い、ローカルLLMからJSON・SQL・カスタム形式の構造化テキストを確実に生成する機能。
Georgi Gerganovが開発したC/C++製LLM推論ライブラリ。GGUF形式の量子化モデルを4ビット以下で実行し、CPU単体でもLlama/Mistral/Gemma等を動作させる。Metal/CUDA/Vulkan/OpenCL等のバックエンドに対応しローカルLLM普及の事実上の標準インフラ。
llama.cppに内蔵されたHTTPサーバー機能。単一バイナリで起動しOpenAI互換APIを提供する軽量LLMサービング手段で、OllamaやTGIの基盤技術としても使われる。
Meta Llama 3シリーズが採用する会話フォーマット。`<|begin_of_text|>`・`<|start_header_id|>`・`<|eot_id|>` などの専用特殊トークンでロールとメッセージを区切り、Llama 3系モデルの推論に必須となる構造。
2024年LlamaIndex公開LlamaParse。Pro 業界Pro Mainstream LlamaIndex統合Doc Parser + Pro 米国San Francisco LlamaIndex + Pro 2022-LlamaIndex設立Jerry Liu + Pro PDF→Markdown + Pro Table認識 + Pro $0.003/page + Pro Premium Mode + 累計2022-2026年4年Heritage継承代表機。
2023年Mozilla Builders Project発表のLlamafile・Justine Tunney (元Google Cosmopolitan Libc作者) 主導の OSS Single-Binary LLM Executable framework。Apache 2.0 License・GitHub Star 22k+ (2024年Q4)・llama.cpp + Cosmopolitan Libc 統合で「単一バイナリで Windows/macOS/Linux/FreeBSD/OpenBSD/NetBSD 6 OS同時実行可能」のAPE (Actually Portable Executable) 方式・モデル + LLM runtime + Webサーバ + UI を1ファイル化・Wifi無Offline実行・USB stick配布可能のExtreme Portability実現の革新的OSS。
Meta が 2025 年 4 月に公開した次世代オープンソース LLM シリーズ。Llama 3 の後継として、マルチモーダル対応、より長いコンテキスト、MoE アーキテクチャを採用し、オープンモデルの最高水準を目指す。
Metaが2025年4月に公開したLlama 4 Scoutの技術仕様。17B×16専門家MoE構成(総109B)、iRoPEで1000万トークンコンテキスト、Early Fusionマルチモーダル、MTPを採用した次世代オープンモデル。
2024年Red Hat発表のRamalama・Podman/Docker container上でLocal LLM (Ollama互換) を実行するOSS CLI。Apache 2.0 License・GitHub Star 800+ (2024年Q4)・llama.cpp / vLLM / MLX backend切替可能・Ollama compatible API (OpenAI互換) ・OCI Container方式でモデル配布 (Hugging Face/OCI Registry pull)・rootless実行 + Cosign signature検証 + SELinux confinement対応のEnterprise Security重視Local LLM Runtime・Red Hat Enterprise Linux (RHEL) / Fedora標準採用予定。
Yang Youら(UC Berkeley・2020年)が提案した大バッチ分散学習向けオプティマイザー。Adam更新量を各層のパラメータノルムと更新ノルムの比でスケーリングし、BERTの事前学習を76分(従来3日)に短縮することを実証した。
2023年Liu et al. + UWaterloo + Microsoft発表LLaVA paper・Industry-leading Large Language and Vision Assistant Pioneer + Industry-leading visual instruction tuning Pioneer + Industry-leading open-source VLM foundation。
2024年1月LLaVA Team発表LLaVA-NeXT・Industry-leading open-source VLM + Industry-leading high-resolution image processing + Industry-leading 34B parameters + Industry-leading LLaVA Team LLaVA-NeXT Apache 2.0 open-source VLM 2024。
2024年Runway公開Act-One Performance Capture+Gen-3 Alpha統合。Pro 業界Pro Mainstream Performance Capture+Gen-3 Alpha統合先駆 + Pro 米国NY Runway + Pro 2018-Runway設立 + Pro Driving Video → Character Performance + Pro 720p 10s + Pro Gen-3 Alpha + Pro $15-95/月 + 累計2018-2026年8年Heritage継承代表機。
2024年6月17日Runway公開Gen-3 Alpha。Pro Runway系譜3代目 + Pro 業界Pro Mainstream Multi-Modal Video Editing AI Top + Pro 10秒動画生成 + Pro 720p Resolution + Pro Image-to-Video + Pro Text-to-Video + Pro Director Mode + Pro 2025-03-31 Runway Gen-4後継 + 累計Heritage。
LangChainチームが開発したグラフベースのLLMエージェントフレームワーク。状態機械としてエージェントの動作を定義し、複雑な分岐・ループ・マルチエージェント協調を実現する。
LangChainが開発した、LLMエージェントをグラフ構造で定義・実行するフレームワーク。StateGraphを用いてノード(処理ステップ)とエッジ(遷移条件)を定義し、複雑なマルチエージェントワークフローを構築できる。
LangChain系のエージェントオーケストレーション基盤。処理をノードとエッジの状態機械(グラフ)として記述し、ループ・分岐・人間介在(Human-in-the-loop)を含む複雑なエージェントを精密に制御する。
Harrison Chase 2022年発表の LLM アプリ開発フレームワーク。Python + JS・MIT・「LLM アプリ開発業界主流」.
LLMアプリケーション構築のためのPython/TypeScriptフレームワーク。チェーン・エージェント・メモリを組み合わせて複雑なAIワークフローを実装できる。