2472件の用語
LLM推論のレスポンス時間を多角的に計測・監視する手法。TTFT(最初のトークンまでの時間)、TPS(1秒あたりのトークン生成数)、E2E(エンドツーエンド)レイテンシなどの指標を追跡し、ユーザー体験とSLOの維持を図る。
LLMのTransformerレイヤー全体を除去することでモデルを軽量化する構造的プルーニングの一形態。後半レイヤーほど重要度が低い傾向があり、ShortGPT・LaCo等のフレームワークで実用化されている。
LLM APIに送信するリクエストで出力形式を指定するパラメータの総称。text(自由テキスト)、json_object(JSON構文保証)、json_schema(スキーマ準拠JSON)の3段階があり、用途に応じて使い分ける。
LLMの脆弱性・有害出力・安全性の欠陥を意図的に発見するためのテスト手法。攻撃者の視点でモデルを評価し、Jailbreak・Prompt Injection・バイアス等のリスクを事前に特定する。
悪意ある入力・エッジケースを体系的に試みてLLMの安全上の脆弱性を発見・修正する評価プロセス。
LLM の安全性を検証するために、意図的に有害・不正な出力を引き出す攻撃的テスト手法。軍事・セキュリティ分野の「レッドチーム」概念を AI に応用し、モデルの脆弱性を発見して対策を講じるプロセス。
LLMレッドチーミングとは、大規模言語モデル(LLM)に対して意図的に攻撃的・悪意のあるプロンプトを入力し、安全性の脆弱性や意図しない出力を発見するセキュリティ評価手法である。軍事演習のレッドチーム(攻撃側)概念をAI安全性に応用したもの。
LLM連合学習(Federated Learning for LLMs)とは、複数の参加者がローカルデータを共有せずにモデルパラメータの更新情報のみを集約することで、プライバシーを保護しながら大規模言語モデルを協調的に訓練・ファインチューニングする分散学習手法である。
LLM推論リクエストを複数のモデルサーバーやGPUインスタンスに分散する負荷分散機構。従来のHTTPロードバランサーとは異なり、GPU使用率・KVキャッシュ占有率・推論キュー長・リクエストのトークン数などLLM固有のメトリクスに基づいてルーティングを最適化する。
LLM(大規模言語モデル)が一度に処理できる入力トークン数の上限を拡張する技術群の総称。コンテキストウィンドウが大きいほど、長文書の要約・多文書比較・長い対話履歴の保持が可能になる。
LLM Evaluation Framework。EleutherAI lm-evaluation-harness 0.4 (50+ Tasks・Standard)・OpenAI evals・RAGAS (RAG Eval・Faithfulness/Answer Relevancy)・promptfoo 0.106 (Web UI/CI)・DeepEval (Confident-AI)・Inspect AI (UK AISI)・METR Time Horizon・LLMonitor・Phoenix (Arize)・LangSmith Eval・Braintrust・¥0 OSS-¥¥¥¥¥/月、2026年Inspect AI+RAGAS主流。
Lightricks社が開発したオープンソースの高速テキスト動画生成モデル。RTX 4090で5秒動画を約2秒で生成するリアルタイム近傍の速度と、Apache 2.0ライセンスによる商用利用を両立した初のオープン高速動画生成モデル。
Embedding Model最新。Qwen3-Embedding-8B/4B/0.6B (MMTEB SOTA 2025)・BAAI BGE-M3 (Multi-vector・Dense+Sparse+ColBERT)・bge-reranker-v2-m3・jina-embeddings-v3・Stella v5 1.5B (4096dim)・nomic-embed-text-v2 (Local)・mxbai-embed-large-v1・OpenAI text-embedding-3-large・Voyage AI voyage-3 (Anthropic推奨)・Cohere Embed v3・E5 Large (Microsoft)・¥0 OSS-API・MMTEB Benchmark、2026年Multi-vector Embedding主流。
Text Embedding Model(2024-2026年)。BGE-M3(BAAI・8K context・multilingual・$0 Free)・BGE-Large/Small・Jina Embeddings v3(8K context・Matryoshka)・mxbai-embed-large(MixedBread)・Snowflake Arctic Embed・Qwen3-Embedding 0.6B/4B/8B(2024年・SOTA MTEB・100+ language)・stella(General)・OpenAI text-embedding-3-small($0.02/M token)/large($0.13/M)・Voyage AI(Anthropic推奨)・Cohere Embed v3・Nomic Embed・LM Studio + Qwen3-Embedding-8B Local・2026年 Qwen3 OSS主流、Voyage commercial。
テキストEmbeddingモデル。Qwen3-Embedding-8B/4B/0.6B (Alibaba・MMTEB SOTA)・BAAI BGE-M3・BGE-Large-EN-1.5・E5 Large/Mistral・Voyage AI voyage-3 (Anthropic推奨)・OpenAI text-embedding-3-large・Cohere Embed v3.0・NVIDIA NV-Embed-v2・Mixedbread mxbai・Stella v5 1.5B・jina-embeddings-v3・¥0-¥0.13/M tokens、2026年MMTEB日本語SOTA Qwen3。
テキストベクトル化モデル。BGE-M3(BAAI・8192 token・Multilingual)・Nomic Embed v2(768dim)・Voyage-3-large・Qwen3-Embedding-8B(4096dim)・Jina Embeddings v4・OpenAI text-embedding-3-large・Cohere Embed v4・mxbai-embed-large-v2・Snowflake Arctic Embed L 2.0・Stella 1.5B・MiniLM-L6代表、2026年1024-4096dim主流。
2024年Hong et al.発表ORPO paper・Industry-leading Odds Ratio Preference Optimization paradigm + Industry-leading SFT + alignment combined single-stage + Industry-emerging ORPO Pioneer。
2024年3月KAIST発表ORPO・Industry-leading odds ratio preference + Industry-leading no reference model + Industry-leading SFT+DPO unified monolithic + Industry-leading KAIST Hong+Lee ORPO Apache 2.0 no-reference-model preference optimization method 2024。
SFT(教師あり学習)とDPO(選好最適化)を1ステップに統合したアライメント手法。通常2段階が必要なSFT後のDPOを、オッズ比ペナルティを組み込んだ単一の損失関数で同時達成し、学習コストを約半分に削減する。2024年POSTECH発表。
SFT(教師あり微調整)と選好最適化を単一学習ステップで同時に行うLLM整合手法。参照モデル不要・計算コスト低減を実現し、DPOより効率的に人間の選好をモデルに反映できる。