11000件の用語
正解ラベルのone-hot分布を平滑化し、モデルの過信を抑制する正則化手法。Transformerの原論文で採用され、LLMの汎化性能向上に貢献する。
LLMの性能を複数のベンチマークスコアに基づいてランキング形式で一覧表示するウェブサービス。HuggingFace Open LLM Leaderboard や LMSYS Chatbot Arena が代表的で、モデル選定の参考指標として広く利用されている。
LLM量子化とは、大規模言語モデルの重みパラメータを32ビット浮動小数点(FP32)から4ビット・8ビット整数などの低ビット表現に変換し、モデルサイズの削減と推論速度の向上を実現する圧縮技術である。Llama 3.1 405Bモデルの場合、FP16で約810GBのVRAMが必要だが、4ビット量子化により約200GBまで削減できる。
Microsoftが開発したLLM向けプロンプト圧縮フレームワークの第2世代。トークン分類による情報保持判定で元プロンプトを最大20倍圧縮しながら推論精度を維持する。低コスト・低レイテンシのRAGパイプラインに有効。
LLMへのリクエストを受信し、クエリの分析結果に基づいて最適なモデルやエンドポイントへ転送するミドルウェアコンポーネント。APIゲートウェイとしてリトライ、フォールバック、レート制限、コスト追跡などの運用機能も統合する。
クエリの複雑度・コスト・レイテンシ目標に応じてLLMモデルを自動選択するインテリジェントルーティング技術。小型モデルと大型モデルを使い分けてコストを最適化。
LLM Routing & Orchestration(LLMルーティング&オーケストレーション)とは、複数の大規模言語モデルに対してリクエストを最適に振り分け、連携動作を制御する技術体系である。コスト・レイテンシ・品質のトレードオフを自動最適化し、単一モデルでは達成できない柔軟性と経済性を実現する。
LLM推論のレスポンス時間を多角的に計測・監視する手法。TTFT(最初のトークンまでの時間)、TPS(1秒あたりのトークン生成数)、E2E(エンドツーエンド)レイテンシなどの指標を追跡し、ユーザー体験とSLOの維持を図る。
LLMのTransformerレイヤー全体を除去することでモデルを軽量化する構造的プルーニングの一形態。後半レイヤーほど重要度が低い傾向があり、ShortGPT・LaCo等のフレームワークで実用化されている。
LLM APIに送信するリクエストで出力形式を指定するパラメータの総称。text(自由テキスト)、json_object(JSON構文保証)、json_schema(スキーマ準拠JSON)の3段階があり、用途に応じて使い分ける。
LLMの脆弱性・有害出力・安全性の欠陥を意図的に発見するためのテスト手法。攻撃者の視点でモデルを評価し、Jailbreak・Prompt Injection・バイアス等のリスクを事前に特定する。
LLMの安全上の脆弱性を意図的に探索するセキュリティテスト手法。有害コンテンツ生成・ジェイルブレイク・プロンプトインジェクション・バイアス等のリスクを事前に発見・緩和するために実施される。
悪意ある入力・エッジケースを体系的に試みてLLMの安全上の脆弱性を発見・修正する評価プロセス。
LLM の安全性を検証するために、意図的に有害・不正な出力を引き出す攻撃的テスト手法。軍事・セキュリティ分野の「レッドチーム」概念を AI に応用し、モデルの脆弱性を発見して対策を講じるプロセス。
LLM推論リクエストを複数のモデルサーバーやGPUインスタンスに分散する負荷分散機構。従来のHTTPロードバランサーとは異なり、GPU使用率・KVキャッシュ占有率・推論キュー長・リクエストのトークン数などLLM固有のメトリクスに基づいてルーティングを最適化する。
LLM(大規模言語モデル)が一度に処理できる入力トークン数の上限を拡張する技術群の総称。コンテキストウィンドウが大きいほど、長文書の要約・多文書比較・長い対話履歴の保持が可能になる。
LLM Evaluation Framework。EleutherAI lm-evaluation-harness 0.4 (50+ Tasks・Standard)・OpenAI evals・RAGAS (RAG Eval・Faithfulness/Answer Relevancy)・promptfoo 0.106 (Web UI/CI)・DeepEval (Confident-AI)・Inspect AI (UK AISI)・METR Time Horizon・LLMonitor・Phoenix (Arize)・LangSmith Eval・Braintrust・¥0 OSS-¥¥¥¥¥/月、2026年Inspect AI+RAGAS主流。
CPU電圧垂下補正機能。Level 1-8(ASUS・1最弱/8最強)・Mode 1-5(MSI)・Turbo/High/Medium/Low(GIGABYTE)・Vdroop抑制+Overshoot発生、Core Ultra 9 285K OC時LLC Level 5推奨・Ryzen 9 9950X3D時LLC Medium推奨、Vcore目標+0.02V補正で安定動作、2026年K/X3D OCer必須知識。
LLC共振コンバータ。高効率な電源回路方式
天然ウォールナット製の水抵抗ローイングマシンにタッチスクリーンとゲーミファイドトレーニングを組み合わせた高級コネクテッドフィットネス機器。