2472件の用語
LLM推論の計算結果やレスポンスを保存・再利用することで、応答速度の向上とコスト削減を実現する技術群の総称。プロンプトキャッシュ、KVキャッシュ、セマンティックキャッシュなど複数の階層が存在する。
LLMが出力する確信度スコアが実際の正答率と一致するよう調整するプロセス。ECE(Expected Calibration Error)で定量化し、温度スケーリング等で補正する。
LLMが出力する確率スコアが実際の正解率と一致しているかを測定・調整する技術。Expected Calibration Error(ECE)が主要指標で、値が低いほど確率の信頼性が高い。
LLMの重み精度を低減し、メモリ消費量と計算負荷を抑える技術。FP16からINT8/INT4/FP4等へ変換することで、巨大なモデルをコンシューマ向けGPUやエッジデバイスでの高速推論・動作可能にする手法。
訓練データで見た要素の新しい組み合わせを推論できる能力。「赤い四角を90度回転」を学んだモデルが「青い円を90度回転」を正しく実行できるかを検証する概念。
LLMの出力を外部の信頼できる情報源(データベース・検索結果・ドキュメント)に基づかせることで、事実に即した回答を生成させる技術的手法の総称。
LLMグラウンディングとは、大規模言語モデル(LLM)の出力を外部の事実情報や信頼できるデータソースに紐付けることで、幻覚(ハルシネーション)を抑制し応答の正確性を担保する技術体系である。検索拡張生成(RAG)、知識グラフ連携、引用生成、事実検証など複数のアプローチが存在する。
LLMが生成したテキスト中の個別の主張(claim)を自動的に抽出し、外部情報源と照合してその真偽を判定する技術。
大規模言語モデル(LLM)をデプロイ後も新しいデータや知識で継続的に更新し続ける技術群の総称。破壊的忘却(Catastrophic Forgetting)を回避しながら新知識を獲得するため、Elastic Weight Consolidation・Experience Replay・LoRAアダプタ等の手法が用いられる。
大規模言語モデルが新しいタスクやドメインを学習しながら、既存の知識を保持し続ける機械学習パラダイム。壊滅的忘却(Catastrophic Forgetting)を防ぎつつ、モデルを継続的に更新する手法の総称。
学習済みLLMに新たなデータを追加学習させ、知識更新やドメイン特化を行う技術。完全再学習を避けコストを削減しつつモデルを最新化する。
学習済みLLMを医療・法律・金融など特定ドメインのコーパスで継続学習し、専門知識と一般能力を両立させるトレーニング手法。
2つの確率分布間の非対称な距離を測定する情報理論的指標。知識蒸留やRLHFのKLペナルティとしてLLM学習の中核を担う。
複数のLLMプロバイダ(OpenAI、Anthropic、Google、ローカルLLM等)へのアクセスを統一APIで抽象化し、ルーティング・認証・レート制限・コスト管理・ロギング・キャッシュ等の横断的機能を提供するミドルウェア。APIゲートウェイのLLM特化版であり、LiteLLM、Portkey、Helicone等が代表的。
言語モデルの事前学習で最も広く使われる損失関数。モデルが予測した次トークンの確率分布と正解分布の差異を最小化する。
LLMを用いて自律的に交渉を行うAIエージェント。価格交渉・契約交渉・資源配分など、対話的な合意形成タスクに特化。
LLM合成データとは、大規模言語モデル(LLM)を用いて人工的に生成されたテキストデータのことで、モデルの学習・評価・ファインチューニングに活用される技術である。
GPT-4やClaude等の強力なLLMを使って高品質なinstruction-followingデータを人工的に生成する技術。Self-InstructやEvol-Instructなどの手法でデータ生成コストを大幅に削減しつつモデル性能を向上させる。
LLM合成データ拡張とは、既存のデータセットをLLMの能力を活用して言い換え・翻訳・スタイル変換・難易度調整などにより量的・質的に拡張する技術であり、少量データからの効率的なモデル学習を実現する。
LLMを使って学習用データを人工的に生成する技術。実データの不足・プライバシー・コストの問題を補完し、指示チューニング・アライメント・ドメイン特化ファインチューニング向けデータを大量生成する。