11000件の用語
LLMの重み精度を低減し、メモリ消費量と計算負荷を抑える技術。FP16からINT8/INT4/FP4等へ変換することで、巨大なモデルをコンシューマ向けGPUやエッジデバイスでの高速推論・動作可能にする手法。
訓練データで見た要素の新しい組み合わせを推論できる能力。「赤い四角を90度回転」を学んだモデルが「青い円を90度回転」を正しく実行できるかを検証する概念。
LLMの出力を外部の信頼できる情報源(データベース・検索結果・ドキュメント)に基づかせることで、事実に即した回答を生成させる技術的手法の総称。
LLMグラウンディングとは、大規模言語モデル(LLM)の出力を外部の事実情報や信頼できるデータソースに紐付けることで、幻覚(ハルシネーション)を抑制し応答の正確性を担保する技術体系である。検索拡張生成(RAG)、知識グラフ連携、引用生成、事実検証など複数のアプローチが存在する。
LLMが生成したテキスト中の個別の主張(claim)を自動的に抽出し、外部情報源と照合してその真偽を判定する技術。
大規模言語モデルが新しいタスクやドメインを学習しながら、既存の知識を保持し続ける機械学習パラダイム。壊滅的忘却(Catastrophic Forgetting)を防ぎつつ、モデルを継続的に更新する手法の総称。
学習済みLLMに新たなデータを追加学習させ、知識更新やドメイン特化を行う技術。完全再学習を避けコストを削減しつつモデルを最新化する。
学習済みLLMを医療・法律・金融など特定ドメインのコーパスで継続学習し、専門知識と一般能力を両立させるトレーニング手法。
2つの確率分布間の非対称な距離を測定する情報理論的指標。知識蒸留やRLHFのKLペナルティとしてLLM学習の中核を担う。
複数のLLMプロバイダ(OpenAI、Anthropic、Google、ローカルLLM等)へのアクセスを統一APIで抽象化し、ルーティング・認証・レート制限・コスト管理・ロギング・キャッシュ等の横断的機能を提供するミドルウェア。APIゲートウェイのLLM特化版であり、LiteLLM、Portkey、Helicone等が代表的。
言語モデルの事前学習で最も広く使われる損失関数。モデルが予測した次トークンの確率分布と正解分布の差異を最小化する。
LLMを用いて自律的に交渉を行うAIエージェント。価格交渉・契約交渉・資源配分など、対話的な合意形成タスクに特化。
LLM合成データとは、大規模言語モデル(LLM)を用いて人工的に生成されたテキストデータのことで、モデルの学習・評価・ファインチューニングに活用される技術である。
GPT-4やClaude等の強力なLLMを使って高品質なinstruction-followingデータを人工的に生成する技術。Self-InstructやEvol-Instructなどの手法でデータ生成コストを大幅に削減しつつモデル性能を向上させる。
LLM合成データ拡張とは、既存のデータセットをLLMの能力を活用して言い換え・翻訳・スタイル変換・難易度調整などにより量的・質的に拡張する技術であり、少量データからの効率的なモデル学習を実現する。
LLMを使って学習用データを人工的に生成する技術。実データの不足・プライバシー・コストの問題を補完し、指示チューニング・アライメント・ドメイン特化ファインチューニング向けデータを大量生成する。
LLM合成データ生成とは、大規模言語モデルのAPI呼び出しやローカル推論を通じて、学習用テキストデータを自動的に大量生産する技術であり、Self-Instruct・Evol-Instruct・Magpieなど多様な手法が存在する。
LLM合成データフィルタリングとは、LLMが生成した大量の合成データから低品質・有害・重複・矛盾するサンプルを自動的に検出・除去し、学習に使用するデータの品質を保証する技術である。
LLM構造化出力とは、大規模言語モデルの応答をJSON・XML・特定スキーマなどの決まった形式で出力させる技術の総称で、アプリケーション統合やデータパイプラインの自動化において不可欠な機能である。
LLMの応答をJSON・XML・YAML等の構造化フォーマットで出力させ、プログラムから型安全に利用可能にする技術。OpenAIのStructured Outputs、AnthropicのTool Use、GoogleのControlled Generationなど各プロバイダが独自の実装を提供している。