11000件の用語
LLMが外部ツール・APIを呼び出せるようにする機能。モデルはユーザーの意図に応じてJSON形式の関数呼び出し命令を生成し、アプリ側がその結果を受け取って実行する。OpenAI GPT-4・Claude・Geminiが対応する。
トレーニング済みLLMを推論リクエストに応答できる形でデプロイする技術基盤。スループット・レイテンシ・コスト効率のトレードオフを管理し、vLLM/TGI/TensorRT-LLMなど専用エンジンでバッチ処理・連続バッチング・KVキャッシュを最適化する。
LLM が敵対的入力・分布外データ・ノイズ・攻撃に対してどの程度安定した出力を維持できるかを定量評価するプロセス。HarmBench・AdvBench・WildGuard 等の標準ベンチマークで実施される。
LLM自体を評価者として用いてAI出力の品質を評価するアプローチ。人間アノテーターの代替として強力なLLM(GPT-4/Claude等)が他モデルの出力をスコアリング・比較する手法。
LLM Inference Acceleratorは、大規模言語モデル(Large Language Model)の推論処理を高速化する専用ハードウェアアクセラレータです。2025年に登場した最新世代のAIチップは、従来のGPUベースの推論と比較して、大幅な電力効率の改善と推論速度の向上を実現しています。
主要LLM API料金比較(2026年Q1)。Claude Opus 4.7 $15/$75 (in/out M tok)・Sonnet 4.6 $3/$15・Haiku 4.5 $0.25/$1.25・GPT-5 Pro $30/$60・o3 Pro $20/$80・Gemini 2.5 Pro $3.5/$10.5・DeepSeek V3 $0.27/$1.10・Grok 4 $3/$15・Prompt Caching 90%削減・Batch API 50%割引対応、長時間対話+Agent運用コスト比較必須。
LLMが誤答でも高い確信度を示す傾向。RLHF訓練後やfew-shot設定で顕著に現れ、ユーザーが誤情報を正しいと信じるリスクを高める。
LLMから特定の知識・訓練データの影響を除去する技術。著作権侵害・プライバシー保護・有害情報削除を目的とする。
LLMが論理規則・数式・アルゴリズムなど記号的表現を操作して推論する能力。演繹推論・数学的証明・アルゴリズム実行などを含み、ニューラルと記号AIの融合研究の核心。
LLMが出力する確信度スコアが実際の正答率と一致するよう調整するプロセス。ECE(Expected Calibration Error)で定量化し、温度スケーリング等で補正する。
LLMが出力する確率スコアが実際の正解率と一致しているかを測定・調整する技術。Expected Calibration Error(ECE)が主要指標で、値が低いほど確率の信頼性が高い。
LLMの重み精度を低減し、メモリ消費量と計算負荷を抑える技術。FP16からINT8/INT4/FP4等へ変換することで、巨大なモデルをコンシューマ向けGPUやエッジデバイスでの高速推論・動作可能にする手法。
訓練データで見た要素の新しい組み合わせを推論できる能力。「赤い四角を90度回転」を学んだモデルが「青い円を90度回転」を正しく実行できるかを検証する概念。
大規模言語モデルが新しいタスクやドメインを学習しながら、既存の知識を保持し続ける機械学習パラダイム。壊滅的忘却(Catastrophic Forgetting)を防ぎつつ、モデルを継続的に更新する手法の総称。
学習済みLLMに新たなデータを追加学習させ、知識更新やドメイン特化を行う技術。完全再学習を避けコストを削減しつつモデルを最新化する。
学習済みLLMを医療・法律・金融など特定ドメインのコーパスで継続学習し、専門知識と一般能力を両立させるトレーニング手法。
LLMを用いて自律的に交渉を行うAIエージェント。価格交渉・契約交渉・資源配分など、対話的な合意形成タスクに特化。
LLMを使って学習用データを人工的に生成する技術。実データの不足・プライバシー・コストの問題を補完し、指示チューニング・アライメント・ドメイン特化ファインチューニング向けデータを大量生成する。
LLMのアテンションヘッド・FFNニューロン・レイヤー全体などの構造単位を除去してモデルを軽量化する手法。非構造的プルーニングと異なりGPU推論で直接高速化が得られる。
キャッシング・モデルルーティング・バッチ処理・プロンプト圧縮を組み合わせてLLM API利用コストを削減する戦略と技術の総称。大規模運用では月数百万円のコスト削減が可能。