1978件の用語
大規模言語モデルが新しいタスクやドメインを学習しながら、既存の知識を保持し続ける機械学習パラダイム。壊滅的忘却(Catastrophic Forgetting)を防ぎつつ、モデルを継続的に更新する手法の総称。
学習済みLLMに新たなデータを追加学習させ、知識更新やドメイン特化を行う技術。完全再学習を避けコストを削減しつつモデルを最新化する。
学習済みLLMを医療・法律・金融など特定ドメインのコーパスで継続学習し、専門知識と一般能力を両立させるトレーニング手法。
LLMを用いて自律的に交渉を行うAIエージェント。価格交渉・契約交渉・資源配分など、対話的な合意形成タスクに特化。
LLMを使って学習用データを人工的に生成する技術。実データの不足・プライバシー・コストの問題を補完し、指示チューニング・アライメント・ドメイン特化ファインチューニング向けデータを大量生成する。
LLMのアテンションヘッド・FFNニューロン・レイヤー全体などの構造単位を除去してモデルを軽量化する手法。非構造的プルーニングと異なりGPU推論で直接高速化が得られる。
キャッシング・モデルルーティング・バッチ処理・プロンプト圧縮を組み合わせてLLM API利用コストを削減する戦略と技術の総称。大規模運用では月数百万円のコスト削減が可能。
LLMコンテキスト容量進化。Claude Opus 4.7 1M context(2025年・Extended Thinking含)・Gemini 2.5 Pro 2M context(8hours音声/動画)・GPT-5 128K/Pro 1M・Llama 4 Scout 10M context(実用限界)・DeepSeek V3 128K・Qwen3 128K extend・RoPE Scaling(Rotary Position Embedding拡張)・Needle in Haystack test・Long Context Benchmark・RULER 128K・2026年1M+主流化、コスト問題課題。
安全フィルターを迂回してLLMに有害コンテンツを生成させる「脱獄(jailbreak)」攻撃に対する防御手法の総称。プロンプトフィルタリング・モデルレベル対策・監視システム等の多層防御で構成される。
LLMの安全制約を迂回する「ジェイルブレイク」攻撃を検出・防止するための技術的対策の総称。
LLMが自分の出力に対してフィードバックを生成し、そのフィードバックをもとに出力を反復的に改善する手法。追加訓練なしで品質向上が見込める。
LLMが生成したテキストの事実性・品質・一貫性を自動評価する技術。FActScore・SAFE・Chainpoll・G-Eval・RAGAS・Langfuseなどのフレームワークが活用される。
LLMの推論フェーズでトークン生成確率を操作し、出力テキスト全体に検出可能な隠しシグナルを付与する手法。
大規模言語モデル推論実行。vLLM 0.8・llama.cpp・TensorRT-LLM 0.14・Ollama 0.5・LM Studio 0.4・Text Generation Inference(TGI)・SGLang・MLC LLMが代表フレームワーク、PagedAttention+Continuous Batching+Speculative Decoding+FP8/INT4 AWQ量子化で2026年H200/B200 SXM搭載サーバで100-1000 tok/s/user達成。
LLMの重みの多くをゼロにすることでメモリ削減・推論高速化を図る技術群。非構造化・半構造化・構造化の3カテゴリが存在する。
LLMの重み行列においてほとんどの値をゼロに近づけることでメモリ削減と演算効率化を実現するモデル圧縮アプローチの総称。
不確実性が高い質問に対してLLMが回答を保留・棄権する能力。回答精度と棄権率のトレードオフを最適化し、高信頼な回答のみ出力する手法。
LLM生成テキストに統計的検出可能なシグナルを埋め込む手法。Greenlist/Redlistトークン選択で生成分布を偏らせる。
LLMが具体例を超えて一般的なパターンや関係性を認識・適用する能力。アナロジー推論・規則帰納・関係推論などを含み、AGI研究の中核テーマ。
LLMが特定のテキスト(個人情報・著作物・テストデータ)を訓練時に記憶し、プロンプト誘導によって再現・出力できる状態を検出・定量化する手法。記憶抽出攻撃と汚染検出の両面を含む。