2472件の用語
LLMの入出力テキストを分析し、暴力・差別・性的表現・違法行為の助長などの有害コンテンツを検出・遮断するフィルタリング機構。キーワードマッチング、ML分類器、埋め込みベースの意味解析など複数手法が併用される。
類似ペアの表現を近づけ、非類似ペアの表現を遠ざける損失関数。文埋め込みモデルや検索特化LLMの学習に不可欠な技術。
LLM(大規模言語モデル)をコンパイラ最適化に応用する技術、またはLLM自体の推論パイプラインをコンパイラ技術で高速化するアプローチの総称。Meta LLM Compilerやコード生成特化モデルが代表例。
LLMが自信を持って事実と異なる情報を生成する現象を、神経心理学の「作話(confabulation)」から借用した用語。ハルシネーションとほぼ同義だが、モデルが意図的に嘘をついているのではなく構造的に発生する点を強調する。
LLMがテキストを生成する際に次のトークンを選択するアルゴリズムの総称。Greedy Decoding・Beam Search・Temperature Sampling・Top-k・Top-p・Min-p・Mirostat など多数の手法があり、タスクの性質に応じて使い分けることで出力品質を最適化する。
LLMの出力を構文的に有効なJSONに限定するAPIオプション。OpenAI、Anthropic、Gemini、Mistralなど主要プロバイダが提供し、response_formatパラメータで有効化する。スキーマ準拠は保証しないが、json.loadsで確実にパースできる出力を得られる。
LLMジェイルブレイクとは、大規模言語モデルに設定された安全ガードレールやシステムプロンプトの制約を巧妙なプロンプト操作で回避し、本来拒否されるべき有害・危険なコンテンツを出力させる攻撃手法の総称である。
LLMの安全性ガードレール(有害コンテンツ生成の拒否・倫理的制約等)を回避し、本来拒否されるべき応答を引き出す攻撃手法。プロンプトインジェクションの一形態であり、DAN(Do Anything Now)・多言語攻撃・エンコード攻撃・仮想シナリオなど多様な手法が存在する。
安全フィルターを迂回してLLMに有害コンテンツを生成させる「脱獄(jailbreak)」攻撃に対する防御手法の総称。プロンプトフィルタリング・モデルレベル対策・監視システム等の多層防御で構成される。
LLMの安全制約を迂回する「ジェイルブレイク」攻撃を検出・防止するための技術的対策の総称。
LLMが自分の出力に対してフィードバックを生成し、そのフィードバックをもとに出力を反復的に改善する手法。追加訓練なしで品質向上が見込める。
LLM事実検証(Fact Verification)とは、大規模言語モデルが生成した応答内容を外部の信頼できる情報源と照合し、事実の正確性を自動的に評価・修正する技術である。FActScore、SAFE、Self-Consistency等の手法があり、生成後のハルシネーション検出とフィルタリングに用いられる。
LLMの出力が入力コンテキスト(プロンプト・参照文書)の内容と矛盾せず、事実に忠実であるかどうかを測る品質指標。
LLMが生成するテキストの事実的正確性を体系的に測定するための評価データセットとスコアリング手法の総称。FActScore・TruthfulQA・HaluEval等が代表的で、モデルの信頼性比較や改善指標として使用される。
LLMが生成したテキストの事実性・品質・一貫性を自動評価する技術。FActScore・SAFE・Chainpoll・G-Eval・RAGAS・Langfuseなどのフレームワークが活用される。
LLMの推論フェーズでトークン生成確率を操作し、出力テキスト全体に検出可能な隠しシグナルを付与する手法。
LLM蒸留とは、大規模言語モデル(教師モデル)の知識を小型モデル(生徒モデル)に転移する技術で、推論コストを大幅に削減しながら高い性能を維持する手法である。
LLM信頼度校正(Confidence Calibration)とは、大規模言語モデルが出力する確率値や確信度スコアを実際の正答率と一致するように調整する技術の総称である。校正が不十分なモデルは過信または過小評価を起こし、下流タスクの意思決定品質を著しく損なう。Temperature Scaling、Platt Scaling、Isotonic Regression等の事後校正手法と、学習時に校正損失を組み込む手法に大別される。
大規模言語モデル推論実行。vLLM 0.8・llama.cpp・TensorRT-LLM 0.14・Ollama 0.5・LM Studio 0.4・Text Generation Inference(TGI)・SGLang・MLC LLMが代表フレームワーク、PagedAttention+Continuous Batching+Speculative Decoding+FP8/INT4 AWQ量子化で2026年H200/B200 SXM搭載サーバで100-1000 tok/s/user達成。
LLM推論エンジン(LLM Inference Engine)は、大規模言語モデルの推論処理を高速かつ効率的に実行するための専用ソフトウェア基盤。vLLM・TensorRT-LLM・SGLang・llama.cpp・Text Generation Inference(TGI)などが代表格で、KVキャッシュ管理・連続バッチング・量子化・テンソル並列といった最適化技術を組み合わせ、GPUメモリ効率とスループットを最大化する。