2472件の用語
LLM合成データ生成とは、大規模言語モデルのAPI呼び出しやローカル推論を通じて、学習用テキストデータを自動的に大量生産する技術であり、Self-Instruct・Evol-Instruct・Magpieなど多様な手法が存在する。
LLM合成データフィルタリングとは、LLMが生成した大量の合成データから低品質・有害・重複・矛盾するサンプルを自動的に検出・除去し、学習に使用するデータの品質を保証する技術である。
LLM合成ペルソナとは、大規模言語モデル(LLM)を用いて特定の人格特性・知識・行動パターンを持つ仮想的な人物像(ペルソナ)を生成し、ユーザーテスト・市場調査・教育シミュレーション・対話エージェントなどに活用する技術体系である。
LLM構造化出力とは、大規模言語モデルの応答をJSON・XML・特定スキーマなどの決まった形式で出力させる技術の総称で、アプリケーション統合やデータパイプラインの自動化において不可欠な機能である。
LLMの応答をJSON・XML・YAML等の構造化フォーマットで出力させ、プログラムから型安全に利用可能にする技術。OpenAIのStructured Outputs、AnthropicのTool Use、GoogleのControlled Generationなど各プロバイダが独自の実装を提供している。
LLMのアテンションヘッド・FFNニューロン・レイヤー全体などの構造単位を除去してモデルを軽量化する手法。非構造的プルーニングと異なりGPU推論で直接高速化が得られる。
LLM(大規模言語モデル)の学習において、損失関数の勾配情報を利用してモデルパラメータを効率的に更新する手法の総称。Adam 系を基本に、Lion・Sophia・LAMB など 2023-2026 年に多数の改良オプティマイザが提案され、学習速度・メモリ効率・収束安定性が大幅に向上した。
Transformerの二次計算量ボトルネックを解消するために設計された代替アーキテクチャの総称。状態空間モデル(SSM)、線形Attention、RNN復権型など複数のアプローチが存在し、長系列処理での推論効率を大幅に改善する。
コードの前後の文脈(プレフィックスとサフィックス)を入力として、中間部分を生成する技術。Fill-in-the-Middle(FIM)とも呼ばれ、コード補完の中核テクニックである。
大規模言語モデル(LLM)を用いてプログラムのソースコードを自動的に生成する技術。自然言語による指示やコメントからコードを出力し、開発生産性を飛躍的に向上させる。
LLMを用いてプログラムのバグを自動的に検出・原因特定・修正提案する技術。エラーメッセージやスタックトレースを解析し、根本原因の特定と修正コードの生成を行う。
LLMがプログラミング中のコードの続きを予測・提案する技術。カーソル位置の文脈を解析し、次に書くべきコードをリアルタイムで提示する。
LLMがエディタ上でリアルタイムにコードの続きを予測・提案する機能。Fill-in-the-Middle学習により、カーソル位置の前後文脈から最適なコード断片を生成する。
LLMを活用してソフトウェアのバグを自動検出・修正する技術。エラーメッセージやスタックトレースからバグの原因を推論し、修正パッチを自動生成する。SWE-Benchが標準評価基準。
LLM Cost-Aware Routing(コスト最適化ルーティング)とは、応答品質の制約条件を満たしつつ API 利用コストを最小化するようリクエストを複数モデル間で振り分ける運用戦略である。LiteLLM・OpenRouter・Portkey 等のゲートウェイツールがバジェット管理とルーティングを統合的に提供する。
LLM APIの利用コストをリアルタイムで追跡・可視化・アラートする仕組み。トークン消費量・モデル別コスト・エンドポイント別コストを監視し、予算超過や異常利用を早期検出する。
LLM APIの利用コストを削減するための技術・戦略の総称。モデル選択・プロンプト圧縮・キャッシング・バッチ処理・ルーティングなどの手法を組み合わせて、品質を維持しつつトークンあたりのコストを最小化する。
キャッシング・モデルルーティング・バッチ処理・プロンプト圧縮を組み合わせてLLM API利用コストを削減する戦略と技術の総称。大規模運用では月数百万円のコスト削減が可能。
LLM APIの利用コストをリアルタイムに集計・可視化するダッシュボード。モデル別・機能別・ユーザー別のコスト内訳を表示し、予算超過の早期検知とコスト最適化の意思決定を支援する。
LLMコンテキスト容量進化。Claude Opus 4.7 1M context(2025年・Extended Thinking含)・Gemini 2.5 Pro 2M context(8hours音声/動画)・GPT-5 128K/Pro 1M・Llama 4 Scout 10M context(実用限界)・DeepSeek V3 128K・Qwen3 128K extend・RoPE Scaling(Rotary Position Embedding拡張)・Needle in Haystack test・Long Context Benchmark・RULER 128K・2026年1M+主流化、コスト問題課題。