11000件の用語
LLM APIへのリクエストごとにinput/outputトークン数を記録・集計し、コスト管理や使用パターン分析に活用する仕組み。プロバイダのレスポンスヘッダーやusageオブジェクトからデータを取得し、ユーザー別・機能別に按分する。
LLM(大規模言語モデル)とナレッジグラフ(KG)を組み合わせ、構造化された知識と自然言語処理能力を統合する技術領域。LLMの生成能力とKGの事実整合性を相互補完することで、ハルシネーション抑制や推論精度の向上を実現する。
ニューラルネットワーク(LLM)と記号的AI(論理・規則・制約)を統合するパラダイム。LLMの流暢な言語理解と形式論理の確実性・説明可能性を組み合わせて複雑推論を実現する。
LLMの出力品質を人間の評価者が直接判定する手法。Likertスケール評価・ペアワイズ比較・Chatbot ArenaのEloレーティングなどの方式がある。自動指標では捕捉しきれない流暢性・有用性・安全性を評価できるが、コストが高く再現性の確保が課題。
活性化関数とは、ニューラルネットワークの各層で入力信号に非線形変換を加える数学的関数であり、LLM(大規模言語モデル)では GELU・SwiGLU・GeGLU などが主流として採用され、モデルの表現力と学習効率を決定づける要素である。
LLMへの入力構築から推論実行・出力解析・後処理までを一連のステージとして構造化し、再利用可能な処理フローを構築する設計パターン。
LLMプロバイダが提供する非同期バッチ処理用API。リアルタイム性を犠牲にする代わりに大幅な割引料金(通常50%OFF)で大量のリクエストを処理できる。OpenAI Batch APIやAnthropic Message Batchesが代表的。
AI幻覚低減手法。RAG(Retrieval Augmented Generation)・Citation/Source linking(Perplexity AI/You.com)・Self-Consistency・Chain-of-Verification(CoVe・Meta)・REALM/Self-RAG・Confidence threshold・Temperature 0-0.3・Structured Output(JSON Schema)・Constrained decoding・Guardrails(NeMo Guardrails・Guardrails AI)・Anthropic Opus 4.7 27% hallucination・GPT-5 25%・Claude reliance 最小化設計・2026年Production必須対策。
大規模言語モデル(LLM)が事実と異なる情報を生成する「ハルシネーション」を抑制・軽減するための技術群。RAG・ファインチューニング・プロンプト設計・出力検証などを組み合わせて対処する。
LLMが事実と異なる情報を自信を持って生成する「幻覚現象」を検出・軽減する技術。RAG統合・自己整合性チェック・FactScore・SelfCheckGPTなど多様なアプローチが存在する。
LLM(大規模言語モデル)の性能を定量的に測定・比較するための指標群。Perplexity、BLEU、ROUGE、人間評価、LLM-as-a-Judgeなど多角的な手法が存在し、タスクの種類や評価目的に応じて使い分ける。
LLMの性能を複数のベンチマークタスクで体系的に測定するためのフレームワーク。EleutherAI の lm-evaluation-harness が代表的で、MMLU・HellaSwag・ARC 等の標準ベンチマークを統一インターフェースで実行し、モデル間の公平な比較を可能にする。
LLM(大規模言語モデル)の性能を体系的に測定・比較するためのフレームワーク。EleutherAI が開発した lm-evaluation-harness が代表的な実装であり、数百種類のベンチマークを統一インターフェースで実行できる。
LLM出力評価ライブラリ。DeepEval・Ragas・Promptfoo・Arize Phoenix・Langfuse・OpenAI Evals・LiteLLM Eval・Braintrust・Weights & Biases Weave・Inspect AI(UK AISI)が2026年代表、LLM-as-Judge+Metrics(faithfulness/answer-relevancy/context-precision)で品質測定。
事前学習済みの大規模言語モデル(LLM)を特定のタスクやドメインに適応させるため、追加のデータセットで再学習させる技術の総称。Full Fine-tuning、LoRA、QLoRA、Instruction Tuningなど複数の手法が存在する。
LLMファインチューニングパイプラインとは、事前学習済みの大規模言語モデルを特定のタスクやドメインに適応させるための体系的なワークフローである。データ収集・前処理・学習・評価・デプロイの5段階で構成され、Hugging Face TRL・Axolotl・LLaMA-Factory等のフレームワークが主流となっている。
LLMが外部ツールや関数を呼び出す機能。モデルが自然言語の指示を解釈し、定義されたAPI・データベース・計算処理を実行して結果を取得する。
簡単なサンプルの損失を減衰させ、困難なサンプルに学習を集中させる改良型交差エントロピー損失。クラス不均衡問題に効果的。
2023年NUS (National University of Singapore)発表LLM-Pruner paper・Industry-emerging Gradient-Based Structured Pruning paradigm + Industry-leading task-agnostic compression + Industry-leading recovery fine-tuning paradigm + Industry-leading NUS academic AI research foundation。
2023年Ma et al. (Singapore NUS)発表LLM-Pruner・Industry-leading gradient-based structured pruning LLM + Industry-leading LoRA recovery + Industry-leading 20% parameter reduction + Industry-leading LLaMA/Vicuna pruning。