LLM信頼度校正とは？（エルエルエムシンライドコウセイ）わかりやすく解説

Q: LLM信頼度校正とは？

LLM信頼度校正（Confidence Calibration）とは、大規模言語モデルが出力する確率値や確信度スコアを実際の正答率と一致するように調整する技術の総称である。校正が不十分なモデルは過信または過小評価を起こし、下流タスクの意思決定品質を著しく損なう。Temperature Scaling、Platt Scaling、Isotonic Regression等の事後校正手法と、学習時に校正損失を組み込む手法に大別される。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

LLM信頼度校正とは？（エルエルエムシンライドコウセイ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

LLM信頼度校正とは

LLM信頼度校正（Confidence Calibration）は、モデルが「この回答の確信度は90%です」と出力した場合に、実際にその回答が正解である確率も90%前後になるよう、出力確率分布を調整する技術体系である。理想的に校正されたモデルでは、確信度p%で出力した回答群のうち実際にp%が正解となる。この性質を「完全校正（Perfect Calibration）」と呼ぶ。

2024-2025年にかけてGPT-4o、Claude 3.5 Sonnet、Gemini 1.5 Pro等の最先端LLMが急速に普及したが、これらのモデルは一般に過信（Overconfident）傾向を示す。Kadavath et al.（2022）の研究ではGPT系モデルが95%以上の確信度を出力する場面で実際の正答率は70-80%程度に留まることが示された。この過信問題は医療診断支援、法律文書レビュー、金融リスク評価といった高リスク応用領域で深刻なリスクとなる。

応用領域	校正不良のリスク	要求される校正精度
医療診断支援	誤診による患者被害	ECE < 0.02
自動運転判断	衝突事故	ECE < 0.01
金融リスク評価	不適切な投融資判断	ECE < 0.03
法律文書レビュー	法的リスクの見落とし	ECE < 0.05
カスタマーサポート	誤回答による信頼失墜	ECE < 0.10
教育支援	誤った学習指導	ECE < 0.08

校正誤差の数学的定義

信頼度校正の品質を定量化する最も基本的な指標がECE（Expected Calibration Error）である。全予測をM個のビン（確信度区間）に分割し、各ビンにおける平均確信度と実際の正答率の乖離を加重平均する。

ECE = Σ(m=1 to M) (|B_m| / n) × |acc(B_m) - conf(B_m)|

B_mはm番目のビンのサンプル集合、nは全サンプル数、acc(B_m)はビン内正答率、conf(B_m)はビン内平均確信度である。

指標	定義	特徴
ECE	ビン別乖離の加重平均	最も標準的、ビン数依存
MCE	ビン別乖離の最大値	最悪ケースを捕捉
ACE	等サンプル数ビンでのECE	ビン幅の偏り解消
SCE	クラス別ECEの平均	多クラス問題に適合
Brier Score	(p - y)^2の平均	校正と識別力の複合指標

import numpy as np

def compute_ece(confidences, accuracies, n_bins=15):
    bin_boundaries = np.linspace(0, 1, n_bins + 1)
    ece = 0.0
    for i in range(n_bins):
        mask = (confidences > bin_boundaries[i]) &amp; (confidences &lt;= bin_boundaries[i + 1])
        if mask.sum() == 0:
            continue
        bin_acc = accuracies[mask].mean()
        bin_conf = confidences[mask].mean()
        ece += (mask.sum() / len(confidences)) * abs(bin_acc - bin_conf)
    return ece

LLMプロバイダ	logit提供	制限
OpenAI (GPT-4o)	あり	トップ20トークンまで
Anthropic (Claude)	なし	言語化校正のみ適用可
Google (Gemini)	あり	トップ40トークンまで
Meta (Llama)	あり（フル）	オープンウェイト
Mistral	あり	トップ10トークンまで

class CalibrationPipeline:
    def __init__(self, model, calibrator, threshold=0.7):
        self.model = model
        self.calibrator = calibrator
        self.threshold = threshold

    def predict_with_confidence(self, prompt):
        raw_output = self.model.generate(prompt)
        raw_conf = self.model.get_logprobs(prompt)
        calibrated = self.calibrator.transform(raw_conf)
        action = "escalate_to_human" if calibrated &lt; self.threshold else "auto_respond"
        return {"answer": raw_output, "confidence": calibrated, "action": action}

メニュー

LLM信頼度校正（エルエルエムシンライドコウセイ）

メニュー

LLM信頼度校正（エルエルエムシンライドコウセイ）

この用語に関連するコンテンツ

LLM信頼度校正とは

校正誤差の数学的定義

校正手法の分類体系

1. 事後校正（Post-hoc Calibration）

2. 学習時校正（Train-time Calibration）

3. 言語化校正（Verbalized Calibration）

4. アンサンブル校正（Ensemble Calibration）

LLMにおける校正の課題

トークンレベル vs シーケンスレベル

APIの制約

プロンプト依存性

実装パターンとベストプラクティス

よくある質問（FAQ）

Q1: LLMの信頼度校正はなぜ重要ですか？

Q2: Temperature Scalingだけで十分ですか？

Q3: 信頼度校正とハルシネーション検出の関係は？

Q4: マルチモーダルLLMでも信頼度校正は適用できますか？

関連用語