Selective Predictionとは？（セレクティブプレディクション）わかりやすく解説

Q: Selective Predictionとは？

Selective Prediction（選択的予測）とは、モデルの校正済み確信度に基づいて「回答するか棄権するか」を動的に判断する意思決定フレームワークである。確信度が事前に設定した閾値を下回る場合は回答を保留し人間の専門家にエスカレーションすることで、システム全体の信頼性と正確性を向上させる。Abstention（棄権）やReject Option（拒否オプション）とも呼ばれる。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Selective Predictionとは？（セレクティブプレディクション）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

Selective Predictionとは

Selective Prediction（選択的予測）は、予測モデルが自身の確信度に基づいて「この質問には自信を持って回答できる」または「この質問は不確実なので回答を控える」という判断を行うフレームワークである。1970年代のChow（1970）による棄権付き分類の理論に端を発し、2020年代のLLM普及に伴い実用的な重要性が飛躍的に高まった。

Selective Predictionの核心は「カバレッジ（Coverage）と精度（Accuracy）のトレードオフ」である。全質問に回答すれば（カバレッジ100%）精度は下がり、高確信度の質問にのみ回答すれば（カバレッジ低下）精度は上がる。このトレードオフを定量化し最適な動作点を見つけることがSelective Predictionの目標である。

指標	定義	典型的な目標値
カバレッジ（Coverage）	回答した質問の割合	70-90%
選択的精度（Selective Accuracy）	回答した質問の中での正答率	95%以上
棄権率（Abstention Rate）	回答を拒否した質問の割合	10-30%
Risk-Coverage AUC	RC曲線下面積	0.95以上
AURC（Area Under RC）	正規化RC曲線下面積	小さいほど良い

数学的定式化

Selective Predictionは選択関数g(x)と予測関数f(x)の組み合わせで定義される。

(f, g)(x) = { f(x)  if g(x) = 1  (回答する)
             { 棄権   if g(x) = 0  (回答しない) }

選択関数g(x)は確信度スコアc(x)と閾値θの比較で決定される。

g(x) = 1  if c(x) >= θ
g(x) = 0  if c(x) &lt; θ

選択的リスク（Selective Risk）は以下で定義される。

R(f, g) = E[L(f(x), y) * g(x)] / E[g(x)]

L(f(x), y)は損失関数、E[g(x)]はカバレッジに相当する。閾値θを上げるとカバレッジが下がり選択的リスクも下がる。

確信度スコアの選択

Selective Predictionの性能は確信度スコアの品質に直結する。LLMで利用可能な確信度スコアを比較する。

確信度スコア	計算方法	logit必要	コスト	品質（AUROC）
Max Token Prob	max(softmax(logits))	はい	低

def semantic_entropy(responses, embedder, n_clusters=None):
    embeddings = [embedder.encode(r) for r in responses]
    from sklearn.cluster import AgglomerativeClustering
    clustering = AgglomerativeClustering(
        n_clusters=None, distance_threshold=0.3
    ).fit(embeddings)
    labels = clustering.labels_
    from collections import Counter
    counts = Counter(labels)
    total = len(labels)
    entropy = -sum((c/total) * np.log(c/total) for c in counts.values())
    return entropy

ドメイン	推奨閾値	カバレッジ目安	根拠
医療診断支援	0.90-0.95	40-60%	誤回答の被害が甚大
法律相談	0.85-0.90	50-70%	法的リスクが高い
金融アドバイス	0.80-0.90	55-75%	経済的損失リスク
カスタマーサポート	0.65-0.75	75-90%	人間対応で補完可能
教育支援	0.60-0.70	80-95%	誤りからも学べる
雑談・エンタメ	0.40-0.50	90-98%	リスクが低い

class SelectivePredictionPipeline:
    def __init__(self, model, calibrator, threshold=0.75, escalation_handler=None):
        self.model = model
        self.calibrator = calibrator
        self.threshold = threshold
        self.escalation = escalation_handler

    def predict(self, query):
        response = self.model.generate(query)
        raw_confidence = self.model.get_confidence(query, response)
        calibrated = self.calibrator.transform(raw_confidence)

        if calibrated >= self.threshold:
            return {"answer": response, "confidence": calibrated, "status": "auto"}
        elif self.escalation:
            ticket = self.escalation.create(query, response, calibrated)
            return {"answer": None, "confidence": calibrated, "status": "escalated", "ticket": ticket}
        else:
            return {"answer": response, "confidence": calibrated, "status": "low_confidence", "warning": "この回答は確信度が低いため正確性を保証できません"}

メニュー

Selective Prediction（セレクティブプレディクション）

メニュー

Selective Prediction（セレクティブプレディクション）

この用語に関連するコンテンツ

Selective Predictionとは

数学的定式化

確信度スコアの選択

Semantic Entropy

閾値設定戦略

固定閾値

動的閾値

コスト最適化閾値

実運用パイプライン

よくある質問（FAQ）

Q1: Selective Predictionの閾値はどのように最適化すべきですか？

Q2: 棄権した質問はどう処理すべきですか？

Q3: Selective PredictionとRAGの関係は？

関連用語