Self-Consistencyサンプリングとは？（セルフコンシステンシーサンプリング）わかりやすく解説

Q: Self-Consistencyサンプリングとは？

Self-Consistencyサンプリングとは、Self-Consistency手法において複数の推論パスを生成するための確率的デコーディングプロセスである。温度パラメータ（temperature）、top-k、top-pなどのサンプリング制御パラメータを適切に設定し、同一プロンプトから多様かつ質の高い推論経路を生成する。サンプル数nの選択は精度とコストのトレードオフであり、Wang et al.（2022）の実験ではn=10〜40で最良の費用対効果が得られた。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Self-Consistencyサンプリングとは？（セルフコンシステンシーサンプリング）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

温度パラメータ（Temperature）の制御

温度パラメータはソフトマックス関数の鋭さを制御し、サンプリングの多様性を直接的に規定する。

温度の数学的定義

P(token_i) = exp(logit_i / T) / Σ_j exp(logit_j / T)

ここでTが温度パラメータである。T→0でgreedy decoding（最大確率トークンのみ選択）、T→∞で一様分布（完全ランダム）に近づく。

温度別の挙動比較

温度	多様性	品質	Self-Consistency適性	典型的用途
0.0	なし（決定的）	最高（単一パス）	不適（パス多様性ゼロ）	通常のCoT推論
0.1〜0.3	極低	高	低（多様性不足）	軽微なバリエーション
0.5	中程度	高	最適（多くのタスク）

タスク種別	温度	Top-p	Top-k	サンプル数n
算術推論（GSM8K等）	0.5	0.95	-	10〜20
常識推論（StrategyQA等）	0.7	0.90	-	10〜15
代数推論（AQuA等）	0.5	0.95	-	15〜30
科学推論（ARC等）	0.7	0.95	-	10〜20
コード生成	0.8	0.95	50	10〜20

サンプル数n	精度（%）	改善幅（vs greedy）	相対コスト
1（greedy）	56.5	-	1×
5	70.2	+13.7	5×
10	72.8	+16.3	10×
20	74.0	+17.5	20×
40	74.4	+17.9	40×

モデル	入力単価	出力単価	n=1コスト	n=10コスト	n=20コスト
GPT-4o	$2.50/1M	$10.00/1M	$0.004	$0.043	$0.086
GPT-4o-mini	$0.15/1M	$0.60/1M	$0.0003	$0.003	$0.005
Claude 3.5 Sonnet	$3.00/1M	$15.00/1M	$0.006	$0.060	$0.119
Claude 3.5 Haiku	$0.80/1M	$4.00/1M	$0.002	$0.016	$0.032
Gemini 1.5 Pro	$1.25/1M	$5.00/1M	$0.002	$0.023	$0.046

import asyncio
from openai import AsyncOpenAI

client = AsyncOpenAI()

async def self_consistency(prompt, n=10, temperature=0.5):
    tasks = [
        client.chat.completions.create(
            model="gpt-4o",
            messages=[{"role": "user", "content": prompt}],
            temperature=temperature,
        )
        for _ in range(n)
    ]
    responses = await asyncio.gather(*tasks)
    answers = [extract_answer(r.choices[0].message.content) for r in responses]
    return majority_vote(answers)

メニュー

Self-Consistencyサンプリング（セルフコンシステンシーサンプリング）

メニュー

Self-Consistencyサンプリング（セルフコンシステンシーサンプリング）

この用語に関連するコンテンツ

Self-Consistencyにおけるサンプリングの役割

温度パラメータ（Temperature）の制御

温度の数学的定義

温度別の挙動比較

Top-k / Top-p サンプリングとの組み合わせ

Top-k サンプリング

Top-p（Nucleus）サンプリング

組み合わせ推奨設定

サンプル数（n）と精度のトレードオフ

nと精度の関係（GSM8K, PaLM-540B）

収穫逓減の数学的モデル

コスト分析と最適化戦略

API別コスト試算（1問あたり、平均入力500トークン・出力300トークン）

コスト最適化テクニック

並列実行とレイテンシ

よくある質問

Q1: 温度0.5と0.7のどちらを選ぶべきですか？

Q2: サンプル数を増やすほど精度は必ず上がりますか？

Q3: プロンプトキャッシュを使うとどれくらいコスト削減できますか？

関連用語