Self-Consistency推論パスとは？（セルフコンシステンシースイロンパス）わかりやすく解説

Q: Self-Consistency推論パスとは？

Self-Consistency推論パスとは、Self-Consistency手法における個々の推論経路（reasoning path）とその集約メカニズムを指す。各推論パスはChain-of-Thought（CoT）形式の中間ステップと最終回答で構成され、同一問題に対して異なる推論戦略・計算順序・論理展開を経由する。集約は最終回答に対する多数決（majority voting）が標準だが、重み付き投票やクラスタリングベースの手法も研究されている。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Self-Consistency推論パスとは？（セルフコンシステンシースイロンパス）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

推論パスの多様性メカニズム

推論パスの多様性は以下の要因から生じる。

1. トークンレベルの分岐

温度サンプリングにより、各トークン生成ステップで異なるトークンが選択される。これにより、同一の推論論理でも表現のバリエーション（「まず」vs「最初に」vs「第一ステップとして」）が生まれ、後続の推論展開に影響を与える。

2. 推論戦略の分岐

同一問題に対して複数の解法が存在する場合、異なるパスが異なる解法戦略を選択する。数学問題であれば代数的アプローチ vs 幾何学的アプローチ、プログラミング問題であれば反復 vs 再帰などの分岐が発生する。

3. 中間ステップの粒度差

あるパスは詳細な中間ステップを展開し、別のパスはより大きなジャンプで結論に到達する。粒度の差は計算精度に影響を与え、特に多段階の算術計算では詳細なパスがエラーを抑制する傾向がある。

多様性の定量評価

多様性指標	定義	望ましい範囲
回答エントロピー	H = -Σ p(a) log p(a)	0.3〜1.5
ユニーク回答率	ユニーク回答数 / n	0.1〜0.5
多数派集中度	最頻回答の票数 / n	0.4〜0.9
推論トークン分散	推論長の標準偏差	中程度

回答エントロピーが0に近い場合、全パスが同一回答を出しており多様性が不足（温度が低すぎる）。逆にエントロピーが高すぎる場合、パスがバラバラで収束していない（温度が高すぎるか、タスクが困難すぎる）。

入力: n個の推論パス {(r_1, a_1), ..., (r_n, a_n)}
       （r_i: 推論ステップ、a_i: 最終回答）
1. 回答カウント: count(a) = |{i : a_i = a}| for each unique a
2. 最終回答: a* = argmax_a count(a)
3. 確信度: confidence = count(a*) / n
出力: (a*, confidence)

正規化処理	例	目的
数値の統一	「3.0」→「3」、「三」→「3」	表記揺れの統一
単位の除去	「5ドル」→「5」	余分な修飾の除去
空白・句読点の除去	「 yes. 」→「yes」	フォーマットの統一
大文字小文字の統一	「Yes」→「yes」	表記の統一
数式の評価	「2+3」→「5」	未評価式の解決

集約手法	GSM8K精度	追加コスト	実装複雑性
単純多数決	74.4%	なし	低
確率重み付け	74.1%〜75.2%	ログ確率取得	中
verifier重み付け	78.2%	検証モデル訓練	高
verifier + Self-Consistency	80.0%+	両方	最高

メニュー

Self-Consistency推論パス（セルフコンシステンシースイロンパス）

メニュー

Self-Consistency推論パス（セルフコンシステンシースイロンパス）

この用語に関連するコンテンツ

推論パスとは何か

推論パスの多様性メカニズム

1. トークンレベルの分岐

2. 推論戦略の分岐

3. 中間ステップの粒度差

多様性の定量評価

多数決（Majority Voting）

アルゴリズム

回答の正規化

重み付き投票（Weighted Voting）

確率ベースの重み付け

検証ベースの重み付け

クラスタリングベースの集約

Chain-of-Thought連鎖の分岐メカニズム

分岐の伝播パターン

よくある質問

Q1: 多数決で同票になった場合はどう処理しますか？

Q2: 中間推論ステップの品質はどう評価できますか？

Q3: 推論パスの数が少なくても多数決は機能しますか？

関連用語