Universal Self-Consistency（USCoT）とは？（ユニバーサルセルフコンシステンシー）わかりやすく解説

Q: Universal Self-Consistency（USCoT）とは？

Universal Self-Consistency（USCoT）とは、Self-Consistency手法を自由形式（open-ended）タスクに拡張する手法であり、Chen et al.（2023）の "Universal Self-Consistency for Large Language Model Generation" で提案された。従来のSelf-Consistencyは多肢選択や数値回答など離散的な回答空間を前提としていたが、USCoTはLLM自身に複数の候補回答の一貫性を判定させることで、要約・翻訳・コード生成などの自由形式タスクにもSelf-Consistencyを適用可能にした。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Universal Self-Consistency（USCoT）とは？（ユニバーサルセルフコンシステンシー）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

USCoTのアルゴリズム

USCoTの核心は、多数決の代わりにLLM自身に「複数の候補回答の中で最も一貫性のある回答はどれか」を判定させるメタ推論ステップを導入する点にある。

アルゴリズム詳細

入力: 質問Q、few-shot CoTプロンプトP、サンプル数n、温度T
1. サンプリング: for i = 1 to n:
     (reasoning_i, answer_i) = LLM(P + Q, temperature=T)
2. 一貫性判定プロンプト構築:
     judge_prompt = "以下のn個の回答を比較し、最も一貫性のある
     （多くの回答と整合する）回答を選択してください。
     回答1: {answer_1}
     回答2: {answer_2}
     ...
     回答n: {answer_n}
     最も一貫性のある回答の番号: "
3. 一貫性判定: selected = LLM(judge_prompt, temperature=0)
4. return answer_{selected}

従来のSelf-Consistencyとの比較

特性	標準Self-Consistency	Universal Self-Consistency
集約方式	完全一致の多数決	LLMによる一貫性判定
対象タスク	離散的回答（数値・選択肢）	任意のタスク（自由形式含む）
意味的等価性	考慮しない	LLMが判断
追加LLM呼び出し	不要	1回（判定ステップ）

ベンチマーク	タスク	標準CoT	Self-Consistency（多数決）	USCoT	改善幅
HumanEval	コード生成	67.0%	71.3%（構文一致）	76.8%	+9.8%
MBPP	コード生成	52.1%	55.4%（構文一致）	61.2%	+9.1%
CodeContests	競プロ	8.2%	9.1%（出力一致）	12.4%	+4.2%

データセット	標準CoT（ROUGE-L）	USCoT（ROUGE-L）	改善幅
CNN/DailyMail	34.2	37.8	+3.6
XSum	28.1	31.5	+3.4
SAMSum	41.3	44.7	+3.4

以下の{n}個の回答候補を比較してください。
他の回答と最も内容が一致している回答の番号を選んでください。

回答1: {answer_1}
回答2: {answer_2}
...

最も一貫性のある回答番号:

パターン	HumanEval精度	判定の安定性	追加コスト
直接選択型	76.8%	中	1回呼び出し
ペアワイズ比較型	78.2%	高	n(n-1)/2回
グループ化型	77.5%	中〜高	1〜2回呼び出し

メニュー

Universal Self-Consistency（USCoT）（ユニバーサルセルフコンシステンシー）

メニュー

Universal Self-Consistency（USCoT）（ユニバーサルセルフコンシステンシー）

この用語に関連するコンテンツ

Universal Self-Consistency（USCoT）の背景

USCoTのアルゴリズム

アルゴリズム詳細

従来のSelf-Consistencyとの比較

自由形式タスクへの適用

コード生成

要約タスク

翻訳タスク

数学的推論（拡張）

一貫性判定プロンプトの設計

パターン1: 直接選択型

パターン2: ペアワイズ比較型

パターン3: グループ化型

判定プロンプトの性能比較

Chen et al.（2023）の主要知見

実装上の考慮事項

コンテキスト長の制約

判定の再現性

コスト構造

よくある質問

Q1: USCoTと標準Self-Consistencyのどちらを使うべきですか？

Q2: 一貫性判定にサンプリングと異なるモデルを使用できますか？

Q3: USCoTはストリーミング出力と互換性がありますか？

Q4: コンテキスト長が不足する場合の回避策はありますか？

関連用語