CAI批評-修正サイクル（Critique-Revision）とは？（シーエーアイヒヒョウシュウセイサイクル）わかりやすく解説

Q: CAI批評-修正サイクル（Critique-Revision）とは？

CAI批評-修正サイクルとは、Constitutional AIの教師あり学習段階において、AIモデルが自身の生成した応答を憲法原則に照らして自己批評（Critique）し、問題点を修正した改善版（Revision）を生成する反復プロセスであり、人間のフィードバックなしに出力品質を段階的に向上させる仕組みである。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

CAI批評-修正サイクル（Critique-Revision）とは？（シーエーアイヒヒョウシュウセイサイクル）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

サイクルの詳細フロー

Phase 1: 初期応答の生成

ベースモデル（Helpful-Only モデル）に red team プロンプトを入力し、潜在的に有害な初期応答を意図的に生成する。

Phase 2: 批評（Critique）

生成された応答に対し、憲法の各原則を適用して批評を行う。批評プロンプトの形式は以下のようになる:

以下の応答を読み、[憲法原則X]の観点から問題点を指摘してください。
問題がない場合は「問題なし」と回答してください。

[応答テキスト]

Phase 3: 修正（Revision）

批評で指摘された問題点を解消するよう、応答を書き直す。修正プロンプトの形式:

以下の批評に基づき、元の応答を修正してください。
有用性を維持しながら、指摘された問題を解決してください。

批評: [批評テキスト]
元の応答: [応答テキスト]

Phase 4: 反復（Iteration）

Phase 2-3 を複数回繰り返すことで、品質を段階的に向上させる。

反復回数と品質の関係

Anthropic の実験データに基づく反復回数と品質の関係:

反復回数	有害性スコア（低い＝良い）	有用性スコア	計算コスト倍率	備考
0回（元の応答）	0.45	0.80

モデルサイズ	批評精度	偽陽性率	偽陰性率
7B パラメータ	62%	28%	10%
13B パラメータ	74%	18%	8%
52B パラメータ	85%	10%	5%
175B+ パラメータ	92%	5%	3%

メニュー

CAI批評-修正サイクル（Critique-Revision）（シーエーアイヒヒョウシュウセイサイクル）

メニュー

CAI批評-修正サイクル（Critique-Revision）（シーエーアイヒヒョウシュウセイサイクル）

この用語に関連するコンテンツ

批評-修正サイクルとは

サイクルの詳細フロー

Phase 1: 初期応答の生成

Phase 2: 批評（Critique）

Phase 3: 修正（Revision）

Phase 4: 反復（Iteration）

反復回数と品質の関係

批評の品質を左右する要因

モデルサイズの影響

Chain-of-Thought 批評

実装上の技術的考慮事項

バッチ処理と並列化

批評プロンプトの設計パターン

RLAIFへの接続

よくある質問（FAQ）

まとめ

関連用語