RAFT（Retrieval Augmented Fine-Tuning）とは？（ラフト（リトリーバルオーグメンテッドファインチューニング））わかりやすく解説

Q: RAFT（Retrieval Augmented Fine-Tuning）とは？

RAFT（Retrieval Augmented Fine-Tuning）は、RAGパイプラインにおいてretrieverが返す文書群から必要な情報を正確に抽出する能力をLLMに訓練するファインチューニング手法。ドメイン固有のオープンブック試験を模倣し、正解文書（oracle）と無関係文書（distractor）を混在させた学習データでモデルを鍛えることで、ノイズ耐性と情報抽出精度を同時に向上させる。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

RAFT（Retrieval Augmented Fine-Tuning）とは？（ラフト（リトリーバルオーグメンテッドファインチューニング））意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

RAFTの基本原理

RAFTの核心は「試験勉強のアナロジー」にある。学生が試験勉強をする際、教科書を読みながら重要な箇所にハイライトを引き、無関係な情報を無視する訓練をする。RAFTはこれと同じプロセスをLLMに適用する。

訓練データは以下の3要素で構成される：

要素	説明	役割
質問（Question）	ドメイン固有のQAクエリ	学習の目標設定
Oracle文書（D*）	質問の回答に必要な情報を含む正解文書	正解情報源
Distractor文書（Di）	質問とは無関係だが同ドメインの文書	ノイズ耐性訓練

訓練時には、oracle文書とdistractor文書を混在させたコンテキストをLLMに与え、oracle文書から正確に回答を抽出するよう学習させる。重要なのは、一定割合のサンプルではoracle文書を含めず、distractorのみのコンテキストで回答させることで、LLM自身のパラメトリック知識に頼る能力も維持する点である。

試験勉強アナロジーの詳細

RAFTの設計思想を理解するために、以下の試験勉強アナロジーを詳しく見てみよう。

クローズドブック試験（Closed-Book Exam）：教科書を持ち込めない試験。標準的なSFT（Supervised Fine-Tuning）に相当し、モデルはパラメータに記憶した知識のみで回答する。

オープンブック試験（Open-Book Exam）：教科書の持ち込みが許可される試験。RAGに相当するが、単に教科書を持ち込むだけでは十分ではなく、必要な情報をすばやく見つけ出す技術が必要。

RAFTの学習法：オープンブック試験に特化した勉強法。教科書から関連ページと無関係ページを混在させた模擬問題を繰り返し解くことで、重要な情報を素早く見つけ、無関係な情報に惑わされない力を身につける。

手法	試験タイプ	参照文書	知識源
標準SFT	クローズドブック	なし	パラメトリック知識のみ
RAG	オープンブック（未対策）	retriever出力	コンテキスト依存
DSF（Domain-Specific FT）	クローズドブック	なし	ドメイン記憶
RAFT	オープンブック（対策済）	oracle + distractor	コンテキスト + パラメトリック

パラメータ	推奨範囲	効果
P比率	0.4〜0.8	oracle含有率。高すぎるとパラメトリック知識が退化
Distractor数	3〜5	多いほどノイズ耐性向上、ただし計算コスト増大
CoT長	100〜500トークン	推論過程の詳細度。長すぎると効率低下
学習率	1e-5〜5e-5	標準的なSFTと同等
エポック数	3〜5	過学習に注意

メニュー

RAFT（Retrieval Augmented Fine-Tuning）（ラフト（リトリーバルオーグメンテッドファインチューニング））

メニュー

RAFT（Retrieval Augmented Fine-Tuning）（ラフト（リトリーバルオーグメンテッドファインチューニング））

この用語に関連するコンテンツ

RAFTとは何か

RAFTの基本原理

試験勉強アナロジーの詳細

主要な技術的特徴

Chain-of-Thought回答生成

P比率（Oracle含有率）の制御

Distractor文書の効果

適用シーンと実用例

よくある質問

Q: RAFTとRAGの違いは何ですか？

Q: RAFTの訓練にはどの程度のデータが必要ですか？

Q: RAFTはどのLLMアーキテクチャに適用できますか？

Q: RAFTの訓練コストはどの程度ですか？

関連用語