RAFT vs RAG比較とは？（ラフトバーサスラグヒカク）わかりやすく解説

Q: RAFT vs RAG比較とは？

RAFTとRAG、標準SFT、DSFTの比較分析。RAFTはRAGパイプラインのLLMをファインチューニングしてretriever出力の文書群からの情報抽出を最適化する手法で、推論コストはRAGと同等だが精度が大幅に向上する。各手法の精度、コスト、レイテンシ、運用負荷のトレードオフを詳細に比較する。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

RAFT vs RAG比較とは？（ラフトバーサスラグヒカク）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

比較の背景と目的

LLMをドメイン固有のQAタスクに活用する手法は大きく4つに分類される。RAG（Retrieval-Augmented Generation）、SFT（Supervised Fine-Tuning）、DSFT（Domain-Specific Fine-Tuning）、そしてRAFT（Retrieval Augmented Fine-Tuning）である。各手法には固有の長所と短所があり、ユースケースに応じた適切な選択が重要である。

手法	概要	知識源
RAG	retrieverで文書取得→LLMに渡す	コンテキスト文書
SFT	汎用QAデータでファインチューニング	パラメトリック知識
DSFT	ドメイン固有データでファインチューニング	ドメインパラメトリック知識
RAFT	RAGコンテキストを含むデータでファインチューニング	コンテキスト + パラメトリック

この比較では、論文「RAFT: Adapting Language Model to Domain Specific RAG」の実験結果と、実務での経験を踏まえて各手法の特性を詳細に分析する。

精度比較

ベンチマーク結果サマリー

論文で報告された主要ベンチマークでの性能比較を以下に示す。数値はタスクとモデルにより異なるが、相対的な傾向を表している。

手法	PubMedQA	HotpotQA	ドメイン固有QA	汎用QA
RAG（ベースLLM）	中	中	中	中〜高
SFT	低〜中	低〜中	低	中
DSFT	中	中	中〜高	低〜中
RAFT	高	高

コスト項目	RAG	SFT	DSFT	RAFT
データセット構築	低（文書インデックスのみ）	中（QAペア作成）	中（ドメインQAペア）	高（oracle/distractor割当+CoT生成）
訓練計算コスト	なし	中	中	中〜高（系列長増加分）
Retriever構築	中（Embedding計算）	なし	なし	中（同左）
合計初期コスト	中	中	中	高

コスト項目	RAG	SFT	DSFT	RAFT
推論あたりのAPI/計算コスト	高（retriever + LLM）	低（LLMのみ）	低（LLMのみ）	高（retriever + LLM）
Retrieverインフラ	中（ベクトルDB運用）	なし	なし	中（同左）
文書更新時のコスト	低（インデックス更新）	なし	なし	高（再訓練が必要な場合あり）
モデル更新コスト	なし（ベースLLM変更のみ）	中（再訓練）	中（再訓練）	中〜高（再訓練）

処理段階	RAG	SFT	DSFT	RAFT
Retriever検索	50〜200ms	なし	なし	50〜200ms
コンテキスト構築	10〜50ms	なし	なし	10〜50ms
LLM推論（入力処理）	200〜500ms	100〜200ms	100〜200ms	200〜500ms
LLM推論（出力生成）	500〜2000ms	500〜2000ms	500〜2000ms	800〜3000ms
合計	760〜2750ms	600〜2200ms	600〜2200ms	1060〜3750ms

要件	RAG	SFT	DSFT	RAFT
ベクトルDB	必要	不要	不要	必要
GPU（推論）	必要	必要	必要	必要
GPU（訓練）	不要	必要	必要	必要
文書インデックス管理	必要	不要	不要	必要
モデルバージョン管理	低	中	中	高

シナリオ	RAG	SFT	DSFT	RAFT
新文書の追加	即座（インデックス更新）	不可（再訓練要）	不可（再訓練要）	部分的（インデックス+再訓練推奨）
既存情報の修正	即座（文書差替）	不可	不可	部分的
大規模コーパス更新	中（再インデックス）	高（全再訓練）	高（全再訓練）	高（全再訓練+再インデックス）

ユースケース	推奨手法	理由
プロトタイプ/PoC	RAG	最速で構築可能、初期コスト最低
汎用QAボット	RAG	ドメインが広く、RAFT訓練のROIが低い
ドメイン固有QA（高精度要求）	RAFT	精度が最重要、初期投資の回収が見込める
オフラインQA（retriever不使用）	DSFT	インフラコスト削減、知識更新頻度が低い
リアルタイム応答（低レイテンシ要求）	SFT/DSFT	retrieverなしで最速
頻繁な知識更新	RAG	文書差替のみで対応可能
ハイブリッド（精度+更新性）	RAFT + RAG	定期再訓練 + retriever更新

メニュー

RAFT vs RAG比較（ラフトバーサスラグヒカク）

メニュー

RAFT vs RAG比較（ラフトバーサスラグヒカク）

この用語に関連するコンテンツ

比較の背景と目的

精度比較

ベンチマーク結果サマリー

ドメイン固有タスクでの差異

コスト比較

初期コスト

運用コスト

レイテンシ比較

運用負荷比較

インフラ要件

知識更新の柔軟性

手法選択のガイドライン

ユースケース別推奨手法

意思決定フローチャート

RAFT + RAGのハイブリッド構成

よくある質問

Q: 既にRAGを運用していますが、RAFTに移行すべきですか？

Q: RAFTとRAGを組み合わせる場合、retrieverは変更すべきですか？

Q: RAFTの精度向上は小規模モデルでも得られますか？

Q: RAFTの欠点は何ですか？

関連用語