RAGリランキングとは？（アールエージーリランキング）わかりやすく解説

RAGリランキングは、初期検索（ベクトル検索やBM25）で取得した候補チャンクを、Cross-EncoderやColBERT等のより精密なモデルで再スコアリングし、上位に並べ替えることで検索精度を大幅に向上させる手法である。

RAGリランキングとは？（アールエージーリランキング）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

リランキングが必要な理由

初期検索の手法にはそれぞれ固有の限界がある。

初期検索手法	限界
ベクトル検索（Bi-Encoder）	クエリとドキュメントを独立にエンコードするため、細かい相互作用を捉えられない
BM25（キーワード検索）	語彙の一致に依存し、同義語や言い換えに弱い
ハイブリッド検索	2つのスコアのマージ比率が固定で、クエリの種類に適応しない

リランカーはクエリとドキュメントのペアを同時に処理するため、単語間の細かい相互作用や文脈的な関連性を正確に捉えることができる。実験的に、リランキングの追加によりMRR（Mean Reciprocal Rank）が15〜30%向上することが報告されている。

Cross-Encoderは、クエリとドキュメントを連結して1つの入力としてTransformerモデルに通し、関連性スコアを直接出力するモデルである。代表的なモデルとして以下がある。

モデル	パラメータ数	特徴
ms-marco-MiniLM-L-12-v2	33M	軽量・高速、入門用に最適
bge-reranker-v2-m3	568M

項目	Cross-Encoder	ColBERT	LLM-as-Judge
精度	高い	高い	最も高い
速度	中程度	速い	非常に遅い
コスト	低い（ローカル実行可）	低い	高い（API課金）
カスタマイズ性	ファインチューニング可	ファインチューニング可	プロンプト調整のみ
マルチモーダル	テキストのみ	テキストのみ	画像・テーブル対応