Retrieval-Augmented Context（コンテキスト検索拡張）とは？（リトリーバルオーグメンテッドコンテキスト）わかりやすく解説

Q: Retrieval-Augmented Context（コンテキスト検索拡張）とは？

ロングコンテキストウィンドウの性能評価・活用において、入力コンテキストから特定情報を正確に検索・抽出する技術群。Needle in a Haystack（NIAH）テストで検索精度を評価し、LLMLinguaやAutoCompressorなどのコンテキスト圧縮技術で効率化を図る。RAGとの統合設計パターンも含む。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Retrieval-Augmented Context（コンテキスト検索拡張）とは？（リトリーバルオーグメンテッドコンテキスト）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

コンテキスト内検索の課題

Lost in the Middle 問題

2023年のStanford大学の研究（Liu et al.）により、LLMはコンテキスト内の情報位置によって検索精度が大きく変動することが判明した。

情報の位置	検索精度（GPT-3.5）	検索精度（Claude 2）	検索精度（GPT-4 Turbo）
先頭（Top 10%）	85-95%	90-97%	92-98%
中間（40-60%）	40-60%	55-70%	70-85%
末尾（Bottom 10%）	80-90%	85-95%	90-96%

この「U字型カーブ」はモデルの世代が進むにつれて緩和されているが、2025年時点でも完全には解消されていない。Claude 3.5/4やGemini 2.5 Proなど最新モデルでは大幅に改善されているが、128K以上の超長文では依然として中間部分の精度低下が観察される。

情報密度と検索精度

コンテキスト内の関連情報の密度（signal-to-noise ratio）も検索精度に影響する。

高密度: 関連情報がコンテキストの10%以上を占める → 精度90%以上
中密度: 関連情報が1-10% → 精度70-90%

モデル	コンテキスト長	NIAH精度（全位置平均）	最弱位置
Claude 3.5 Sonnet	200K	99.2%	中間120K付近
Claude 4 Opus	200K	99.7%	ほぼ均一
GPT-4 Turbo	128K	97.8%	中間60-80K
Gemini 1.5 Pro	1M	99.5%	500K以降でやや低下
Gemini 2.5 Pro	1M	99.3%	ほぼ均一
LLaMA 3.1 70B	128K	95.5%	中間40-80K
Mistral Large 2	128K	96.2%	中間50-70K

メニュー

Retrieval-Augmented Context（コンテキスト検索拡張）（リトリーバルオーグメンテッドコンテキスト）

メニュー

Retrieval-Augmented Context（コンテキスト検索拡張）（リトリーバルオーグメンテッドコンテキスト）

この用語に関連するコンテンツ

Retrieval-Augmented Contextとは

コンテキスト内検索の課題

Lost in the Middle 問題

情報密度と検索精度

Needle in a Haystack（NIAH）テスト

テスト設計

主要モデルのNIAH結果（2025年時点）

コンテキスト圧縮技術

LLMLingua / LongLLMLingua

AutoCompressor

ICAE（In-Context Autoencoder）

ハイブリッドRAG + ロングコンテキスト設計

よくある質問（FAQ）

まとめ

関連用語