RAG向けチャンキング戦略とは？（アールエージームケチャンキングセンリャク）わかりやすく解説

Agentic Chunking: LLMがドキュメント全体を読解し、意味的な単位を判断してチャンクを生成する。精度が高いが、LLM呼び出しのコストが大きい
Late Chunking: ドキュメント全体をまず長いコンテキストのEmbeddingモデルに通し、その後でチャンク境界を決定する。Jina AIの<code class="bg-muted px-2 py-1 rounded text-responsive-sm font-mono text-secondary-800 border border-secondary-200">jina-embeddings-v2-base-en が対応している
Contextual Chunking: Anthropicが提案した手法で、各チャンクに元ドキュメントの文脈要約を付与することで、チャンク単体でも意味が通るようにする

RAGにおけるチャンキングとは、大規模ドキュメントを検索・取得に適した小さなテキスト断片（チャンク）に分割する処理であり、分割戦略の選択がRAGシステム全体の検索精度と回答品質に直結する。

RAG向けチャンキング戦略とは？（アールエージームケチャンキングセンリャク）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

主要なチャンキング戦略

RAGで使用されるチャンキング戦略は大きく4つに分類される。

戦略	概要	適用場面	メリット	デメリット
固定長分割	文字数・トークン数で機械的に分割	構造が均一なテキスト	実装が単純、予測可能	文脈の途中で分断される
セマンティック分割	意味的な区切りを検出して分割	長文・論文・書籍	意味的一貫性が高い	計算コストが高い
再帰的分割	区切り文字の優先順位に従い段階的に分割	汎用的な文書	バランスが良い	パラメータ調整が必要
ドキュメント構造ベース	HTML/Markdown/PDFの構造を活用	構造化された文書	論理構造を保持	パーサーの品質に依存