RAG用埋め込みインデックスとは？（アールエージーヨウウメコミインデックス）わかりやすく解説

RAG用埋め込みインデックスは、テキストチャンクのベクトル表現を効率的に格納・検索するためのデータ構造であり、HNSW・IVF・PQ等のアルゴリズムとベクトルDBの選択がRAGの検索速度と精度を決定する。

RAG用埋め込みインデックスとは？（アールエージーヨウウメコミインデックス）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

主要なANNアルゴリズム

RAGで使用される代表的なANNアルゴリズムを比較する。

アルゴリズム	検索速度	メモリ使用量	精度（Recall@10）	インデックス構築速度	動的追加
HNSW	非常に速い	高い	95〜99%	遅い	可能
IVF-Flat	速い	中程度	90〜95%	速い	限定的
IVF-PQ	速い	非常に低い	85〜92%	中程度	限定的
ScaNN	非常に速い

設定	元サイズ	PQサイズ	圧縮率	Recall@10低下
768d, M=8	3,072B	8B	384x	5〜10%
768d, M=16	3,072B	16B	192x	2〜5%
768d, M=32	3,072B	32B	96x	1〜3%
1536d, M=48	6,144B	48B	128x	2〜5%

ベクトルDB	ライセンス	主要アルゴリズム	スケーラビリティ	特徴
Qdrant	Apache-2.0	HNSW	分散クラスタ	Rustで高性能、フィルタリング高速
Pinecone	プロプライエタリ	独自	マネージド	フルマネージド、運用負荷ゼロ
Weaviate	BSD-3	HNSW	分散クラスタ	GraphQL API、ハイブリッド検索内蔵
Milvus	Apache-2.0	IVF/HNSW/DiskANN	分散クラスタ	10億ベクトル級、GPU対応
Chroma	Apache-2.0	HNSW	シングルノード	組み込み可能、開発用途
pgvector	PostgreSQL	HNSW/IVFFlat	PostgreSQL依存	既存PostgreSQLに統合可能