ベクトルインデックスとは？（ベクトルインデックス）わかりやすく解説

Q: ベクトルインデックスとは？

高速近似最近傍探索データ構造。HNSW(Hierarchical Navigable Small World)・IVF(Inverted File)・IVFPQ・DiskANN(Vamana)・ScaNN(Google)・LSH・Annoy(Spotify)・FAISS(Meta)が代表、Qdrant/Weaviate/Pinecone/Milvus/pgvector実装、recall 95%+@10k-100M規模スケール。

概要

ベクトルインデックスは、テキスト・画像・音声などの高次元ベクトルを高速に近似最近傍探索（ANN）するためのデータ構造である。
検索精度と速度のバランスを調整し、10 k〜100 M規模のデータセットに対して recall 95 % + を実現できる点が特徴。
代表的なアルゴリズムに HNSW、IVF、IVFPQ、DiskANN、ScaNN、LSH、Annoy、FAISS などがある。
実装例としては Qdrant、Weaviate、Pinecone、Milvus、pgvector が挙げられ、各社が独自に最適化を行っている。

主な特徴・仕組み

階層構造：HNSW は多層グラフを構築し、上位レイヤーで粗い探索を行い下位レイヤーで精密化する。
インバーテッドファイル：IVF はクラスターごとにインデックスを分割し、検索時に関連クラスターのみを参照。
量子化：IVFPQ はベクトルを小さなコードブックに量子化し、メモリ使用量を削減。
ディスク最適化：DiskANN は SSD 上での高速検索を実現し、メモリ不足時でも大規模データを扱える。
GPUアクセラレーション：FAISS と ScaNN は CUDA を利用し、GPU での並列計算により検索時間を短縮。

スペック/製品比較表

アルゴリズム	時間計算量	メモリ使用	推奨ハードウェア	主な実装
HNSW	O(log N)	高い	CPU 8コア以上	Qdrant, Milvus
IVF	O(N/K)	中程度	SSD 1 TB	Weaviate, pgvector
IVFPQ

メニュー

ベクトルインデックス（ベクトルインデックス）

メニュー

ベクトルインデックス（ベクトルインデックス）

概要

主な特徴・仕組み

スペック/製品比較表

この用語に関連するコンテンツ

具体例・対応製品

自作PCでの選び方・注意点

関連用語との違い

よくある質問

まとめ

関連用語