Graph RAG ナレッジグラフ構築とは？（グラフラグナレッジグラフコウチク）わかりやすく解説

Graph RAGにおけるナレッジグラフ構築とは、テキストコーパスからLLMを用いてエンティティ（人物・組織・概念・技術等）とそれらの間の関係を抽出し、ノードとエッジで構成されるグラフ構造として体系化するプロセスである。抽出されたグラフはコミュニティ検出やクエリ時の情報検索の基盤となる。

Graph RAG ナレッジグラフ構築とは？（グラフラグナレッジグラフコウチク）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

グラフスキーマ設計

Graph RAGのグラフスキーマは、ドメインに応じて柔軟に設計する必要がある。Microsoft GraphRAGのデフォルト実装では、型指定のないオープンスキーマを採用しているが、実運用では事前に型体系を定義することで抽出精度が向上する。

エンティティ型	説明	例	用途
PERSON	人物・著者・研究者	Albert Einstein, 田中太郎	人物関係の追跡
ORGANIZATION	企業・研究機関・政府機関	Microsoft, 東京大学	組織間関係の分析
TECHNOLOGY	技術・アルゴリズム・プロトコル	Transformer, TCP/IP	技術関連の知識体系化
CONCEPT	抽象概念・理論・手法	RAG, 機械学習	概念間の関係マッピング
PRODUCT	製品・サービス・ツール

Gleaning回数	再現率向上（目安）	コスト増加	推奨シーン
0回（なし）	ベースライン	1.0x	コスト最優先、大規模コーパス
1回	+15〜25%	2.0x	標準（推奨デフォルト）
2回	+20〜30%	3.0x	高品質が必要な場合
3回以上	+25〜35%（逓減）	4.0x+	極めて重要なドメイン

ストレージ	適用規模	クエリ性能	運用コスト	推奨用途
Parquetファイル	〜10万ノード	低（全件スキャン）	最低	PoC・実験
NetworkX（インメモリ）	〜100万ノード	高	低（メモリ依存）	中規模バッチ処理
Neo4j	〜数十億ノード	高（Cypher最適化）	中〜高	本番運用
Amazon Neptune	〜数十億ノード	高	高（マネージド）	AWSベース本番運用
Azure Cosmos DB Gremlin	〜数十億ノード	中〜高	高（マネージド）	Azureベース本番運用