Graph RAG コミュニティ検出とは？（グラフラグコミュニティケンシュツ）わかりやすく解説

Q: Graph RAG コミュニティ検出とは？

Graph RAGにおけるコミュニティ検出とは、構築されたナレッジグラフに対してLeidenアルゴリズムを適用し、密に接続されたノード群（コミュニティ）を自動的に同定するプロセスである。検出されたコミュニティに対して階層的なサマリが生成され、Global Searchの基盤となる。

メインコンテンツへスキップナビゲーションへスキップ検索へスキップフッターへスキップ

Graph RAG コミュニティ検出とは？（グラフラグコミュニティケンシュツ）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

Leidenアルゴリズムの詳細

アルゴリズムの背景

Leidenアルゴリズムは、2019年にV.A. Traag, L. Waltman, N.J. van Eckによって提案されたグラフクラスタリングアルゴリズムである。Louvainアルゴリズムの後継として設計され、Louvainが生成する可能性のある「不正に接続されたコミュニティ（badly connected communities）」の問題を解決している。

名前はオランダのライデン大学に由来し、ネットワーク科学分野で最も広く使用されるコミュニティ検出アルゴリズムの一つである。

アルゴリズムの動作原理

Leidenアルゴリズムは、以下の3フェーズを反復的に実行する。

フェーズ	処理内容	目的
ローカル移動	各ノードを隣接コミュニティに試行移動し、モジュラリティ利得が最大のコミュニティに割り当てる	初期コミュニティの形成
リファインメント	コミュニティ内のノードをサブパーティションに分割し、接続性を改善する	Louvainの欠陥回避
集約	コミュニティをスーパーノードに圧縮し、新しい縮小グラフを生成する	次の反復への入力

この3フェーズを収束（コミュニティ割り当てが変化しなくなる）まで繰り返すことで、最終的なコミュニティ分割が得られる。

モジュラリティの数学的定義

Leidenアルゴリズムが最適化するモジュラリティQは以下の式で定義される。

Q = (1/2m) × Σ[Aij - (ki × kj)/(2m)] × δ(ci, cj)

ここで、Aijは隣接行列の要素、ki はノードiの次数、mはグラフのエッジ総数、ci はノードiが属するコミュニティ、δはクロネッカーのデルタ関数（同じコミュニティなら1、異なれば0）である。モジュラリティ値は-0.5〜1.0の範囲を取り、値が高いほどコミュニティ構造が明確であることを示す。

解像度γ	コミュニティサイズ	コミュニティ数	用途
0.1〜0.5	大（粗粒度）	少	全体テーマの把握
1.0（デフォルト）	中	中	標準的な分析
2.0〜5.0	小（細粒度）	多	詳細トピック分析
10.0以上	極小	極多	マイクロトピック

比較項目	Louvain	Leiden
接続性保証	なし（不正接続コミュニティが発生しうる）	あり（リファインメントフェーズで保証）
計算速度	O(n log n)	O(n log n)（同等、実測では高速）
解の安定性	低（実行ごとに異なりやすい）	高（リファインメントで安定化）
階層構造	生成可能だが品質にばらつき	高品質な階層構造を安定生成
実装成熟度	多数のライブラリで利用可能	igraph、leidenalg等で利用可能

要素	説明	用途
タイトル	コミュニティの主題を簡潔に表現	検索時のプレビュー
概要	コミュニティ全体の要約（200〜500語）	Global Searchのコンテキスト
主要エンティティ	コミュニティ内の中心的なエンティティリスト	Local Searchとの連携
主要関係	重要な関係のリスト	構造的理解の支援
インパクト評価	コミュニティの重要度スコア	検索結果のランキング

最適化手法	効果	実装難易度	推奨シーン
解像度パラメータ調整	コミュニティ粒度の最適化	低	全プロジェクト
並列サマリ生成	処理時間の短縮	中	大規模コーパス
サマリキャッシング	再計算コスト削減	低	反復実験
増分コミュニティ更新	更新時の再計算削減	高	頻繁な更新
多段階解像度	検索精度の向上	中	本番運用

メニュー

Graph RAG コミュニティ検出（グラフラグコミュニティケンシュツ）

メニュー

Graph RAG コミュニティ検出（グラフラグコミュニティケンシュツ）

この用語に関連するコンテンツ

コミュニティ検出の概要

Leidenアルゴリズムの詳細

アルゴリズムの背景

アルゴリズムの動作原理

モジュラリティの数学的定義

解像度パラメータ

Louvainアルゴリズムとの比較

階層的サマリ生成

サマリ生成プロセス

サマリの構造

階層レベル間の関係

Graph RAGにおけるコミュニティの役割

知識の圧縮

トピック構造の可視化

クエリルーティング

パフォーマンス最適化

よくある質問（FAQ）

Q1: Leidenアルゴリズム以外のコミュニティ検出手法は使えますか？

Q2: コミュニティサマリの品質をどう評価すればよいですか？

Q3: コミュニティ数が多すぎる・少なすぎる場合はどう調整しますか？

関連用語