GraphRAGの軽量・高速版として2024年に提案されたRAG手法。文書からキーワードと関係を抽出してグラフを構築するが、GraphRAGのコミュニティ検出・階層要約を省略し、構築コストを1/10に抑えつつマルチホップ検索と高速なインクリメンタル更新を実現する。
LightRAGは、GraphRAGの構築コストと更新困難性を解決するために2024年に提案された軽量グラフベースRAGフレームワークである。HKUST(香港科技大学)のZirui Guo et al.が論文「LightRAG: Simple and Fast Retrieval-Augmented Generation」で発表し、GitHubリポジトリ(HKUDS/LightRAG)で公開している。GraphRAGがコーパス全体をコミュニティに分割して階層要約を生成する重厚なアプローチなのに対し、LightRAGはキーワードベースのデュアルレベル検索で同等以上の精度を1/10のコストで実現する。
| 項目 | GraphRAG | LightRAG |
|---|---|---|
| エンティティ抽出 | ○ | ○ |
| リレーション抽出 | ○ | ○ |
| コミュニティ検出 | ○(Leiden) | × |
| 階層要約 | ○ | × |
| キーワード抽出 | × | ○(高レベル概念) |
| 検索方式 | ローカル/グローバル | ローカル/グローバル/ハイブリッド |
| インクリメンタル更新 | △(困難) | ○(ネイティブ対応) |
| 構築コスト(1Kページ) | $5〜20 | $0.5〜2 |
| 検索レイテンシ | 1〜3秒 | 0.5〜1.5秒 |
pip install lightrag[ollama](またはopenai/lmstudioバックエンド)insert()メソッドで差分インデクシングLM Studio(192.168.1.200:1234)でローカルLLM(Qwen3-8B等)を使えばAPI費用ゼロで運用可能。
LightRAGはGraphRAGの「精度を維持しつつコストを下げる」最適化版という位置づけ。GraphRAGが学術的な完全性を追求するのに対し、LightRAGは実務での「十分な精度を低コストで」を目指す。ベクトルRAGからのステップアップとして、GraphRAGより導入ハードルが低い。HyDE・CRAGとは検索対象が異なり(チャンク vs グラフ)、組み合わせて使うことも可能(例: LightRAGのグラフ検索結果をCRAGで品質評価)。
Q1: LightRAGはローカルLLMだけで動かせる? A: 動かせる。Ollama経由でLlama 3-8B、LM Studio経由でQwen3-8B/Gemma 4等を使えばAPI費用ゼロで運用可能。ただしエンティティ抽出精度は大型モデルに劣るため、初期インデクシングだけGPT-4oを使い、検索時はローカルLLMという構成も有効。
Q2: 既存のベクトルRAGからLightRAGへの移行は大変? A: 文書コーパスが同じなら、LightRAGのインデクシングを追加実行するだけ。ベクトルRAGを残しつつLightRAGを併用し、クエリの種類に応じて使い分ける構成が推奨。段階的な移行が可能。
Q3: GraphRAGとLightRAGを同じコーパスで併用するメリットはある? A: ある。ローカルクエリ(具体的な事実検索)はLightRAGの方が高速・低コスト。グローバルクエリ(コーパス全体の要約・傾向分析)はGraphRAGのコミュニティ要約が優れる。クエリの種類で自動ルーティングするハイブリッド構成が理想的。