知識グラフ(エンティティとリレーションの構造化データ)とLLMを統合し、LLM単体では困難な事実の正確性・推論の透明性・知識の更新性を補完する技術アプローチ。GraphRAGやKGQAなど複数の統合パターンが存在する。
Knowledge Graph × LLM(知識グラフとLLMの統合)は、構造化された知識グラフのデータとLLMの自然言語処理能力を組み合わせることで、両者の弱点を相互に補完する技術体系である。LLMは流暢な文章生成と広範な知識を持つが、事実の正確性(幻覚)と知識の鮮度に課題がある。知識グラフは正確で更新可能な構造化知識を持つが、自然言語での柔軟な応答には不向きである。
LLMのパラメトリック知識(重みに埋め込まれた知識)には3つの根本的な限界がある。第一に、訓練データのカットオフ以降の情報を持たない(知識の鮮度問題)。第二に、事実と異なる情報を自信を持って生成する(ハルシネーション問題)。第三に、推論過程がブラックボックスで検証が困難(説明可能性の欠如)。
知識グラフはエンティティ(実体)とリレーション(関係)をトリプル(主語-述語-目的語)として明示的に格納する。「東京」-「首都_of」-「日本」のように、事実が検証可能な形で構造化されている。Wikidata(約1億エンティティ)、Google Knowledge Graph、企業固有のドメインKGなどが代表例である。
| パターン | 方向 | 主な用途 | 代表手法 |
|---|---|---|---|
| KG → LLM(知識注入) | KGの知識をLLMに注入 | 事実性向上・幻覚抑制 | GraphRAG, KGQA |
| LLM → KG(知識抽出) | LLMでKGを自動構築 | KG構築の自動化 | LLM-based IE |
| KG ↔ LLM(双方向) | 相互に補完 | エンドツーエンドQA | Think-on-Graph |
| KG-enhanced Fine-tuning | 事前学習に知識統合 | 知識密度の向上 | ERNIE, KnowBERT |
MicrosoftのGraphRAGは、RAG(検索拡張生成)にグラフ構造を導入した手法である。従来のベクトルRAGがチャンク単位のフラットな検索を行うのに対し、GraphRAGはテキストからエンティティとリレーションを抽出してコミュニティ構造を検出し、階層的な要約を生成する。「このデータセット全体のテーマは何か」のようなグローバルな質問に対して、従来のRAGでは困難だった包括的な回答を可能にする。
LLMが推論中にKGをナビゲートする手法。質問に対してLLMがKG上の関連エンティティを探索し、推論パスを明示的に辿ることで、回答の根拠を透明化する。
知識グラフの構築と維持にはドメインエキスパートの関与とコストが必要である。小規模なドメインKG(1万-10万トリプル)なら数週間で構築可能だが、Wikidata規模のオープンKGを活用する場合はSPARQLクエリの最適化やエンティティリンキングの精度が課題になる。
A: 質問タイプによります。特定の事実に関する局所的な質問(「Xの仕様は?」)にはベクトルRAGが速くて十分です。データセット全体の傾向やテーマに関するグローバルな質問(「この業界の主要課題は?」)にはGraphRAGが優れています。両者を併用するハイブリッドアプローチが最も効果的です。
A: はい。LLMを使ったエンティティ抽出・リレーション抽出が実用水準に達しています。GPT-4やClaude等のLLMに「このテキストからエンティティとリレーションを抽出せよ」と指示するだけで、従来のNLPパイプライン(固有表現認識→共参照解決→関係抽出)に匹敵する精度が得られます。
A: はい。Neo4jの無料Community Editionとllama.cppなどのローカルLLMを組み合わせれば、個人のナレッジベース構築にも活用できます。LangChainやLlamaIndexにはGraphRAGの実装が含まれており、比較的少ないコードで統合可能です。