生成するテキストの各主張に対して情報源を自動的に紐づける機能を持つ言語モデル。通常のLLMが「何を言うか」に最適化されるのに対し、Attributed LMは「何を言い、その根拠は何か」を同時に出力する設計となっている。
Attributed Language Model(帰属付き言語モデル)は、テキスト生成と同時に各主張の情報源(Attribution)を出力する言語モデルアーキテクチャである。2023年にGoogle Researchが発表した論文「Attributed Question Answering: Evaluation and Modeling for Attributed Large Language Models」で体系化された概念で、LLMの信頼性向上における重要な研究方向となっている。
| 特性 | 通常のLLM | Attributed LM |
|---|---|---|
| 出力 | テキストのみ | テキスト + ソース参照 |
| 学習目標 | 次トークン予測 | 次トークン予測 + ソース選択 |
| ハルシネーション | 検出困難 | ソース照合で検出可能 |
| 推論コスト | 1パス | 1パス〜2パス(方式による) |
| 学習データ | テキストコーパス | テキスト + メタデータ(出典情報) |
最も実用的なアプローチ。外部知識ベースから関連ドキュメントを検索し、そのコンテキストとともに回答を生成する。検索されたドキュメントが自動的にAttributionとなる。
代表的な実装:
まず通常のLLMで回答を生成し、次に別のモジュールが各文に対応するソースを検索して紐づける。生成品質への影響が最小だが、帰属の正確性は2段目のモジュール性能に依存。
代表的な実装:
テキストとAttributionを単一のデコーディングプロセスで同時に生成する。特殊トークン(例: <cite>source_id</cite>)を語彙に追加し、学習データにソース参照を埋め込んで学習する。
研究段階の実装が多いが、以下の利点がある:
Google Research が提案した基本指標。生成された各文が、付与されたソースによって「帰属可能」かどうかを人手または自動評価する。
判定基準:
AISの人手評価を自動化したもの。NLIモデル(TRUE、T5-XXL-NLI等)を使用し、文とソースの含意関係を自動判定する。人手評価との相関は0.82〜0.90(タスク依存)。
Stanford NLP が開発した包括的評価フレームワーク。Citation Precision、Citation Recall に加え、回答品質(Fluency、Correctness)も同時に評価する。3つのデータセット(ASQA、QAMPARI、ELI5)で標準化されたベンチマークを提供。
全てのソースを等価に扱うと、低品質なWebページが一次情報と同列に引用される。ソースの信頼性スコア(ドメイン権威性、発行日、著者情報)で重み付けするフィルタリングが実用上必須。
A1: 完全には防げない。ソースの内容を曲解して引用する「Misattribution」や、ソース自体が誤っている場合には対応できない。ただし、検証可能性を提供することで、ユーザーが誤りを発見・修正するコストを大幅に下げる効果がある。
A2: 方式による。Retrieve-then-Generate型は検索コスト(50〜200ms)が追加される。Generate-then-Attribute型は後処理でNLIモデルを回答文数×ソース候補数だけ実行するため、回答が長いほどコスト増。Joint Generation型は追加コストがほぼゼロだが、学習コストが高い。
A3: RAGパイプライン + チャンクメタデータの整備が最短経路。社内ドキュメントをチャンク分割しベクトルDBに格納する際、各チャンクにソースファイル名・セクション名・更新日を付与する。LLMへのプロンプトで引用フォーマットを指定すれば、最低限のAttributed LMが構築可能。