LLMが自信を持って事実と異なる情報を生成する現象を、神経心理学の「作話(confabulation)」から借用した用語。ハルシネーションとほぼ同義だが、モデルが意図的に嘘をついているのではなく構造的に発生する点を強調する。
LLMコンファビュレーション(Confabulation)とは、大規模言語モデルが事実と異なる情報を自信を持って生成する現象を指す用語である。もともと神経心理学で「作話」と呼ばれる症状(記憶障害の患者が記憶の空白を無意識に埋め合わせる現象)から借用された概念で、LLMの振る舞いとの構造的類似性から2023年以降に研究者の間で使用が広まった。「ハルシネーション」とほぼ同義で使用されるが、モデルが意図的に嘘をついているわけではなく、統計的パターンに基づいて最もありそうな続きを生成した結果として発生するという機構的な側面を強調する。
| 用語 | ニュアンス | 使用者 | 含意 |
|---|---|---|---|
| ハルシネーション | 幻覚(存在しないものが見える) | 一般的・業界標準 | モデルが「見ている」かのような比喩 |
| コンファビュレーション | 作話(記憶の空白を埋める) | 研究者・神経科学寄り | 構造的・無意識的な現象 |
| ファブリケーション | 捏造 | ジャーナリズム | 意図的な印象を与えがち |
| グラウンディング失敗 | 接地の失敗 | エンジニアリング | 技術的・解決指向 |
2024年にYann LeCun(Meta Chief AI Scientist)が「ハルシネーションという用語はLLMに知覚(perception)があるかのような誤解を招く。コンファビュレーションの方が正確」と発言し、用語の再考が議論されている。ただし2026年現在、業界標準としてはハルシネーションが依然として主流である。
LLMは次のトークンを予測する確率モデルであり、「正しいか」ではなく「もっともらしいか」で出力を選択する。高確率なトークン列が事実と一致するとは限らない。
トレーニングデータ中で頻出するトピック(英語Wikipedia、Stack Overflow等)では事実性が高いが、低頻度トピック(マイナーな歴史的事実、特定地域のローカル情報)ではコンファビュレーションが発生しやすい。
モデルが学習した統計的パターンに基づいて「ありそうな」情報を生成する。例えば「〇〇大学教授の△△は著書『□□』で…」というパターンに沿って架空の著書名を生成してしまう。
ユーザーの期待や前提に合わせて、事実と異なっていても肯定的な回答を生成する傾向。RLHF(人間フィードバックによる強化学習)の副作用として発生する。
プロンプトに外部コンテキストがない状態で、モデルの内部知識のみに基づいて発生する。
RAG等で外部コンテキストが与えられているにもかかわらず、コンテキストの内容と矛盾する出力を生成する。
同一質問に対してTemperature > 0で複数回生成し、回答間の一致度を測定する。一致度が低い部分はコンファビュレーションの可能性が高い。SelfCheckGPTはこの原理に基づく。
FActScore、SAFE等のベンチマーク手法で、生成テキストをWikipedia等と照合する。
Q1: コンファビュレーションとハルシネーションは実質的に同じですか? A: 現象としてはほぼ同じですが、用語的ニュアンスが異なります。コンファビュレーションは「構造的・無意識的に記憶の空白を埋める」という神経科学的類推を含み、モデルに意図がないことを明確にします。学術文脈ではより正確とされますが、業界標準はハルシネーションです。
Q2: なぜLLMはコンファビュレーションを避けられないのですか? A: LLMは次トークン予測モデルであり、「正しさ」ではなく「もっともらしさ」で出力を選択する構造だからです。事実性の検証機構はモデル内部に組み込まれておらず、外部グラウンディングや検証パイプラインで補完する必要があります。
Q3: コンファビュレーション率が最も低いLLMはどれですか? A: 2026年時点では、推論時間スケーリングを備えたOpenAI o3とAnthropic Claude 4 Opusが最低率です。ただし測定方法やドメインにより結果は変動するため、自社ユースケースでのベンチマークが不可欠です。