LLM透かし検出ツールとは、テキストに埋め込まれたLLM透かし(ウォーターマーク)を検出・分析するためのソフトウェアやAPIサービスの総称であり、GPTZero・Originality.ai・SynthID Detectorなどの商用サービスからオープンソース実装まで多様な選択肢がある。
LLM透かし検出ツールは、テキストがAIによって生成されたかどうかを判定するためのソフトウェア群である。透かし方式の検出器(秘密鍵ベース)と統計的AI検出器(透かし非依存)の2種類に大別される。2026年現在、教育機関・出版社・SNSプラットフォーム・法務部門などで広く導入が進んでいる。
LLM生成時に意図的に埋め込まれた透かしを、秘密鍵を用いて検出する方式。
| ツール名 | 提供元 | 対応透かし方式 | 精度 | 料金 |
|---|---|---|---|---|
| SynthID Detector | Google DeepMind | SynthID-Text | 99%+ (200トークン以上) | Gemini API内蔵(追加費用なし) |
| OpenAI Text Classifier | OpenAI | 独自方式(未公開) | 90〜95%(推定) | 未公開(内部テスト中) |
| MarkLLM | オープンソース | KGW/Unigram/Adaptive等 | 方式依存(95〜99%) | 無料 |
| lm-watermarking | オープンソース | KGW | 99%+ (25トークン以上) | 無料 |
| WaterBench | オープンソース | 複数方式ベンチマーク | 評価用 | 無料 |
透かしの有無に関わらず、テキストの統計的特性からAI生成を推定する方式。
| ツール名 | 検出精度(2026年) | 偽陽性率 | 料金 | 特徴 |
|---|---|---|---|---|
| GPTZero | 85〜92% | 5〜8% | 無料(月10,000語)/ Pro $10/月 | 教育機関で最も普及 |
| Originality.ai | 88〜94% | 3〜5% | $14.95/月(50,000語) | コンテンツマーケティング特化 |
| Turnitin AI Detection | 82〜90% | 4〜7% | 機関ライセンス | 既存Turnitinに統合 |
| ZeroGPT | 78〜85% | 8〜12% | 無料 | 簡易チェック用 |
| Copyleaks AI Detector | 86〜93% |
清華大学が開発した包括的なLLM透かしフレームワーク。
KGW方式の元論文公式実装。
| 指標 | 説明 | 理想値 |
|---|---|---|
| TPR(真陽性率) | AI生成テキストを正しくAIと判定する割合 | > 95% |
| FPR(偽陽性率) | 人間のテキストを誤ってAIと判定する割合 | < 1% |
| AUC-ROC | 検出性能の総合指標 | > 0.99 |
| F1スコア | 精度と再現率の調和平均 | > 0.95 |
| 最小検出長 | 信頼性のある検出に必要な最小トークン数 | < 100 |
Q1: 無料で使えるAI検出ツールのおすすめは? A: GPTZero(月10,000語まで無料)が最もバランスが良い。簡易チェックにはZeroGPTも使えるが精度は劣る。技術者向けにはMarkLLM(オープンソース・無料)が最も高機能。
Q2: AI検出ツールの結果は法的証拠として使えるか? A: 2026年時点で、AI検出結果を単独の法的証拠として採用した判例はない。偽陽性率が0%でないため、補強証拠としての位置づけが一般的。教育機関でも検出結果のみを根拠にした処分は推奨されていない。
Q3: 検出ツール間で結果が異なるのはなぜか? A: 各ツールが異なるアルゴリズム(perplexity分析・バースト性検出・エントロピー推定等)を使用しているため。同じテキストでも「AI生成」「人間が執筆」と相反する結果が出ることがある。複数ツールのクロスチェックが推奨される。
| 4〜6% |
| $8.99/月 |
| 多言語対応(30言語+) |