主要LLM API料金比較(2026年Q1)。Claude Opus 4.7 $15/$75 (in/out M tok)・Sonnet 4.6 $3/$15・Haiku 4.5 $0.25/$1.25・GPT-5 Pro $30/$60・o3 Pro $20/$80・Gemini 2.5 Pro $3.5/$10.5・DeepSeek V3 $0.27/$1.10・Grok 4 $3/$15・Prompt Caching 90%削減・Batch API 50%割引対応、長時間対話+Agent運用コスト比較必須。
LLM APIトークン単価は、入力トークン(prompt)と出力トークン(completion)で別々に課金される。2026年Q1の主要サービスは、Claude Opus 4.7、Sonnet 4.6、Haiku 4.5、GPT‑5 Pro、o3 Pro、Gemini 2.5 Pro、DeepSeek V3、Grok 4 で構成され、単価は $15/$75 から $0.25/$1.25 まで幅広い。さらに、Prompt Caching が 90 % コスト削減、Batch API が 50 % 割引を提供している。
| サービス | 入力単価 ($/Mトークン) | 出力単価 ($/Mトークン) | キャッシュ削減 | バッチ割引 |
|---|---|---|---|---|
| Claude Opus 4.7 | 15 | 75 | 90 % | 50 % |
| Sonnet 4.6 | 3 | 15 | 90 % | 50 % |
| Haiku 4.5 | 0.25 | 1.25 | 90 % | 50 % |
| GPT‑5 Pro | 30 | 60 | 90 % | 50 % |
| o3 Pro | 20 | 80 | 90 % | 50 % |
| Gemini 2.5 Pro | 3.5 | 10.5 | 90 % | 50 % |
| DeepSeek V3 | 0.27 | 1.10 | 90 % | 50 % |
| Grok 4 | 3 | 15 | 90 % | 50 % |
Q1. 1 M トークンの料金は固定ですか?
A1. ほとんどのサービスで固定料金ですが、長時間対話時に割引が適用される場合があります。
Q2. Prompt Caching はどのサービスで利用できますか?
A2. Claude Opus 4.7、Sonnet 4.6、Haiku 4.5、GPT‑5 Pro、o3 Pro、Gemini 2.5 Pro、DeepSeek V3、Grok 4 全てで 90 % 割引が適用可能です。
Q3. Batch API を使うとレートリミットはどう変わりますか?
A3. 50 % 割引と同時に、1 秒あたりのリクエスト数が 2 倍になるケースが多いです。
2026年Q1の主要 LLM API は、入力単価が $0.25 から $30 まで、出力単価が $1.25 から $80 まで幅広い。Prompt Caching と Batch API を組み合わせることで、長時間対話やエージェント運用のコストを大幅に削減できる。自作PC で構築する際は、予算、トークン数、レートリミットを総合的に評価し、最適なサービスを選択することが重要です。