LLMトークン課金モデルとは？（エルエルエムトークンカキンモデル）わかりやすく解説

OpenAI・Anthropic・Google・DeepSeek等のLLMプロバイダーが採用するトークン単位の従量課金体系。入力と出力で異なる単価を設定し、バッチAPI割引・プロンプトキャッシュ割引・予約容量契約等の多層的な料金最適化オプションを提供する。

LLMトークン課金モデルとは？（エルエルエムトークンカキンモデル）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

主要プロバイダー料金比較（2026年6月時点）

プロバイダー	モデル	入力$/1M	出力$/1M	キャッシュ入力	バッチ割引
OpenAI	GPT-4o	$2.50	$10.00	$1.25（50%）	50%
OpenAI	GPT-4o mini	$0.15	$0.60	$0.075（50%）	50%
OpenAI	o3	$10.00	$40.00	$5.00（50%）	50%
OpenAI	o3-mini

モデル	月間入力コスト	月間出力コスト	合計	キャッシュ適用後
GPT-4o	$1,250	$2,000	$3,250	$1,625（CR50%）
GPT-4o mini	$75	$120	$195	$97.50
Claude 4 Sonnet	$1,500	$3,000	$4,500	$1,650（CR90%）
Gemini 2.0 Flash	$37.50	$60	$97.50	$48.75
DeepSeek V3	$135	$220	$355	$125（CR74%）