LLMトークン課金とは？（エルエルエムトークンカキン）わかりやすく解説

LLM APIの課金単位であるトークンに基づく料金体系。入力トークンと出力トークンで異なる単価が設定され、モデルの性能クラスに応じて価格が大きく異なる。1トークンは英語で約4文字、日本語で約1〜2文字に相当する。

LLMトークン課金とは？（エルエルエムトークンカキン）意味・特徴をわかりやすく解説 | 自作.com | PC自作用語集 - 自作.com

トークンとは何か

トークンはLLMがテキストを処理する最小単位である。英語では1トークンが約4文字（単語の約75%が1トークン）、日本語では1文字が1〜3トークンに相当する（漢字は2〜3トークン、ひらがな/カタカナは1〜2トークン）。

モデル	入力（/1Mトークン）	出力（/1Mトークン）	特徴
GPT-4o	$2.50	$10.00	OpenAI主力
GPT-4o mini	$0.15	$0.60	低コスト版
Claude Opus 4	$15.00	$75.00	最高性能
Claude Sonnet 4	$3.00	$15.00	コスパ良
Claude Haiku 3.5	$0.80	$4.00	高速低コスト
Gemini 1.5 Pro	$1.25〜$5.00	$5.00〜$10.00	コンテキスト長大
Gemini 1.5 Flash	$0.075	$0.30	超低コスト

ほとんどのプロバイダで出力トークンの単価は入力トークンの2〜5倍に設定されている。これはLLMの推論（出力生成）が入力処理より計算コストが高いためである。

コスト構成の典型例:

例: GPT-4oで1,000件の商品説明を生成する場合

同じタスクをClaude Sonnet 4で実行:

A1: はい。日本語は1文字あたりのトークン数が英語の2〜3倍になるため、同じ文字数の文章でもトークン課金は2〜3倍高くなる。日本語1,000文字は約1,500〜2,500トークンだが、英語1,000文字は約250〜300トークンである。

A2: tiktokenライブラリ（Python/JS）を使えば正確なトークン数を計算できる。概算では「英語: 文字数÷4」「日本語: 文字数×1.5〜2.5」が目安。APIレスポンスにはusageフィールドで実際のトークン数が返されるので、事後検証も可能。

A3: プロバイダにより異なる。OpenAIは新規ユーザーに$5の無料クレジットを提供（有効期限あり）。Google Geminiは無料ティアで1分あたり15リクエストまで利用可能。Anthropicは無料枠なしだがAmazon Bedrockのフリーティアで限定的に利用できる。