LLM APIの課金単位であるトークンに基づく料金体系。入力トークンと出力トークンで異なる単価が設定され、モデルの性能クラスに応じて価格が大きく異なる。1トークンは英語で約4文字、日本語で約1〜2文字に相当する。
LLMトークン課金は、大規模言語モデルAPIの利用料金をトークン数に基づいて計算する課金方式である。ほぼすべてのLLMプロバイダ(OpenAI、Anthropic、Google、Mistral等)がこの方式を採用しており、「入力トークン」と「出力トークン」のそれぞれに対して課金される。
トークンはLLMがテキストを処理する最小単位である。英語では1トークンが約4文字(単語の約75%が1トークン)、日本語では1文字が1〜3トークンに相当する(漢字は2〜3トークン、ひらがな/カタカナは1〜2トークン)。
| 言語 | テキスト例 | トークン数 |
|---|---|---|
| 英語 | "Hello, world!" | 4トークン |
| 英語 | "The quick brown fox" | 4トークン |
| 日本語 | "こんにちは" | 3〜5トークン |
| 日本語 | "自作パソコン" | 4〜7トークン |
| コード | "function hello() {}" | 6トークン |
| モデル | 入力(/1Mトークン) | 出力(/1Mトークン) | 特徴 |
|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | OpenAI主力 |
| GPT-4o mini | $0.15 | $0.60 | 低コスト版 |
| Claude Opus 4 | $15.00 | $75.00 | 最高性能 |
| Claude Sonnet 4 | $3.00 | $15.00 | コスパ良 |
| Claude Haiku 3.5 | $0.80 | $4.00 | 高速低コスト |
| Gemini 1.5 Pro | $1.25〜$5.00 | $5.00〜$10.00 | コンテキスト長大 |
| Gemini 1.5 Flash | $0.075 | $0.30 | 超低コスト |
ほとんどのプロバイダで出力トークンの単価は入力トークンの2〜5倍に設定されている。これはLLMの推論(出力生成)が入力処理より計算コストが高いためである。
コスト構成の典型例:
例: GPT-4oで1,000件の商品説明を生成する場合
同じタスクをClaude Sonnet 4で実行:
| ツール | プロバイダ | 用途 |
|---|---|---|
| tiktoken | OpenAI | Python/JSライブラリ、正確なトークンカウント |
| OpenAI Tokenizer | OpenAI | Webベースの可視化ツール |
| Anthropic Token Counter | Anthropic | API経由のカウント |
| token-count npm | OSS | Node.js用汎用カウンター |
A1: はい。日本語は1文字あたりのトークン数が英語の2〜3倍になるため、同じ文字数の文章でもトークン課金は2〜3倍高くなる。日本語1,000文字は約1,500〜2,500トークンだが、英語1,000文字は約250〜300トークンである。
A2: tiktokenライブラリ(Python/JS)を使えば正確なトークン数を計算できる。概算では「英語: 文字数÷4」「日本語: 文字数×1.5〜2.5」が目安。APIレスポンスにはusageフィールドで実際のトークン数が返されるので、事後検証も可能。
A3: プロバイダにより異なる。OpenAIは新規ユーザーに$5の無料クレジットを提供(有効期限あり)。Google Geminiは無料ティアで1分あたり15リクエストまで利用可能。Anthropicは無料枠なしだがAmazon Bedrockのフリーティアで限定的に利用できる。
| Mistral Large |
| $2.00 |
| $6.00 |
| 欧州発 |