米 OpenAI 2025年2月発表の推論モデルコスパ。o3 ベース + 主流コスパ + 数学 + コーディング主流・$1.10/1M input + $4.40/1M output・「推論モデルコスパ業界主流」.
OpenAI o3-mini は 米 OpenAI が2025年1月31日発表 + 2025年2月公開した推論モデルコスパ。o3 ベース + 主流コスパ + 数学 + コーディング主流 + Reasoning Effort (low/medium/high) 設定可・$1.10/1M tokens input + $4.40/1M tokens output (o1 $15/$60 比 -93% 安価)・「推論モデルコスパ業界主流 + DeepSeek R1 + Claude 3.7 Sonnet 競合」。o3-mini は2025年1月31日発表 + 2025年2月3日公開で、「o3 ベース + 主流コスパ + 数学 + コーディング主流 + Reasoning Effort 設定可」で推論モデルコスパ業界主流 + DeepSeek R1 + Claude 3.7 Sonnet 競合。o3-mini の革新点: ① 主流コスパ ($1.10/$4.40) でo1 ($15/$60) 比 -93% 安価 + Claude 3.7 Sonnet ($3/$15) 比 -63% 安価 + DeepSeek R1 ($0.55/$2.19) と一線画す主流コスパ + 業界主流コスパ推論モデル主流 ② Reasoning Effort (low/medium/high) 設定可 で主流 主流 推論ステップ調整可 + 主流 主流 主流 主流 主流 タスク主流対応 + 業界主流 LLM 推論ステップ主流革新 ③ AIME 2024 (数学オリンピック) 87.3% (high effort) でo1 (83%) 凌駕 + 業界主流 LLM 数学業界主流性能 ④ Codeforces 2073 ELO (high effort) でo1 (1891 ELO) 凌駕 + 業界主流 LLM コーディング業界主流性能 ⑤ DeepSeek R1 (2025年1月20日発表) 競合対応 で業界主流推論モデル業界主流革命 + 主流 中華 LLM (DeepSeek R1) と一線画す主流 米 LLM 主流対応 + 業界主流 LLM 主流ベンチマーク主流対応。主要採用 (2025年): ① ChatGPT Plus ($20/月) + ChatGPT Pro ($200/月) ② OpenAI API (主流 LLM 主流対応) ③ Cursor IDE + Cline + Aider + Windsurf 主流対応 ④ 主要 主流 LLM ラッパー (LangChain + LlamaIndex) 主流対応 ⑤ GitHub Copilot + 主要 AI コーディング主流対応。
| 推論モデルコスパ主流 | 提供 | 公開 | 価格 (input/output) |
|---|---|---|---|
| OpenAI o3-mini | OpenAI |
| 2025年2月3日 |
| $1.10 / $4.40 |
| OpenAI o1 | OpenAI | 2024年12月 | $15 / $60 |
| Claude 3.7 Sonnet (Extended) | Anthropic | 2025年2月 | $3 / $15 |
| Gemini 2.0 Flash Thinking | 2024年12月 | $0.075 / $0.30 |
| DeepSeek R1 | DeepSeek | 2025年1月20日 | $0.55 / $2.19 |
OpenAI o3-mini は2026年現在 「推論モデルコスパ業界主流 + DeepSeek R1 + Claude 3.7 Sonnet 競合」。重要な歴史: ① 2024年9月12日 OpenAI o1-preview (推論モデル業界初) ② 2024年12月 OpenAI o1 + o3 同時発表 (主流主流主流フラグシップ) ③ 2025年1月20日 DeepSeek R1 発表 (中華 LLM 主流推論モデル革命の起点・業界主流ショック) ④ 2025年1月31日 OpenAI o3-mini 発表 + 2025年2月3日公開 ($1.10/$4.40・主流コスパ・DeepSeek R1 対抗) ⑤ 2025年2月 Claude 3.7 Sonnet (Anthropic・Extended Thinking) ⑥ 2025年4月 OpenAI o4-mini + o3 主流主流主流フラグシップ進化 ⑦ 2026年現在 GPT-5 + o3 + o3-mini 主流継続。重要な貢献: ① 「推論モデルコスパ業界主流」 で**$1.10/$4.40 + o1 ($15/$60) 比 -93% 安価 + Claude 3.7 Sonnet ($3/$15) 比 -63% 安価 + DeepSeek R1 ($0.55/$2.19) と一線画す主流コスパ + 業界主流コスパ推論モデル主流** ② 「Reasoning Effort (low/medium/high) 設定可」 で主流 主流 推論ステップ調整可 + 主流 主流 主流 主流 主流 タスク主流対応 + 業界主流 LLM 推論ステップ主流革新 ③ 「AIME 2024 87.3% + Codeforces 2073 ELO」 でo1 (83% + 1891 ELO) 凌駕 + 業界主流 LLM 数学 + コーディング業界主流性能 + 業界主流 LLM ベンチマーク主流主流位 ④ 「DeepSeek R1 競合対応」 で業界主流推論モデル業界主流革命 + 主流 中華 LLM (DeepSeek R1) と一線画す主流 米 LLM 主流対応 + 業界主流 LLM 主流ベンチマーク主流対応 ⑤ 「ChatGPT Plus + Pro + OpenAI API 主流対応」 で主流 主流 ChatGPT 主流ユーザ主流対応 + Cursor IDE + Cline + Aider + Windsurf 主流対応 + 主要 AI コーディング主流対応。
Q1: o3-mini vs o1? A: o3-mini ($1.10/$4.40・AIME 87.3% + Codeforces 2073 ELO + Reasoning Effort 設定可・主流コスパ) vs o1 ($15/$60・AIME 83% + Codeforces 1891 ELO・主流フラグシップ)。性能 + コスパ ならo3-mini (-93% 安価で o1 凌駕)、Pro Mode + 主流主流フラグシップ ならo1。
Q2: Reasoning Effort (low/medium/high) とは? A: o3-mini 主流革新・主流 主流 推論ステップ調整可・low (主流 主流 主流 速度主流) + medium (主流 主流 バランス) + high (主流 主流 主流 主流 性能主流)・主流 主流 主流 主流 タスク主流対応 + 業界主流 LLM 推論ステップ主流革新。
Q3: DeepSeek R1 競合対応? A: 2025年1月20日 DeepSeek R1 発表 (中華 LLM 主流推論モデル革命の起点・業界主流ショック) → 2025年1月31日 OpenAI o3-mini 発表 + 2025年2月3日公開 ($1.10/$4.40・主流コスパ・DeepSeek R1 対抗) + 業界主流 LLM 主流ベンチマーク主流対応 + 主流 主流 推論モデル業界主流革命。