概要
OpenAI GPT-4o は 米 OpenAI が2024年5月13日発表した主流マルチモーダル LLM (Omni)。テキスト + 画像 + 音声 + 動画統合 + 主流 業界主流 マルチモーダル + 128K context + Advanced Voice Mode (主流 リアルタイム音声会話)・$5/1M tokens input + $15/1M tokens output・「マルチモーダル LLM 業界主流 + Claude 3.5 Sonnet + Gemini 2.0 Flash 競合」。GPT-4o は2024年5月13日発表 + 2024年9月 Advanced Voice Mode + 2024年12月 Canvas + Sora 統合で、「テキスト + 画像 + 音声 + 動画統合 + Omni (全部) + Advanced Voice Mode」でマルチモーダル LLM 業界主流 + Claude 3.5 Sonnet + Gemini 2.0 Flash 競合。GPT-4o の革新点: ① Omni (全部) 統合 で前世代 GPT-4 (テキスト中心) + GPT-4 Turbo + GPT-4 Vision (画像) + Whisper (音声) と一線画す + 主流 業界主流マルチモーダル + 1 モデルで全部主流対応 + 業界主流マルチモーダル LLM 主流革新 ② Advanced Voice Mode (主流 リアルタイム音声会話・2024年9月) で主流 主流 主流 主流 リアルタイム音声会話 + 主流 主流 主流 自然な会話主流対応 + 業界主流 リアルタイム音声 LLM 主流革新 ③ 128K context で主流 主流 大規模コンテキスト + 主流 主流 主流 主流 文書解析主流対応 ④ $5/$15 主流コスパ で前世代 GPT-4 ($30/$60) 比 -83% 安価 + 業界主流 マルチモーダル LLM 主流コスパ ⑤ GPT-4o mini ($0.15/$0.60) で主流コスパ + 主流 主流 主流 主流 主流 主流 個人開発者 + 中小企業主流対応。OpenAI 系統: ① 2015年 OpenAI 設立 (米 San Francisco・Sam Altman + Elon Musk + 主要連合) ② 2019年 GPT-2 (主流 主流 LLM 主流参入) ③ 2020年 GPT-3 (主流 主流 主流 LLM 主流確立) ④ 2022年 ChatGPT (GPT-3.5・主流 主流 業界主流 LLM 主流革命) ⑤ 2023年 GPT-4 + 2023年 GPT-4 Turbo + 2023年 GPT-4 Vision ⑥ 2024年5月13日 GPT-4o (主流主流マルチモーダル + Omni) ⑦ 2024年7月 GPT-4o mini ($0.15/$0.60・主流コスパ) ⑧ 2024年9月12日 OpenAI o1-preview (推論モデル業界初) ⑨ 2024年12月 ChatGPT Pro $200/月 + Sora + Canvas + Advanced Voice Mode 主流主流統合 ⑩ 2025年5月 GPT-5 (主流 主流 主流主流主流フラグシップ) ⑪ 2026年現在 GPT-5 + GPT-4o + GPT-4o mini 主流継続。: ① ② ③ ④ ⑤ 。
主な特徴・仕組み
- 発表: OpenAI (米 San Francisco・2015年設立)・2024年5月13日
- タイプ: マルチモーダル LLM (Omni・テキスト + 画像 + 音声 + 動画統合)
- コンテキスト: 128K tokens
- マルチモーダル: テキスト + 画像 + 音声 + 動画 (1 モデルで全部主流対応)
- Advanced Voice Mode: 主流 リアルタイム音声会話 (2024年9月)
- 価格: $5/1M tokens input + $15/1M tokens output (前世代 GPT-4 $30/$60 比 -83% 安価)
- 採用: ChatGPT Plus + Pro + Team + Enterprise + OpenAI API + Cursor IDE + Cline + Aider + Windsurf + GitHub Copilot 主流対応
- 対応 OS: ChatGPT App (iOS + Android + macOS + Windows) + Web + 主要全 OS
- 競合: Claude 3.5 Sonnet (Anthropic・$3/$15) + Gemini 2.0 Flash (Google・$0.075/$0.30) + DeepSeek V3 (DeepSeek・$0.27/$1.10) + Mistral Large 2 (Mistral・OSS)
- 派生: GPT-4o mini ($0.15/$0.60・主流コスパ・2024年7月) + GPT-4o Realtime API (主流 主流 リアルタイム音声 API)
- 後継: o1 + o3 + GPT-5 (2025年5月-) + 主流主流主流フラグシップ進化
スペック比較表
| LLM マルチモーダル主流 | 提供 | 公開 | 価格 (input/output) |
|---|
| GPT-4o |