OpenAI API料金完全ガイド【2026年最新】
更新日: 2026年2月27日
「APIを使い始めたら思ったより請求が高かった」「ChatGPT Plusに加入しているのにAPIでも課金された」「モデルを変えたら精度は上がったが利益が消えた」。この3つは、2026年でも非常によく起きる失敗です。
原因はシンプルで、課金ポイントが複数レイヤーに分かれているからです。モデルの入力・出力トークン単価だけ見ていると、Web Search、File Search、Containersの課金で見積もりが崩れます。
この記事では、実務でそのまま使えるように次の順番で整理します。
- 何に課金されるのかを1枚で理解する
- 2026年2月時点の公式料金を実務向けに読む
- 失敗しない見積もり式をテンプレ化する
- コスト最適化の運用ルールを導入する
- Responses API移行まで見据えて設計する
目次
1. まず結論: 料金で失敗しないチームの共通点
運用で勝つチームは、モデルの議論より先に課金の設計図を作ります。具体的には次の3点です。
- 見積もりを先に作る
1ユーザーあたりの会話数、1会話あたりの入出力トークン、ツール利用率を先に固定します。 - モデルを1つに固定しない
高性能モデルは最終回答のような価値の高い箇所だけに使います。 - ツール呼び出しを野放しにしない
「条件を満たすときのみ呼ぶ」「1リクエストの上限回数」を実装で制御します。
2. 課金の全体像: どこでお金が発生するか
OpenAI APIの請求は、実務上次の4層で見ると整理しやすいです。
- モデル入力トークン課金
- モデル出力トークン課金
- ツール呼び出し課金(Web Search / File Search Tool Call)
- 保存・実行環境課金(File Search Storage / Containers)
この4層を切り分けないと、請求理由が追えません。特に、モデル単価だけ見ているのに、実際はツール課金が主因だったという失敗は頻出です。
3. 最重要の誤解: ChatGPTプランとAPI課金は別
OpenAIのヘルプ情報では、ChatGPT Plusは月額サブスクであり、API利用料は別請求であることが明確です。
現場で起きやすい誤解は次の3つです。
- 「Plusに入っていればAPIも使える」
- 「ChatGPTのモデル名とAPI単価は同じ」
- 「ChatGPTの仕様変更はAPIにも同時適用される」
社内説明では、次の一文をそのまま使うと伝わりやすいです。
「ChatGPTの月額費は利用者の席代、API費はプロダクトの実行コスト」
4. 2026年2月時点の公式料金を実務向けに読む
代表単価(1M tokensあたり)
| モデル | Input | Cached input | Output |
|---|---|---|---|
| GPT-5.2 | $1.75 | $0.175 | $14.00 |
| GPT-5.2 pro | $21.00 | なし | $168.00 |
| GPT-5 mini | $0.25 | $0.025 | $2.00 |
ツール課金で見落としやすい項目
- File Search Storage: $0.10 / GB / 日(最初の1GB無料)
- File Search Tool Call(Responses API): $2.50 / 1,000 calls
- Web Search Tool Call: $10 / 1,000 calls(条件により別枠あり)
Containers課金変更(重要)
2026年3月31日開始で、Containersは20分セッション単位課金へ移行予定です。見積もり式を旧仕様のままにすると、翌月以降に誤差が出ます。
5. 失敗しない見積もり式(そのまま使えるテンプレ)
月次見積もりは次の式で統一してください。
Monthly Cost = Token Cost + Tool Cost + Storage Cost + Session Cost Token Cost = (Input Tokens / 1,000,000 * Input Unit Price) + (Output Tokens / 1,000,000 * Output Unit Price)
スプレッドシートには、最低限次の列を持たせます。
- 機能名
- 利用モデル
- 月間リクエスト数
- 平均Input tokens
- 平均Output tokens
- Web Search呼び出し率
- File Search呼び出し率
- 保存容量(GB)
- Containersセッション数(20分単位)
- 月次見積もり合計
計算例A: FAQチャット(軽量)
- モデル: GPT-5 mini
- 月間 30,000リクエスト
- 平均 Input 900 / Output 280 tokens
- ツールなし
Input: 30,000 * 900 = 27,000,000 tokens Output: 30,000 * 280 = 8,400,000 tokens Input cost: 27 * 0.25 = $6.75 Output cost: 8.4 * 2.00 = $16.80 合計: $23.55 / 月
計算例B: 調査エージェント(Web Searchあり)
- モデル: GPT-5.2
- 月間 8,000リクエスト
- 平均 Input 2,500 / Output 1,100 tokens
- Web Search 1回/リクエスト
Token subtotal: $158.2 Web Search tool call: 8,000回 = $80 暫定合計: $238.2 + 検索コンテンツトークン
計算例C: ドキュメント検索(File Searchあり)
- 保存容量 15GB(無料1GB除外で14GB課金)
- Storage: 14 * 0.10 = $1.4/日 → 約$42/月
- Tool Call 40,000回なら $100/月
つまり、検索系は「保存」と「呼び出し」の二重管理が必要です。
6. コストを跳ね上げる7つの落とし穴
- 出力トークン上限を設定していない
Output単価の高いモデルでは致命傷になります。 - 高性能モデルを全工程に使っている
分類・整形・下書きにも高額モデルを使う設計は非効率です。 - Web Searchの発火条件が曖昧
不要な検索でtool callが積み上がります。 - File Searchの保管期限がない
日次課金が静かに増え続けます。 - リトライ設計が乱暴
429時の連打で無駄トークンが増えます。 - キャッシュ対象の設計がない
同一コンテキストを毎回フル送信してしまいます。 - 月次上限アラートがない
気づいた時には締め日、が最悪パターンです。
7. すぐ効くコスト最適化10選(2026年版)
- モデルルーティングを導入する
- 出力長を制御する
- Batch APIを使える処理はバッチ化する
- Prompt Cachingを前提にプロンプト設計する
- 検索ツール発火条件を厳格化する
- File Searchのライフサイクル管理を実装する
- Containers実行時間を20分単位で最適化する
- 品質指標を「コスト込み」で評価する
- 日次監視 + 週次チューニングを固定運用する
- 機能追加時にコスト増分見積もりを必須化する
8. Responses API移行を前提に設計する
OpenAIの公開情報では、Responses APIが新しい中心です。Assistants APIは2025年8月26日に非推奨化が示され、2026年8月26日頃のサンセット目標が案内されています。既存システムは段階移行を前提に設計してください。
推奨アクション:
- 新規機能はResponses APIで実装する
- 既存機能は「コスト影響が大きい順」に移行する
- 移行前後で比較できるログ指標を統一する
- A/Bで品質・応答時間・コストを同時検証する
9. 60日で実行する運用ロードマップ
Day 1-14: 現状把握と見積もり固定
- 直近30日の利用ログを集計
- 機能別にトークン/ツールを分解
- 月次上限予算を設定
- 見積もりシートと責任者を確定
Day 15-35: 最適化施策投入
- モデルルーティングを導入
- 出力長制御を導入
- 検索発火条件を明文化
- File Search保持期限を実装
- Batch API候補を切り出し
Day 36-60: 移行と定着
- 新規機能をResponses APIへ統一
- 高コスト機能を段階移行
- 月次レビュー会を運用に固定
- Assistants脱却の期限計画を確定
10. まとめ
APIコストは、節約テクニックだけでは安定しません。本当に効くのは次の順番です。
- 課金構造を分解する
- 見積もり式を先に固定する
- モデルとツールの役割を分業する
- Responses中心の将来設計に寄せる
この順番で進めると、「品質を上げると赤字になる」状態から抜けられます。2026年はモデル性能だけでなく、運用設計の差が成果の差になります。