ChatGPT

OpenAI API料金完全ガイド【2026年最新】

2026年2月27日 10分で読める AQUA合同会社
OpenAI API料金完全ガイド【2026年最新】

OpenAI API料金完全ガイド【2026年最新】

更新日: 2026年2月27日

2026年最新版 OpenAI API料金を 正しく見積もる トークン・ツール・移行まで一気に整理

「APIを使い始めたら思ったより請求が高かった」「ChatGPT Plusに加入しているのにAPIでも課金された」「モデルを変えたら精度は上がったが利益が消えた」。この3つは、2026年でも非常によく起きる失敗です。

原因はシンプルで、課金ポイントが複数レイヤーに分かれているからです。モデルの入力・出力トークン単価だけ見ていると、Web Search、File Search、Containersの課金で見積もりが崩れます。

この記事では、実務でそのまま使えるように次の順番で整理します。

  • 何に課金されるのかを1枚で理解する
  • 2026年2月時点の公式料金を実務向けに読む
  • 失敗しない見積もり式をテンプレ化する
  • コスト最適化の運用ルールを導入する
  • Responses API移行まで見据えて設計する

目次

  1. まず結論: 料金で失敗しないチームの共通点
  2. 課金の全体像: どこでお金が発生するか
  3. 最重要の誤解: ChatGPTプランとAPI課金は別
  4. 2026年2月時点の公式料金を実務向けに読む
  5. 失敗しない見積もり式(テンプレ付き)
  6. コストを跳ね上げる7つの落とし穴
  7. すぐ効くコスト最適化10選
  8. Responses API移行を前提に設計する
  9. 60日で実行する運用ロードマップ
  10. まとめ

参考ソース

1. まず結論: 料金で失敗しないチームの共通点

1. 見積もり先行 実装前に課金式を固定 2. モデル分業 高額モデルを限定使用 3. ツール管理 検索/保存/実行回数を制御

運用で勝つチームは、モデルの議論より先に課金の設計図を作ります。具体的には次の3点です。

  1. 見積もりを先に作る
    1ユーザーあたりの会話数、1会話あたりの入出力トークン、ツール利用率を先に固定します。
  2. モデルを1つに固定しない
    高性能モデルは最終回答のような価値の高い箇所だけに使います。
  3. ツール呼び出しを野放しにしない
    「条件を満たすときのみ呼ぶ」「1リクエストの上限回数」を実装で制御します。

2. 課金の全体像: どこでお金が発生するか

ユーザー入力 モデル入力トークン モデル出力トークン ツール呼び出し 保存/セッション 請求額

OpenAI APIの請求は、実務上次の4層で見ると整理しやすいです。

  1. モデル入力トークン課金
  2. モデル出力トークン課金
  3. ツール呼び出し課金(Web Search / File Search Tool Call)
  4. 保存・実行環境課金(File Search Storage / Containers)

この4層を切り分けないと、請求理由が追えません。特に、モデル単価だけ見ているのに、実際はツール課金が主因だったという失敗は頻出です。

3. 最重要の誤解: ChatGPTプランとAPI課金は別

ChatGPT プラン Web / App の利用枠 例: Plus $20/月 OpenAI API 開発者向け従量課金 トークン/ツール別請求 別課金

OpenAIのヘルプ情報では、ChatGPT Plusは月額サブスクであり、API利用料は別請求であることが明確です。

現場で起きやすい誤解は次の3つです。

  • 「Plusに入っていればAPIも使える」
  • 「ChatGPTのモデル名とAPI単価は同じ」
  • 「ChatGPTの仕様変更はAPIにも同時適用される」

社内説明では、次の一文をそのまま使うと伝わりやすいです。
「ChatGPTの月額費は利用者の席代、API費はプロダクトの実行コスト」

4. 2026年2月時点の公式料金を実務向けに読む

Model / Tool Input Cached Output GPT-5.2 $1.75 $0.175 $14.00 GPT-5.2 pro $21.00 $168.00

代表単価(1M tokensあたり)

モデル Input Cached input Output
GPT-5.2 $1.75 $0.175 $14.00
GPT-5.2 pro $21.00 なし $168.00
GPT-5 mini $0.25 $0.025 $2.00

ツール課金で見落としやすい項目

  • File Search Storage: $0.10 / GB / 日(最初の1GB無料)
  • File Search Tool Call(Responses API): $2.50 / 1,000 calls
  • Web Search Tool Call: $10 / 1,000 calls(条件により別枠あり)

Containers課金変更(重要)
2026年3月31日開始で、Containersは20分セッション単位課金へ移行予定です。見積もり式を旧仕様のままにすると、翌月以降に誤差が出ます。

5. 失敗しない見積もり式(そのまま使えるテンプレ)

MonthlyCost = TokenCost + ToolCost + StorageCost + SessionCost TokenCost = (Input/1e6*InputPrice) + (Output/1e6*OutputPrice) ToolCost = SearchCalls + FileSearchCalls + …

月次見積もりは次の式で統一してください。

Monthly Cost
= Token Cost + Tool Cost + Storage Cost + Session Cost

Token Cost
= (Input Tokens / 1,000,000 * Input Unit Price)
+ (Output Tokens / 1,000,000 * Output Unit Price)

スプレッドシートには、最低限次の列を持たせます。

  1. 機能名
  2. 利用モデル
  3. 月間リクエスト数
  4. 平均Input tokens
  5. 平均Output tokens
  6. Web Search呼び出し率
  7. File Search呼び出し率
  8. 保存容量(GB)
  9. Containersセッション数(20分単位)
  10. 月次見積もり合計

計算例A: FAQチャット(軽量)

  • モデル: GPT-5 mini
  • 月間 30,000リクエスト
  • 平均 Input 900 / Output 280 tokens
  • ツールなし
Input: 30,000 * 900 = 27,000,000 tokens
Output: 30,000 * 280 = 8,400,000 tokens
Input cost: 27 * 0.25 = $6.75
Output cost: 8.4 * 2.00 = $16.80
合計: $23.55 / 月

計算例B: 調査エージェント(Web Searchあり)

  • モデル: GPT-5.2
  • 月間 8,000リクエスト
  • 平均 Input 2,500 / Output 1,100 tokens
  • Web Search 1回/リクエスト
Token subtotal: $158.2
Web Search tool call: 8,000回 = $80
暫定合計: $238.2 + 検索コンテンツトークン

計算例C: ドキュメント検索(File Searchあり)

  • 保存容量 15GB(無料1GB除外で14GB課金)
  • Storage: 14 * 0.10 = $1.4/日 → 約$42/月
  • Tool Call 40,000回なら $100/月

つまり、検索系は「保存」と「呼び出し」の二重管理が必要です。

6. コストを跳ね上げる7つの落とし穴

WARNING 見積もりなしの機能追加は請求事故の近道

  1. 出力トークン上限を設定していない
    Output単価の高いモデルでは致命傷になります。
  2. 高性能モデルを全工程に使っている
    分類・整形・下書きにも高額モデルを使う設計は非効率です。
  3. Web Searchの発火条件が曖昧
    不要な検索でtool callが積み上がります。
  4. File Searchの保管期限がない
    日次課金が静かに増え続けます。
  5. リトライ設計が乱暴
    429時の連打で無駄トークンが増えます。
  6. キャッシュ対象の設計がない
    同一コンテキストを毎回フル送信してしまいます。
  7. 月次上限アラートがない
    気づいた時には締め日、が最悪パターンです。

7. すぐ効くコスト最適化10選(2026年版)

Optimize by design, not by panic.

  1. モデルルーティングを導入する
  2. 出力長を制御する
  3. Batch APIを使える処理はバッチ化する
  4. Prompt Cachingを前提にプロンプト設計する
  5. 検索ツール発火条件を厳格化する
  6. File Searchのライフサイクル管理を実装する
  7. Containers実行時間を20分単位で最適化する
  8. 品質指標を「コスト込み」で評価する
  9. 日次監視 + 週次チューニングを固定運用する
  10. 機能追加時にコスト増分見積もりを必須化する

8. Responses API移行を前提に設計する

2025-08-26 Assistants deprecate発表 段階移行を進める時期 2026-08-26 Assistants sunset目標

OpenAIの公開情報では、Responses APIが新しい中心です。Assistants APIは2025年8月26日に非推奨化が示され、2026年8月26日頃のサンセット目標が案内されています。既存システムは段階移行を前提に設計してください。

推奨アクション:

  1. 新規機能はResponses APIで実装する
  2. 既存機能は「コスト影響が大きい順」に移行する
  3. 移行前後で比較できるログ指標を統一する
  4. A/Bで品質・応答時間・コストを同時検証する

9. 60日で実行する運用ロードマップ

Day 1-14 現状計測と見積もり Day 15-35 最適化とA/B Day 36-60 移行と定着

Day 1-14: 現状把握と見積もり固定

  • 直近30日の利用ログを集計
  • 機能別にトークン/ツールを分解
  • 月次上限予算を設定
  • 見積もりシートと責任者を確定

Day 15-35: 最適化施策投入

  • モデルルーティングを導入
  • 出力長制御を導入
  • 検索発火条件を明文化
  • File Search保持期限を実装
  • Batch API候補を切り出し

Day 36-60: 移行と定着

  • 新規機能をResponses APIへ統一
  • 高コスト機能を段階移行
  • 月次レビュー会を運用に固定
  • Assistants脱却の期限計画を確定

10. まとめ

APIコストは、節約テクニックだけでは安定しません。本当に効くのは次の順番です。

  1. 課金構造を分解する
  2. 見積もり式を先に固定する
  3. モデルとツールの役割を分業する
  4. Responses中心の将来設計に寄せる

この順番で進めると、「品質を上げると赤字になる」状態から抜けられます。2026年はモデル性能だけでなく、運用設計の差が成果の差になります。

参考ソース(2026-02-27確認)

AI開発・導入のご相談

「何から始めればいいか分からない」「費用感を知りたい」など、AI導入に関するご相談を無料で承っております。大手SIerのような高額な費用は不要。経験豊富なエンジニアが直接対応します。

AIスクール受講生募集中

未経験からAIエンジニアへ。現役エンジニアによるマンツーマン指導で、実践的なAIスキルを最短で習得できます。就職・転職サポートも充実。まずは無料カウンセリングへ。

この記事をシェア