コンテンツにスキップ

GPT-5.6プレビュー:Sol / Terra / Lunaと政府レビュー付きリリース

対象 / ポイント

対象: LLMをAPIやエージェントで使う開発者・チーム運用担当者。GPT-5.6が何を変え、いくらで、いつ使えるのかを先に把握したい人。

ポイント:

  • GPT-5.6はSol / Terra / Lunaの3モデル構成で、max推論とultraモードを追加した。
  • 価格は100万トークンあたりSol $5 / $30、Terra $2.50 / $15、Luna $1 / $6である。
  • 異例なのは、サイバー能力を理由に米政府レビューを経た限定プレビューから始まる点だ。

公開日: 2026-06-28

OpenAIが2026年6月26日にGPT-5.6を限定プレビューとして出した。1 今回の焦点は、単に「上位モデルが出た」ではない。 モデル選択、推論深度、サブエージェント、公開手順が同時に変わった点にある。

この記事の問いは、GPT-5.6を開発者がどう読み、いま何を判断できるかである。 結論から言うと、今すぐの本番移行判断ではなく、価格設計とエージェント設計を見直すためのプレビューとして読むのが安全だ。

  • Sol


    旗艦モデル。max推論とultraモードに対応。入力5 / 出力30。

  • Terra


    GPT-5.5並みの性能を半額で狙う日常向け。入力2.50 / 出力15。

  • Luna


    低コスト・高速寄りの選択肢。入力1 / 出力6。

何が発表されたのか

GPT-5.6は、Sol / Terra / Lunaという3つの能力ティアで出る。 数字が世代を表し、名前が能力とコストの層を表す設計だ。

OpenAIは、Solを最高性能、TerraをGPT-5.5級で低価格、Lunaを最安モデルとして位置づけている。1 提供は最初から全面公開ではない。 プレビュー時点ではAPIとCodexの一部パートナーに限られ、ChatGPT、Codex、APIの一般提供は数週間内とされている。

ここで重要なのは、モデル名よりも選び方だ。 Solは最難問、Terraは既存高性能ワークロードの置換候補、Lunaは大量処理や低コスト用途の候補になる。

開発者に効く新要素

実装に直接効く変更は4つある。 特に、推論深度とエージェント実行方式が分かれた点が大きい。

  • max推論: 最も深く推論させる新しいreasoning effort。重い設計・デバッグ・調査向けに使う。
  • ultraモード: サブエージェントを使い、複雑な作業を分担、並列実行、統合する。
  • 命名体系の刷新: 世代番号と能力ティアを分け、速度・知能・価格の選択を明確にする。
  • キャッシュ仕様の刷新: 明示的なキャッシュブレークポイントと最低30分のキャッシュ寿命を導入する。

キャッシュ価格も変わる。 GPT-5.6以降では、キャッシュ書き込みが未キャッシュ入力単価の1.25倍、キャッシュ読み込みは引き続き90%割引とされる。1 長いコンテキストや反復エージェントを使うチームでは、モデル単価だけでなくキャッシュ設計がコストを左右する。

価格をどう読むか

価格は100万トークンあたりで示されている。 出力単価が高いため、生成量の多いワークロードほどモデル選択の影響が大きい。

モデル入力出力読み方
Sol$5$30最難問・高価な判断向け
Terra$2.50$15高性能の標準候補
Luna$1$6低コスト大量処理向け

入力100万、出力100万トークンの単純計算なら、Solは35、Terraは17.50、Lunaは$7になる。 同じタスクでも、出力を絞る設計にするだけでコスト差は広がる。

Terraの主張は特に実務的だ。 GPT-5.5並みの性能で半額なら、既存の高性能モデル利用をそのまま置き換える候補になる。 ただし、これはOpenAIのプレビュー時点の主張であり、独立ベンチと実ワークロードでの確認が必要だ。

なぜ限定プレビューなのか

限定公開の理由は、サイバー能力の高さである。 OpenAIは、米政府の要請を受け、参加者を政府に共有した少数の信頼できるパートナーに絞って開始したと説明している。1

これは通常のモデル公開とは違う。 OpenAI自身も、この種の政府アクセス手続きを長期的な既定にすべきではないと位置づけている。 つまり、今回の手順は「能力が上がったモデルをどう段階公開するか」という政策面の実験でもある。

安全対策も多層化されている。 OpenAIは、学習段階での拒否、生成中のリアルタイム分類、疑わしい出力の一時停止、アカウント単位のレビュー、差別化アクセスを組み合わせると説明している。2 自動レッドチームには70万A100e GPU時間相当を投じたともされる。

ベンチマーク主張は留保して読む

OpenAIは複数のベンチで改善を主張している。 Terminal-Bench 2.1、GeneBench v1、ExploitBenchなどで、GPT-5.5や競合モデルに対する優位性、または少ない出力トークンでの同等性能を示したという内容だ。1

ただし、現時点では独立検証前である。 OpenAIは拡張版の結果を一般提供時に出すとしている。 したがって、ここで確定できるのは「OpenAIがそう主張している」ことまでだ。

実務では、ベンチよりも自分のタスクで見る。 コード修正、長文調査、マルチステップのエージェント作業、セキュリティ関連の検証では、成功率、出力トークン、レイテンシ、失敗時の修正コストを並べて比較する必要がある。

まとめ

GPT-5.6は、能力と価格効率を同時に動かす世代更新である。 ただし、今は限定プレビューであり、誰でもすぐ本番投入できる段階ではない。

実務上の判断は3つに分かれる。

  • 既存の高性能モデル利用は、Terraでコストが下がるか検証する。
  • 複雑な調査や実装は、Solのmax推論とultraモードが作業時間を減らすか見る。
  • 大量処理は、Lunaとキャッシュ設計で単価を下げられるか試算する。

最後に重要なのは、公開手順そのものだ。 政府レビューを経た段階公開は、モデル性能とは別の論点を作った。 今後のフロンティアモデルでは、性能、価格、安全性、公開統治がセットで比較される可能性が高い。

関連記事