Lunaと政府レビュー付きリリース¶

対象 / ポイント

対象: LLMをAPIやエージェントで使う開発者・チーム運用担当者。GPT-5.6が何を変え、いくらで、いつ使えるのかを先に把握したい人。

ポイント:

公開日: 2026-06-28

OpenAIが2026年6月26日にGPT-5.6を限定プレビューとして出した。¹ 今回の焦点は、単に「上位モデルが出た」ではない。 モデル選択、推論深度、サブエージェント、公開手順が同時に変わった点にある。

この記事の問いは、GPT-5.6を開発者がどう読み、いま何を判断できるかである。結論から言うと、今すぐの本番移行判断ではなく、価格設計とエージェント設計を見直すためのプレビューとして読むのが安全だ。

何が発表されたのか¶

GPT-5.6は、Sol / Terra / Lunaという3つの能力ティアで出る。数字が世代を表し、名前が能力とコストの層を表す設計だ。

OpenAIは、Solを最高性能、TerraをGPT-5.5級で低価格、Lunaを最安モデルとして位置づけている。¹ 提供は最初から全面公開ではない。プレビュー時点ではAPIとCodexの一部パートナーに限られ、ChatGPT、Codex、APIの一般提供は数週間内とされている。

ここで重要なのは、モデル名よりも選び方だ。 Solは最難問、Terraは既存高性能ワークロードの置換候補、Lunaは大量処理や低コスト用途の候補になる。

実装に直接効く変更は4つある。特に、推論深度とエージェント実行方式が分かれた点が大きい。

キャッシュ価格も変わる。 GPT-5.6以降では、キャッシュ書き込みが未キャッシュ入力単価の1.25倍、キャッシュ読み込みは引き続き90%割引とされる。¹ 長いコンテキストや反復エージェントを使うチームでは、モデル単価だけでなくキャッシュ設計がコストを左右する。

価格は100万トークンあたりで示されている。出力単価が高いため、生成量の多いワークロードほどモデル選択の影響が大きい。

入力100万、出力100万トークンの単純計算なら、Solは $35、Terraは$ 17.50、Lunaは$7になる。同じタスクでも、出力を絞る設計にするだけでコスト差は広がる。

Terraの主張は特に実務的だ。 GPT-5.5並みの性能で半額なら、既存の高性能モデル利用をそのまま置き換える候補になる。ただし、これはOpenAIのプレビュー時点の主張であり、独立ベンチと実ワークロードでの確認が必要だ。

限定公開の理由は、サイバー能力の高さである。 OpenAIは、米政府の要請を受け、参加者を政府に共有した少数の信頼できるパートナーに絞って開始したと説明している。¹

これは通常のモデル公開とは違う。 OpenAI自身も、この種の政府アクセス手続きを長期的な既定にすべきではないと位置づけている。つまり、今回の手順は「能力が上がったモデルをどう段階公開するか」という政策面の実験でもある。

安全対策も多層化されている。 OpenAIは、学習段階での拒否、生成中のリアルタイム分類、疑わしい出力の一時停止、アカウント単位のレビュー、差別化アクセスを組み合わせると説明している。² 自動レッドチームには70万A100e GPU時間相当を投じたともされる。

OpenAIは複数のベンチで改善を主張している。 Terminal-Bench 2.1、GeneBench v1、ExploitBenchなどで、GPT-5.5や競合モデルに対する優位性、または少ない出力トークンでの同等性能を示したという内容だ。¹

ただし、現時点では独立検証前である。 OpenAIは拡張版の結果を一般提供時に出すとしている。したがって、ここで確定できるのは「OpenAIがそう主張している」ことまでだ。

実務では、ベンチよりも自分のタスクで見る。コード修正、長文調査、マルチステップのエージェント作業、セキュリティ関連の検証では、成功率、出力トークン、レイテンシ、失敗時の修正コストを並べて比較する必要がある。

GPT-5.6は、能力と価格効率を同時に動かす世代更新である。ただし、今は限定プレビューであり、誰でもすぐ本番投入できる段階ではない。

実務上の判断は3つに分かれる。

最後に重要なのは、公開手順そのものだ。政府レビューを経た段階公開は、モデル性能とは別の論点を作った。今後のフロンティアモデルでは、性能、価格、安全性、公開統治がセットで比較される可能性が高い。