本記事は 2025年版「OpenAIも参戦──AIコーディングエージェント競争」 を、2026年6月9日時点の最新情報 にあわせて全面的に書き直した最新版です。Codexの中核モデルは2026年6月時点で 最新フラッグシップ「GPT-5.5」 に移行し、5月時点で現役だった GPT-5.3-Codex は終息に向かっています。「Codex 最新モデルは結局どれ?」をお探しの方はこちらをお読みください。
「Codex の最新モデルは何ですか?」——2026年に入ってから、システム開発を依頼する側の経営者・情シス担当の方から、この質問を受ける機会が一気に増えました。理由はシンプルで、OpenAI のモデル更新があまりに速く、数か月前の情報がすぐ古くなる からです。実際、2026年5月時点で「Codex の頭脳」と言われていた GPT-5.3-Codex は、6月時点ではすでに後継に置き換わりつつあります。
このコラムでは、2026年6月9日時点での Codex の最新の姿 と、AIコーディングエージェント競争がシステム開発の「発注相場」をどう変えているか を、発注する側の視点で整理します。専門用語はできるだけかみくだいて説明します。
結論:2026年6月時点で「Codex の最新モデル」はGPT-5.5
※ 以下は2026年6月時点の情報です。モデルの正確な仕様・提供状況は OpenAI公式 Codex Changelog と Codex Models でご確認ください。
まず最も多い疑問にお答えします。2026年6月時点で Codex の中核モデルは「GPT-5.5」 です。GPT-5.5 は2026年4月23日に発表された OpenAI の現行フラッグシップで、ChatGPT・API・Codex を横断して提供されています(出典:OpenAI公式)。
5月版の本記事では「コーディングの中核は GPT-5.3-Codex」と書いていましたが、ここが6月時点での最大の変化点 です。OpenAI は2026年6月、旧世代の GPT-5.2 / GPT-5.3-Codex の終息(API での新規利用は6月30日で終了予定) をアナウンスしており、コーディングの主役は GPT-5.5 系へと移っています。
6月時点で押さえておくべきモデルは次の3つです。
| モデル | 位置付け(2026年6月時点) | | --- | --- | | GPT-5.5 | 現行フラッグシップ。Codex の中核。エージェント的なコーディング・PC操作・調査に最強 | | GPT-5.4-mini | 安価な軽量モデル。サブエージェントや軽いタスク用(200Kコンテキスト) | | GPT-5.3-Codex-Spark | リアルタイム特化(毎秒1000トークン超)。ChatGPT Pro向けリサーチプレビュー |
GPT-5.5 は より少ないトークンでより良い結果を出す よう調整されており、公開ベンチマークでは Terminal-Bench 2.0 で82.7%、SWE-Bench Pro で58.6%という当時の最高水準のスコアが報告されています(出典:OpenAI公式)。
つまり「Codex の最新モデルは?」への2026年6月時点の答えは、「GPT-5.5。GPT-5.3-Codex はもう旧世代」 です。
2026年6月時点のCodex本体の姿
Codex は単一ツールではなく、いくつもの利用形態を横断するプロダクト群です。2026年6月時点では次の形で提供されています。
- Codex CLI(ターミナルで動く本体。Rust製で軽量。直近リリースは2026年6月、バージョンは0.7x系)
- Codex IDE拡張(VS CodeなどのIDEで利用)
- Codex デスクトップアプリ(macOS向け)
- Codex Mobile(iOS)
- ChatGPT内 Codex
5月から6月にかけてのアップデートで目立つのは次の点です(出典:Codex Changelog)。
- Goal mode が正式機能化(GA):アプリ・IDE拡張・CLIすべてで、「達成したい成果」と「成功条件」を決めると、Codexがそこに向かって自走する
- Sites(プレビュー):Webサイト・社内ツール・ダッシュボード・簡単なアプリをCodexで作って、そのまま公開・確認できる
- 会話履歴の検索/セッションのアーカイブ:過去のやり取りを横断検索でき、作業単位を整理しやすくなった
- Computer Use の安定化:AIが実際にマウス・キーボードを操作してPCを動かす機能の起動・エラー報告が改善
- Amazon Bedrock 対応:AWS経由でOpenAIモデルをCodexから使えるようになり、認証・課金・統制をAWS側に寄せられる
ひとことで言えば、2026年6月のCodexは 「手元で動かす開発支援ツール」から「離席中も成果に向かって走り続けるAIエンジニア」 へと、さらに一歩進んでいます。この「ターミナルで動くエージェント」という潮流自体は、Anthropic の Claude Code とも共通します。両者の違いは Claude Code 徹底解説(2026年版) で整理しています。
AIコーディングエージェント競合の2026年6月時点の状況
Codex の進化に呼応して、競合各社も6月に大きく動きました。発注判断に効く最新動向を整理します。
| プロダクト | 2026年6月の状況 | | --- | --- | | Anthropic Claude Code | 中核モデルが Claude Opus 4.8(5月28日)に更新。「Dynamic Workflows」で複数ステップ作業の自走を強化 | | GitHub Copilot | 6月1日に定額制から 従量課金(AI Credits)へ移行。$100の上位「Max」プラン新設。想定より早く枠を消費するとの声も | | Cursor | Teams を Standard($32/席・年契約)と Premium($96/席)に再編。長時間自走エージェントを推進 | | Devin Desktop(旧Windsurf) | 6月2日、Windsurfが Devin Desktop へ改称。Agent Client Protocol(ACP)対応で、Codex・Claude など他社エージェントを内部で動かせる |
特に注目すべきは2点です。
1点目は GitHub Copilot の従量課金化。「定額で使い放題」という前提が崩れ、使った分だけ課金される構造になりました。AIコーディングの コストが「固定費」から「変動費」に変わりつつある ことを意味します。
2点目は Devin Desktop が他社エージェントを内部で動かせるようになった こと。Copilot が以前から複数社のモデルを横断利用できるようにしていた流れと合わせ、「どのAIを使うか」をユーザーが組み合わせて選ぶ 方向がさらに鮮明になりました。結果として、特定ベンダーへのロックインは弱まり続けています。
「結局どのツール・どのモデルを選べばいいのか」で迷う場合は、AI開発パートナーの選び方 と AI導入前の品質チェックリスト も合わせてご覧ください。
業界データで見る「AI開発の生産性向上」(2026年版)
ここからが発注者に直接関わる話です。2026年に入り、AIコーディングが 実際にどれだけ開発生産性を上げているか の定量データが各所から出そろってきました。
※ 出典:複数の業界レポート(Index.dev ほか、2026年の集計)。数値は調査により幅があり、あくまで2026年時点の目安です。
- 開発者の約84%がAIコーディングツールを使用。全コードの約41%をAIが生成
- 約51%の開発者が毎日AIツールを使用
- 開発者ひとりあたり週平均 約3.6時間の時短
- 大企業ではコード関連活動の33〜36%の時短 という報告も
一方で、「導入すれば即半額」ではない ことも各レポートが強調しています。レビューなしでAIを使うと バグが約41%増加 するという調査もあり、ワークフロー・レビュー体制・ガードレールが整っていないチームでは、生産性向上が 手戻りやレビュー負荷で相殺 される現象が報告されています。
つまり、AIコーディングの恩恵を受けられるかどうかは 「最新のAIツールを買ったか」ではなく「AIを活かす運用設計をしているか」 にかかっています。これは発注者が開発会社を選ぶ際の重要な視点です。
発注する側の視点で、相場感はどう変わったか
2025年と比べ、2026年6月時点の発注相場感には次の変化が見られます。
1. 「妙に速い・安い」提案が現実に出てくる
AIエージェントを使いこなすチームは、同じ機能を 2〜5割短い期間・コスト で提供できるケースが増えています。見積もり比較で「他社より明らかに速い・安い」提案があれば、それはAI活用の有無による差である可能性が高いです。ただし 「安かろう悪かろう」ではないか を、品質・保守性・実績で別途確認する必要があります。
2. 「人月単価」という指標が機能しなくなった
2025年時点では「AIを使うエンジニアの人月単価をどう評価するか」が議論の中心でした。2026年に入ると 個人差・チーム差で生産量が数倍に広がる ことが明確になり、人月単価で比較する意味自体が薄れています。発注者は 「成果物の品質 × 速度 × 保守性」 で評価する必要があります。
3. AIの「コストが変動費化」した
GitHub Copilot の従量課金化に象徴されるように、AIコーディングのコストは固定費から変動費へ移りつつあります。「使えば使うほど課金される」 構造になったことで、AIをどれだけ効率よく使うか——無駄なやり直しを減らす設計力——が、そのままコストに跳ね返るようになりました。
4. ベンダーロックインのリスクが下がった
Copilot や Devin Desktop が複数社のモデル・エージェントを横断利用できるようになり、「OpenAIに賭けるかAnthropicに賭けるか」 という二者択一は実質なくなりました。発注時にも「特定のモデル・ツールに依存しすぎない構成にしてほしい」と伝えるとよいでしょう。
中小企業がいま、Codexやその他のAIエージェントとどう付き合うか
2026年6月時点で、中小企業がAIコーディングツールとどう付き合うかの現実解は次の3つです。
1. 「PoC・社内ツールは社内で、本番は専門家で」の棲み分け
Codex・Claude Code・Cursor などを使えば、社内メンバーでも試作品(PoC)や社内向けツールを作れる時代になりました。非エンジニアがアプリの形にするまでの実際は 非エンジニアがバイブコーディングでアプリを作る話 にまとめています。一方、顧客向け・本番運用のシステムには、セキュリティ・可用性・保守性・法令遵守などの品質要件があり、専門家の関与が引き続き必要です。
2. 既存システムを「作り直さずAI化」する選択肢を検討する
「全部作り直す」ではなく、既存システムにAI機能を組み込むアプローチが現実的です。AIと自社の業務データを安全につなぐ共通規格については MCP(Model Context Protocol)とは を、組み込みの進め方は 既存の業務システムにAIを組み込む方法 を参照してください。
3. 開発会社選びの基準を見直す
見積もり比較で「人月単価」だけを見るのではなく、「AIをどう活用しているか」「設計とレビュー体制はどうか」「過去の納品物の品質はどうか」 を必ず確認しましょう。詳しくは AI開発会社の選び方 にまとめています。
ゼットリンカーでも、Codex・Claude Code・Cursorなどを実務に組み込みながら、「AIで速く・人で正しく」 を両立する受託開発を行っています。AIをどこまで活用すべきか・どの開発会社が自社に合うかでお迷いの場合は、お問い合わせフォーム からご相談ください。
まとめ
2026年6月時点で「Codex の最新モデル」を一言で言えば GPT-5.5 です。5月時点で現役だった GPT-5.3-Codex はすでに旧世代になり、Codex本体も Goal mode の正式化や Sites プレビューなど、より「成果まで自走するエージェント」へ進化しました。Claude Code、Cursor、Devin Desktop(旧Windsurf)、GitHub Copilot といった競合も6月に大きく動き、業界は ベンダーロックインを弱める方向 に向かっています。
システム開発を発注する側として押さえておくべき3点は以下です。
- 「最新モデルか」より「どう活かすか」 ──モデル名は数か月で変わる。本質はAIを活かす運用設計
- 「人月単価」ではなく「成果と品質」で評価する ──個人差・チーム差が数倍に広がっている
- 設計力とレビュー力が差別化要因 ──AIが書くコードの速度ではなく、何を作るか・どう品質を担保するかで差がつく
AIコーディング競争はまだ加速していくはずです。「どのツールを使うか」より「どう活かすか」 に視点を移しておくと、変化の中でも判断がぶれません。
FAQ
Q. 2026年6月時点で、Codexの最新モデルは何ですか?
A. GPT-5.5 です。2026年4月23日に発表された OpenAI の現行フラッグシップで、ChatGPT・API・Codex を横断して提供されています。5月時点で中核だった GPT-5.3-Codex は終息に向かっており(API での新規利用は6月30日で終了予定)、コーディングの主役は GPT-5.5 系に移りました。軽量用途には GPT-5.4-mini、リアルタイム特化には GPT-5.3-Codex-Spark(ChatGPT Proのプレビュー)も用意されています。
Q. 5月版の記事から、何が一番変わりましたか?
A. 中核モデルが GPT-5.3-Codex から GPT-5.5 に変わった 点が最大の変化です。加えて Goal mode の正式機能化、Sites(プレビュー)の追加、Amazon Bedrock 対応、競合では GitHub Copilot の従量課金化や Windsurf の Devin Desktop への改称など、6月時点の動きを反映しました。
Q. ClaudeとOpenAI、どちらを使うべきですか?
A. 2026年6月時点でも、用途・予算・既存環境に応じた使い分けが現実解です。GitHub Copilot や Devin Desktop が複数社のモデル・エージェントを横断利用できるなど、ベンダーロックインを避ける方向に業界が動いています。受託開発でも「特定モデルに依存しない構成」を希望する企業が増えています。Claude Code 側の最新は Claude Code 徹底解説 を参照してください。
Q. AIで開発費は本当に半額になるのですか?
A. 「即半額」とは言えません。業界レポートでは定型タスクで大きな時短が報告されていますが、これはAIを活かす運用設計があるチームに限った話です。レビューなしで使うとバグが約41%増えるという調査もあり、ワークフローやレビュー体制が整っていないチームでは生産性向上が手戻りで相殺されるケースも報告されています。
Q. 自社のエンジニアにCodexを使わせれば、開発会社は不要になりますか?
A. 試作・社内ツールであれば現実的な選択肢です。ただし顧客向け・本番運用のシステムでは、設計・セキュリティ・保守性のレビューが必要で、専門家の関与が引き続き重要です。導入前の見極めは AI導入前の品質チェックリスト が参考になります。
この記事を書いた人
株式会社ゼットリンカー