OpenAIがエージェント型コーディングモデル「GPT-5.3-Codex」を発表──Anthropicの新モデルと同日リリースの激突

2026年2月5日、OpenAIが新たなエージェント型コーディングモデル「GPT-5.3-Codex」を発表しました。注目すべきは、Anthropicが同日に「Claude Opus 4.6」をリリースしたことで、両社がわずか15分差でほぼ同時に発表するという劇的な展開となりました。AI駆動のコーディングツール市場における両社の熾烈な競争が、新たなステージに突入しています。

この記事のポイント
GPT-5.3-Codexとは何か
ベンチマーク性能と前モデルからの進化
Anthropicとの15分差の攻防
サイバーセキュリティリスク評価の意味
知っておくと便利なTips
まとめ

この記事のポイント

OpenAIが「GPT-5.3-Codex」を発表。前モデルより25%高速化し、自身の構築にも貢献した初のモデル
Anthropicの「Claude Opus 4.6」リリースとわずか15分差の発表で、エージェント型コーディング市場の競争が激化
サイバーセキュリティ分野で「High（高）」リスク評価を受けた初のOpenAIモデル

GPT-5.3-Codexとは何か

GPT-5.3-Codexは、OpenAIが今週初めに正式ローンチしたエージェント型コーディングツール「Codex」の能力を飛躍的に向上させるために設計された新モデルです。前モデルのGPT-5.2-Codexを基盤とし、テキスト分析や推論に優れたGPT-5.2モデルの知見を統合することで、コーディング能力と汎用的な推論能力を高い次元で両立しています。

最大の特徴は、このモデルが「自身の構築に関わった初のモデル」であるという点です。OpenAIによれば、開発の初期段階で早期バージョンが投入され、「トレーニング中のバグ発見、デプロイメントの管理、結果の評価」に活用されました。開発チームは、このシステムが開発プロセスをどれほど加速させたかに驚いたと述べています。AIがAIを作る時代が本格的に始まりつつあることを象徴する出来事です。

ベンチマーク性能と前モデルからの進化

GPT-5.3-Codexの性能向上は、複数のベンチマークで明確に示されています。Terminal-Bench 2.0では77.3%を達成し、同日に発表されたAnthropicのOpus 4.6を12ポイント上回るスコアを記録しました。また、OSWorld-Verifiedでは64.7%を記録。これはGPT-5.2-Codexの38.2%から大幅に向上しており、エージェント的なタスク遂行能力が飛躍的に改善されたことがわかります。

さらに、GDPvalのナレッジワークベンチマーク（44職種を対象）ではGPT-5.2と同等の性能を維持しており、コーディング特化でありながら汎用的な知識タスクでも性能を犠牲にしていません。処理速度は前モデルから25%向上し、使用するトークン数も削減されているため、より効率的な運用が可能になっています。

Anthropicとの15分差の攻防

今回の発表で最も話題を集めたのは、OpenAIとAnthropicの発表タイミングです。両社はもともと同じ時刻（太平洋時間午前10時）にそれぞれのエージェント型コーディングツールを発表する予定でした。しかし、Anthropicが15分前倒しで「Claude Opus 4.6」を発表し、OpenAIをわずかに出し抜く形となりました。

AnthropicのClaude Opus 4.6は、100万トークンのコンテキストウィンドウ、Claude Codeにおけるエージェントチーム機能（並列タスク処理）など、エンタープライズ向けの大幅な機能強化を特徴としています。一方のOpenAIは、GPT-5.3-Codexの圧倒的なベンチマークスコアで応戦する形となりました。

この同日リリースの激突は、エージェント型コーディング市場がAI業界の最重要戦場の一つとなっていることを鮮明に示しています。AppleもXcode 26.3にAnthropicのClaude AgentとOpenAIのCodexの両方を統合することを発表しており、開発者はますます豊富な選択肢を手にすることになります。

サイバーセキュリティリスク評価の意味

GPT-5.3-Codexは、OpenAIの内部リスク管理評価において、サイバーセキュリティ関連タスクで「High（高）」能力と分類された初のモデルです。これは、ソフトウェアの脆弱性を特定するよう直接訓練された初のモデルでもあります。

ただし、OpenAIはこの分類を「予防的措置」と位置付けており、モデルがサイバー攻撃を端から端まで自動化できるという決定的な証拠はないとしています。安全対策として、安全性トレーニング、自動モニタリング、高度な機能への信頼ベースのアクセス制御、脅威インテリジェンスを含む執行パイプラインなど、過去最も包括的なサイバーセキュリティ安全スタックを導入しています。

また、OpenAIはサイバー防衛の加速を目的として1,000万ドルのAPIクレジットを提供することを約束し、善意のセキュリティ研究に従事する組織はサイバーセキュリティ助成プログラムを通じてAPIクレジットとサポートを申請できます。

知っておくと便利なTips

GPT-5.3-Codexは現在、ChatGPT契約者向けにCodexアプリ、CLI、IDE拡張機能、Webインターフェースで利用可能。API経由のアクセスは今後提供予定
前モデルよりもトークン使用量が削減されているため、コスト効率の面でもメリットがある
Apple Xcode 26.3ではCodexとClaude Agentの両方が統合されており、開発環境から直接両ツールを使い分けることが可能

まとめ

OpenAIの「GPT-5.3-Codex」は、自身の構築に関与した初のモデルという歴史的な意味合いを持ちつつ、25%の速度向上と主要ベンチマークでの大幅なスコア改善を実現しました。Anthropicの「Claude Opus 4.6」とわずか15分差で発表されるという劇的な展開は、エージェント型コーディング市場における両社の本気度を如実に示しています。サイバーセキュリティリスクへの先進的な対応も含め、AIコーディングツールが成熟期に入りつつあることを強く印象付ける発表でした。開発者にとっては、ますます強力な選択肢が増えている状況であり、今後の動向から目が離せません。

📎 元記事: https://techcrunch.com/2026/02/05/openai-launches-new-agentic-coding-model-only-minutes-after-anthropic-drops-its-own/