GPT-5.5 正式リリース：6週間でのイテレーション、科学研究応用を主軸に、コードテストで最高記録を更新

📄原文全文· trafilatura により自動抽出Gemini 翻譯1471 文字

OpenAI は 23 日、GPT-5.4 のリリースからわずか 6 週間で GPT-5.5 を発表した。標準版はプログラミングテスト Terminal-Bench 2.0 で 82.7% を記録し、Pro 版はポストドクターレベルの数学問題 FrontierMath Tier 4 で 39.6% を記録した。（前回のあらすじ：OpenAI 最強 GPT-5 発表会まとめ：無料公開、機能ハイライト、gpt-5、gpt-5-mini、gpt-5-nano API 価格）（背景補足：5 分でわかる GPT-5》ChatGPT 4o との違いは？ハルシネーションの低減と従順性、API 価格まとめ） GPT-5.5 は 4 月 23 日にリリースされ、前バージョンである GPT-5.4 からわずか 6 週間での登場となった。OpenAI 公式は今回のリリースを「現在最も賢く、直感的なモデル」と位置づけ、GPT-5.4 と比較して「より少ない token で、より速く、より正確に思考する」ことを強調している。プログラミングのベンチマークである Terminal-Bench 2.0 において、標準版 GPT-5.5 は 82.7% を獲得し、同テストで 69.4% を記録した Claude Opus 4.7 と約 13 ポイントの差をつけた。インフラ最適化タスクでは、GPT-5.5 の token 生成速度が 20% 以上向上しており、長いコンテキスト処理やマルチステップのワークフローにおけるコスト効率が同時に改善されたことを示している。 Pro 版の差別化の焦点は数学的推論にある。FrontierMath Tier 4 は業界で最も困難とされる数学評価セットであり、問題レベルはポストドクターの研究水準で、人間の専門家でも解くのに数日かかる可能性がある。GPT-5.5 Pro はこのテストで 39.6% を記録し、Claude Opus 4.7 の 22.9% と約 17 ポイントの差をつけた。もう一つ注目すべき数値として、経済タスクのベンチマークである GDPval では、標準版 GPT-5.5 が 84.9% を記録し、Pro 版を上回った。この結果は、一般的なナレッジワークのシナリオにおいては標準版で十分かつコスト優位性があることを示しており、Pro 版の差別化価値は広範なカバー範囲ではなく、高強度の推論タスクに集中していることを意味する。 OpenAI は同時に、GPT-5.5 の「computer use」能力も大幅に向上したと指摘している。ソフトウェアインターフェースを自律的に操作し、マルチステップのワークフローを処理することで、エージェント的なタスクにおいてユーザーの介入を減らすことが可能となった。これは今回の発表においてやや異例のナラティブであり、公式は「科学技術研究のワークフローにおいて実質的な進展を遂げた」と宣言し、特に創薬のシナリオを挙げて、GPT-5.5 が専門の科学者の進展を支援できると述べている。実名で引用された事例として、カスタマイズされた GPT-5.5 バージョンが、研究者による Ramsey 数の組合せ数学における新しい証明の発見を支援したというものがある。Ramsey 数の問題は純粋数学の分野で数十年にわたる難問であり、この事例が OpenAI の公式発表で直接取り上げられたことは、これが単なる周辺的なデモンストレーションではなく、将来の商用化に向けた方向性を示すシグナルであることを意味している。なぜ研究シナリオがこれほど強調されるのか。その背景には明確なビジネスロジックがある。製薬企業、材料研究所、研究機関は高い計算コストを受け入れられる支払い能力のある層であり、Pro 版の価格設定は標準版より大幅に高いが、現在は Business および Enterprise のサブスクライバーのみに開放されている。 OpenAI は差別化された価格設定を通じて、研究シナリオを広く開放するのではなく、実質的にハイエンドな SKU として運営している。現在、GPT-5.5 は Plus、Pro、Business、Enterprise ユーザーに対して即日開放されており、GPT-5.5 Pro は Business および Enterprise 限定となっている。API 接続は「近日公開」予定である。標準版の GDPval におけるパフォーマンスは、ほとんどのナレッジワークを処理するのに十分であることを示しており、Pro 版はより明確に、高強度の数学的推論を必要とする企業シナリオをターゲットにしている。 6 週間というイテレーションのペースは構造的なプレ

データステータス✓ 全文抽出済み原文を読む（動區 BlockTempo）

🔍過去の類似イベント· キーワード + 銘柄照合5 件

2026-04-24

DeepSeek V4 がリリース、プログラミング能力は GPT や Claude を凌駕できるか？コストは再び圧倒的

類似度 120%關鍵字 gpt同分類 zh

2026-04-24

Jensen Huangが社内メールを送信：1万人のNVIDIA従業員に対し、OpenAI Codexへの移行を義務付け、GPT-5.5はGB200チップで稼働へ

類似度 120%關鍵字 gpt同分類 zh

2026-04-24

Jensen Huang が全社員へメッセージ、OpenAI Codex を導入：1 万人以上の NVIDIA 社員が利用開始、GB200 上で GPT-5.5 が稼働

類似度 120%關鍵字 gpt同分類 zh

2026-04-23