ニュース一覧GPT-5.5 正式リリース:6週間でのイテレーション、科学研究応用を主軸に、コードテストで最高記録を更新
動區 BlockTempo2026-04-24 02:35:34

GPT-5.5 正式リリース:6週間でのイテレーション、科学研究応用を主軸に、コードテストで最高記録を更新

ORIGINALGPT-5.5 正式發布:六週迭代、主攻科研應用、程式碼測試破頂
AI 影響分析Grok が分析中...
📄原文全文· trafilatura により自動抽出Gemini 翻譯1471 文字
OpenAI は 23 日、GPT-5.4 のリリースからわずか 6 週間で GPT-5.5 を発表した。標準版はプログラミングテスト Terminal-Bench 2.0 で 82.7% を記録し、Pro 版はポストドクターレベルの数学問題 FrontierMath Tier 4 で 39.6% を記録した。 (前回のあらすじ:OpenAI 最強 GPT-5 発表会まとめ:無料公開、機能ハイライト、gpt-5、gpt-5-mini、gpt-5-nano API 価格) (背景補足:5 分でわかる GPT-5》ChatGPT 4o との違いは?ハルシネーションの低減と従順性、API 価格まとめ) GPT-5.5 は 4 月 23 日にリリースされ、前バージョンである GPT-5.4 からわずか 6 週間での登場となった。OpenAI 公式は今回のリリースを「現在最も賢く、直感的なモデル」と位置づけ、GPT-5.4 と比較して「より少ない token で、より速く、より正確に思考する」ことを強調している。 プログラミングのベンチマークである Terminal-Bench 2.0 において、標準版 GPT-5.5 は 82.7% を獲得し、同テストで 69.4% を記録した Claude Opus 4.7 と約 13 ポイントの差をつけた。インフラ最適化タスクでは、GPT-5.5 の token 生成速度が 20% 以上向上しており、長いコンテキスト処理やマルチステップのワークフローにおけるコスト効率が同時に改善されたことを示している。 Pro 版の差別化の焦点は数学的推論にある。FrontierMath Tier 4 は業界で最も困難とされる数学評価セットであり、問題レベルはポストドクターの研究水準で、人間の専門家でも解くのに数日かかる可能性がある。GPT-5.5 Pro はこのテストで 39.6% を記録し、Claude Opus 4.7 の 22.9% と約 17 ポイントの差をつけた。 もう一つ注目すべき数値として、経済タスクのベンチマークである GDPval では、標準版 GPT-5.5 が 84.9% を記録し、Pro 版を上回った。この結果は、一般的なナレッジワークのシナリオにおいては標準版で十分かつコスト優位性があることを示しており、Pro 版の差別化価値は広範なカバー範囲ではなく、高強度の推論タスクに集中していることを意味する。 OpenAI は同時に、GPT-5.5 の「computer use」能力も大幅に向上したと指摘している。ソフトウェアインターフェースを自律的に操作し、マルチステップのワークフローを処理することで、エージェント的なタスクにおいてユーザーの介入を減らすことが可能となった。 これは今回の発表においてやや異例のナラティブであり、公式は「科学技術研究のワークフローにおいて実質的な進展を遂げた」と宣言し、特に創薬のシナリオを挙げて、GPT-5.5 が専門の科学者の進展を支援できると述べている。 実名で引用された事例として、カスタマイズされた GPT-5.5 バージョンが、研究者による Ramsey 数の組合せ数学における新しい証明の発見を支援したというものがある。Ramsey 数の問題は純粋数学の分野で数十年にわたる難問であり、この事例が OpenAI の公式発表で直接取り上げられたことは、これが単なる周辺的なデモンストレーションではなく、将来の商用化に向けた方向性を示すシグナルであることを意味している。 なぜ研究シナリオがこれほど強調されるのか。その背景には明確なビジネスロジックがある。製薬企業、材料研究所、研究機関は高い計算コストを受け入れられる支払い能力のある層であり、Pro 版の価格設定は標準版より大幅に高いが、現在は Business および Enterprise のサブスクライバーのみに開放されている。 OpenAI は差別化された価格設定を通じて、研究シナリオを広く開放するのではなく、実質的にハイエンドな SKU として運営している。 現在、GPT-5.5 は Plus、Pro、Business、Enterprise ユーザーに対して即日開放されており、GPT-5.5 Pro は Business および Enterprise 限定となっている。API 接続は「近日公開」予定である。標準版の GDPval におけるパフォーマンスは、ほとんどのナレッジワークを処理するのに十分であることを示しており、Pro 版はより明確に、高強度の数学的推論を必要とする企業シナリオをターゲットにしている。 6 週間というイテレーションのペースは構造的なプレ
データステータス✓ 全文抽出済み原文を読む(動區 BlockTempo)
🔍過去の類似イベント· キーワード + 銘柄照合5 件
💡 現在はキーワード + 銘柄照合(MVP)を使用しています · 今後 embedding セマンティック検索へアップグレード予定
原始情報
ID:6f31e7235a
ソース:動區 BlockTempo
公開:2026-04-24 02:35:34
カテゴリ:zh_news · エクスポートカテゴリ zh
銘柄:未指定
コミュニティ投票:+0 /0 · ⭐ 0 重要 · 💬 0 コメント
GPT-5.5 正式リリース:6週間でのイテレーション、科学研究応用を主軸に、コードテストで最高記録を更新 | Feel.Trading