GPT-5.5 resmi dirilis: iterasi enam minggu, fokus pada aplikasi penelitian ilmiah, pengujian kode mencapai rekor tertinggi

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯1471 kata

OpenAI merilis GPT-5.5 pada tanggal 23, hanya enam minggu setelah peluncuran GPT-5.4. Versi standar mencetak skor 82,7% pada tes pemrograman Terminal-Bench 2.0, sementara versi Pro mencetak skor 39,6% pada soal matematika tingkat pascadoktoral FrontierMath Tier 4. (Ringkasan sebelumnya: Rangkuman lengkap konferensi pers GPT-5 terkuat OpenAI: akses gratis, sorotan fitur, gpt-5, gpt-5-mini, dan harga API gpt-5-nano) (Latar belakang tambahan: Lima menit untuk memahami GPT-5》Apa bedanya dengan ChatGPT 4o? Lebih sedikit halusinasi dan lebih patuh, rangkuman harga API) GPT-5.5 diluncurkan pada 23 April, hanya berselang enam minggu dari versi sebelumnya, GPT-5.4. OpenAI secara resmi memposisikan rilis ini sebagai "model paling cerdas dan paling intuitif saat ini", menekankan bahwa dibandingkan dengan GPT-5.4, model ini "berpikir lebih cepat dan lebih akurat dengan token yang lebih sedikit". Pada tolok ukur pemrograman Terminal-Bench 2.0, GPT-5.5 versi standar mencetak skor 82,7%, sedangkan Claude Opus 4.7 mencetak 69,4% pada tes yang sama, dengan selisih sekitar 13 poin persentase. Dalam tugas optimasi infrastruktur, kecepatan pembuatan token GPT-5.5 meningkat lebih dari 20%, yang berarti efisiensi biaya dalam pemrosesan konteks panjang dan alur kerja multi-langkah juga meningkat. Fokus diferensiasi versi Pro adalah penalaran matematika. FrontierMath Tier 4 adalah tolok ukur matematika yang diakui secara industri sebagai yang tersulit, dengan tingkat soal setara penelitian pascadoktoral yang mungkin membutuhkan waktu berhari-hari bagi pakar manusia untuk menyelesaikannya. GPT-5.5 Pro mencetak skor 39,6% dalam tes ini, sementara Claude Opus 4.7 mencetak 22,9%, dengan selisih mendekati 17 poin persentase. Angka lain yang patut diperhatikan: pada tolok ukur tugas ekonomi GDPval, GPT-5.5 versi standar mencetak skor 84,9%, justru lebih tinggi daripada versi Pro. Hasil ini menunjukkan bahwa dalam skenario pekerjaan berbasis pengetahuan umum, versi standar sudah cukup dan memiliki keunggulan biaya; nilai diferensiasi versi Pro lebih terfokus pada tugas penalaran intensitas tinggi, bukan pada cakupan luas. OpenAI juga menunjukkan bahwa GPT-5.5 memiliki peningkatan signifikan dalam kemampuan "computer use": mampu mengoperasikan antarmuka perangkat lunak secara mandiri, menangani alur kerja multi-langkah, dan membutuhkan lebih sedikit intervensi pengguna dalam tugas-tugas agentic. Ini adalah poin narasi yang tidak biasa dalam rilis kali ini, di mana pihak resmi menyatakan telah mencapai "kemajuan substansial dalam alur kerja penelitian sains dan teknologi", dan secara khusus menyebutkan skenario penemuan obat, dengan menyatakan bahwa GPT-5.5 dapat membantu ilmuwan ahli dalam mencapai kemajuan. Ada satu kasus yang dikutip secara spesifik: versi GPT-5.5 yang disesuaikan membantu para peneliti menemukan bukti baru dalam matematika kombinatorial untuk Ramsey number. Masalah Ramsey number adalah teka-teki sulit di bidang matematika murni selama beberapa dekade. Fakta bahwa kasus ini dapat diangkat langsung oleh OpenAI dalam teks rilis resmi menunjukkan bahwa ini bukan sekadar demonstrasi pinggiran, melainkan sinyal arah komersialisasi di masa depan. Mengapa skenario penelitian begitu ditekankan? Di baliknya terdapat logika bisnis yang jelas: perusahaan farmasi, laboratorium material, dan lembaga penelitian adalah kelompok berbayar yang dapat menerima biaya komputasi tinggi; harga versi Pro jauh lebih tinggi daripada versi standar, namun saat ini hanya dibuka untuk pelanggan Business dan Enterprise. Melalui penetapan harga yang berbeda, OpenAI sebenarnya sedang mengelola skenario penelitian sebagai SKU kelas atas, bukan sebagai akses yang bersifat inklusif. Saat ini, GPT-5.5 dibuka mulai hari ini untuk pengguna Plus, Pro, Business, dan Enterprise, dengan GPT-5.5 Pro terbatas untuk Business dan Enterprise, sementara akses API akan "segera hadir". Performa versi standar pada GDPval menunjukkan bahwa model tersebut sudah cukup untuk menangani sebagian besar pekerjaan berbasis pengetahuan; sementara versi Pro lebih diarahkan secara spesifik pada skenario perusahaan yang membutuhkan penalaran matematis intensitas tinggi. Ritme iterasi enam minggu adalah tekanan struktural. Ketika pesaing dapat meluncurkan delapan versi utama setiap tahun, jendela waktu untuk setiap ketertinggalan teknologi menjadi sangat singkat. Kecepatan rilis algoritma kini menjadi bagian

Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset5 berita

2026-04-24

DeepSeek V4 dirilis, apakah kemampuan pemrogramannya bisa mengalahkan GPT dan Claude? Biayanya kembali menduduki puncak daftar

Tingkat kemiripan 120%關鍵字 gpt同分類 zh

2026-04-24

Jensen Huang mengirim email internal: mewajibkan 10.000 karyawan NVIDIA untuk beralih menggunakan OpenAI Codex, GPT-5.5 dijalankan dengan chip GB200

Tingkat kemiripan 120%關鍵字 gpt同分類 zh

2026-04-24

Jensen Huang mengirim surat kepada seluruh karyawan untuk merangkul OpenAI Codex: lebih dari 10.000 karyawan NVIDIA telah menggunakannya, GPT-5.5 berjalan di atas GB200

Tingkat kemiripan 120%關鍵字 gpt同分類 zh

2026-04-23