OpenAI meluncurkan GPT-Image-2: Generasi visual yang mendominasi, desainer kali ini benar-benar akan kehilangan pekerjaan

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯7596 kata

GPT-Image-2 meluncur ke puncak papan peringkat dengan skor super tinggi, mewujudkan lompatan dari sekadar menggambar menjadi memiliki strategi bisnis dan logika tata letak melalui mode berpikir. (Pratinjau: OpenAI meluncurkan model khusus keamanan siber GPT-5.4-Cyber: telah menambal 3.000 kerentanan berisiko tinggi, menantang Claude Mythos) (Latar belakang: GPT-5 ditunda! OpenAI meluncurkan o3 dan o4-Mini terlebih dahulu, Sam Altman mengungkapkan: integrasi lebih sulit dari yang dibayangkan) Jika harus memberikan tinjauan bertahap untuk tahun 2025 OpenAI, banyak orang mungkin akan menggambarkannya sebagai sesuatu yang datar atau bahkan sedikit pasif. Selama lebih dari setahun terakhir, mereka memang telah menjalankan jalur penalaran logis selangkah demi selangkah, merilis model penalaran secara intensif mulai dari o3pro hingga o4mini, serta meluncurkan model dasar baru seperti GPT-4.5 dan GPT-5. Namun, di bidang pembuatan visual yang paling mudah dirasakan oleh pengguna umum dan paling mudah membentuk penyebaran spontan, pengaruh mereka secara bertahap menyusut. Setelah kejutan awal kemunculan Sora, OpenAI tampaknya memasuki periode hening yang panjang di jalur ini. Pada saat yang sama, pemain lain di meja permainan tidak tinggal diam. Dalam ekosistem sumber terbuka, model seperti Flux benar-benar menghancurkan ambang batas untuk pembuatan gambar lokal berkualitas tinggi; Di sisi komersial, tidak hanya ada lawan lama yang memegang hambatan estetika tertinggi, bahkan muncul pemain baru seperti Nano-banana yang dilengkapi dengan fungsi pencarian internet. Sebagai perbandingan, model pembuatan gambar utama OpenAI sebelumnya, GPT-Image-1.5, sudah lama tampak tidak berdaya: Tidak hanya kualitas gambar yang buruk, tata letak yang kaku, dan sering kali rusak saat menghadapi teks yang kompleks. Lambat laun, konsensus terbentuk di industri: OpenAI telah menemui hambatan teknis di jalur pembuatan visual, dan di bawah pengepungan berbagai produk pesaing, mereka tampak tidak berdaya. Hingga beberapa minggu yang lalu, titik balik muncul dengan cara yang sangat tersembunyi. Di platform pengujian buta model besar yang terkenal, LM Arena, sebuah model gambar misterius dengan kode nama Duct Tape (selotip) ditambahkan secara diam-diam. Pengguna yang berpartisipasi dalam pengujian buta segera menyadari ada sesuatu yang tidak beres: Model ini tidak hanya memiliki kontrol yang sangat presisi terhadap rasio aspek ekstrem, tetapi juga dapat menghasilkan poster tata letak yang berisi banyak teks multibahasa tanpa cacat, dan bahkan tampaknya memiliki proses perencanaan logis yang tidak terlihat sebelum gambar dihasilkan. Untuk sementara waktu, berbagai komunitas teknis berspekulasi tentang siapa yang diam-diam meluncurkan langkah besar ini, tetapi pihak OpenAI tetap bungkam. Dini hari tadi, kebenaran akhirnya terungkap. Tanpa konferensi pers yang panjang, tanpa pemanasan pemasaran yang luar biasa, OpenAI secara langsung menamai model kode nama Duct Tape ini sebagai ChatGPT GPT-Image-2, dan meluncurkannya sepenuhnya ke pasar. Bersamaan dengan itu, diumumkan pula papan peringkat arena Text-to-Image yang membuat orang merasa sedikit sesak. GPT-Image-2 langsung merebut juara dengan skor super tinggi 1512, memimpin 242 poin penuh dari tempat kedua (yaitu Nano-banana-2 yang memiliki fungsi pencarian internet). Dalam konteks skor model besar, orang biasanya akan membesar-besarkan keunggulan nol koma atau satu digit, dan skor antara model teratas sangat ketat. Kesenjangan keunggulan 242 poin adalah sesuatu yang belum pernah terjadi sebelumnya dalam sejarah arena. Ini sama sekali bukan iterasi versi kecil, ini adalah kesenjangan teknis yang kuat. Saya menghabiskan sebagian besar hari untuk memeriksa dengan cermat berbagai kemampuan batasnya serta dokumen antarmuka API terbaru. Perasaan terbesar hanya satu: OpenAI tetaplah OpenAI yang dulu. Ketika memutuskan untuk merebut kembali wilayah yang hilang, cara yang digunakannya adalah dengan langsung membentuk ulang aturan main. Di depan model ini, pekerjaan desain visual yang kita pikir masih membutuhkan dua atau tiga tahun untuk digantikan sepenuhnya oleh AI, hari ini pada dasarnya bisa dikatakan sudah berakhir. Untuk memahami mengapa GPT-Image-2 dapat membuka kesenjangan skor yang begitu berlebihan, kita harus terlebih dahulu mematahkan konsep tradisional tentang model teks-ke-gambar. Dulu kita menggunakan AI untuk menggambar, pada dasarnya adalah keberuntungan, melemparkan beberapa prompt ke dalamnya, dan menunggu ia menyusun piksel menjadi bentuk yang kita inginkan. Tetapi GPT-Image-2 lebih seperti agen cerdas dengan mesin

Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita

2026-04-25

OpenClaw Pembaruan Terbaru》GPT-image2 menggunakan OAuth tanpa API key, sub-agen tiga lapis bertingkat online

Tingkat kemiripan 170%關鍵字 image/gpt同分類 zh

2026-04-24

Jensen Huang mengirim email internal: mewajibkan 10.000 karyawan NVIDIA untuk beralih menggunakan OpenAI Codex, GPT-5.5 dijalankan dengan chip GB200

Tingkat kemiripan 170%關鍵字 openai/gpt同分類 zh

2026-04-24

Jensen Huang mengirim surat kepada seluruh karyawan untuk merangkul OpenAI Codex: lebih dari 10.000 karyawan NVIDIA telah menggunakannya, GPT-5.5 berjalan di atas GB200

Tingkat kemiripan 170%關鍵字 openai/gpt同分類 zh

2026-05-02