Daftar beritaOpenAI meluncurkan ChatGPT Images 2.0: Peningkatan besar pada rendering teks, mendukung pembuatan banyak gambar, namun "pembuatan bahasa Mandarin" masih terkendala
動區 BlockTempo2026-04-21 18:29:43

OpenAI meluncurkan ChatGPT Images 2.0: Peningkatan besar pada rendering teks, mendukung pembuatan banyak gambar, namun "pembuatan bahasa Mandarin" masih terkendala

ORIGINALOpenAI 推出 ChatGPT Images 2.0:文字渲染大進化、支援多圖生成,但「中文生成」仍卡關
Analisis Dampak AIGrok sedang menganalisis...
📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯1394 kata
AI Drawing berevolusi lagi! OpenAI secara resmi meluncurkan model pembuatan gambar baru "ChatGPT Images 2.0" pada hari Selasa ini. Model baru ini secara signifikan memperkuat kemampuan "penalaran" (reasoning) dan teknologi "rendering teks". Pengguna sekarang dapat menghasilkan beberapa gambar sekaligus, menyesuaikan rasio aspek yang ekstrem, dan bahkan menghasilkan kata-kata bahasa Inggris secara akurat di dalam gambar. Namun, pengujian oleh media asing menemukan bahwa saat menangani teks non-Inggris seperti bahasa Mandarin, model ini masih menghasilkan "kode acak AI" yang sulit dikenali. (Konteks sebelumnya: Hanya bertahan 3 bulan! OpenAI secara mendadak menutup platform penulisan riset ilmiah Prism, beralih strategi "tidak lagi mengerjakan proyek sampingan") (Latar belakang tambahan: Tokoh di balik layar ChatGPT, Srinivas Narayanan, mengundurkan diri dari OpenAI, tiga eksekutif telah keluar dalam seminggu) ChatGPT Images 2.0, dan menyediakan versi komputasi yang lebih kuat bagi pelanggan berbayar. Medan perang pembuatan gambar kembali memanas. OpenAI mengumumkan pada hari Selasa (tanggal 21) peluncuran model AI pembuatan gambar baru untuk pengguna ChatGPT dan Codex global — pembaruan besar kali ini tidak hanya menghadirkan performa visual yang lebih detail, tetapi juga mencoba menyelesaikan masalah "rendering teks" yang paling menyulitkan dalam pembuatan gambar AI di masa lalu. Menggabungkan kemampuan penalaran, satu prompt dapat menghasilkan banyak gambar Dibandingkan dengan model sebelumnya, terobosan terbesar Images 2.0 terletak pada integrasinya dengan kemampuan "penalaran" (reasoning) ChatGPT yang kuat. Ini berarti sebelum menghasilkan gambar, AI akan melakukan lebih banyak langkah berpikir, bahkan dapat terhubung ke internet untuk mencari informasi terbaru (basis pengetahuan dasar model ini berakhir pada Desember 2025). Peningkatan fitur utama dari model baru ini meliputi: - Pembuatan multi-gambar berkelanjutan: Pengguna hanya perlu memasukkan Prompt satu kali untuk membuat serangkaian gambar, misalnya konten visual untuk seluruh buku panduan belajar. - Ukuran yang sangat dapat disesuaikan: Mendobrak batasan rasio tradisional, model baru ini mendukung rasio aspek dari 3:1 (sangat lebar) hingga 1:3 (sangat tinggi), pengguna dapat menentukan ukuran yang diinginkan langsung di dalam Prompt. - Infografis yang lebih detail: Saat media asing menguji dengan meminta pembuatan infografis "Prakiraan cuaca besok di San Francisco dan kegiatan yang direkomendasikan", AI berhasil menggabungkan detail cuaca dengan landmark lokal (seperti Ferry Building, Castro Theatre, Transamerica Pyramid) secara akurat dalam satu gambar. Ejaan bahasa Inggris lulus dengan sempurna, tetapi "poster bahasa Mandarin" menjadi kode acak Dalam beberapa tahun terakhir, ketika model arus utama mencoba menghasilkan teks dalam gambar, mereka sering kali menghasilkan karakter yang terdistorsi atau kata-kata dengan ejaan yang salah. Berdasarkan pengujian, Images 2.0 telah membuat kemajuan yang menakjubkan dalam rendering teks bahasa Inggris, kata-kata bahasa Inggris dalam gambar menjadi lebih jelas dan akurat. Namun, saat menantang bahasa non-Inggris, Images 2.0 masih terlihat kurang mampu. Penguji media asing meminta ChatGPT untuk meniru penggemar Tiongkok guna membuat "poster dukungan bahasa Mandarin" untuk aktor Hollywood Timothée Chalamet. Meskipun poster yang dihasilkan memiliki daya tarik visual yang kuat (termasuk elemen seperti pakaian tradisional, telinga kucing, bubble tea, dan panda), dan gambar tersebut dipenuhi dengan lebih dari 20 tempat teks, kata-kata tersebut tidak dapat dibaca. Ketika penguji bertanya balik kepada ChatGPT apa arti kata-kata tersebut, AI justru menunjukkan kemampuan "kritik diri" yang sangat kuat dan menjawab dengan jujur: "Sebagian besar dari ini palsu, atau omong kosong AI yang menyamar sebagai poster meme bahasa Mandarin, sehingga tidak dapat diterjemahkan dengan lancar sepenuhnya. Ada juga beberapa tempat yang jelas terdistorsi, atau bercampur dengan karakter yang terlihat seperti bahasa Jepang... Sebagian besar ini adalah simbol tidak berarti yang dibuat untuk meniru perasaan teks editan penggemar Asia Timur, bukan kalimat yang akurat." Singkatnya, ChatGPT Images 2.0 telah menunjukkan kekuatan yang kuat dalam keragaman fungsi dan pemrosesan bahasa Inggris, yang tidak diragukan lagi membawa peningkatan substansial pada alat produktivitas. Adapun "pembuatan multi-bahasa yang akurat" yang dinanti-nantikan oleh pengguna global, mungkin masih perlu menunggu OpenAI memperkuatnya melalui data global yang lebih besar di versi mendatang.
Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)
🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita
💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang
Informasi mentah
ID:b6f0f51663
Sumber:動區 BlockTempo
Diterbitkan:2026-04-21 18:29:43
Kategori:zh_news · Kategori ekspor zh
Aset:Tidak ditentukan
Voting komunitas:+0 /0 · ⭐ 0 Penting · 💬 0 Komentar