OpenAI tung ra GPT-Image-2: Tạo hình ảnh bằng AI đạt bước tiến vượt bậc, các nhà thiết kế lần này thực sự sắp thất nghiệp rồi

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯7596 từ

GPT-Image-2 hạ cánh xuống vị trí dẫn đầu bảng xếp hạng với số điểm cực cao, hiện thực hóa bước nhảy vọt từ vẽ tranh đơn thuần sang sở hữu chiến lược kinh doanh và logic dàn trang thông qua chế độ tư duy (Thinking Mode). (Tiền đề: OpenAI ra mắt mô hình chuyên dụng an ninh mạng GPT-5.4-Cyber: đã vá 3.000 lỗ hổng nguy hiểm, cạnh tranh với Claude Mythos) (Bối cảnh bổ sung: GPT-5 bị trì hoãn! OpenAI tung ra o3, o4-Mini trước, Sam Altman tự tiết lộ: việc tích hợp khó hơn tưởng tượng) Nếu phải đánh giá giai đoạn năm 2025 của OpenAI, nhiều người có lẽ sẽ dùng từ nhạt nhòa, thậm chí là hơi thụ động để mô tả. Trong hơn một năm qua, họ thực sự đã chạy theo lộ trình suy luận logic một cách bài bản, phát hành dày đặc các mô hình suy luận từ o3pro đến o4mini, đồng thời tung ra các mô hình nền tảng hoàn toàn mới như GPT-4.5 và GPT-5. Tuy nhiên, trong lĩnh vực tạo hình ảnh – nơi người dùng phổ thông dễ cảm nhận và dễ tạo ra sự lan truyền tự phát nhất, tầm ảnh hưởng của họ đang dần thu hẹp. Kể từ sau sự chấn động thời kỳ đầu khi Sora ra mắt, OpenAI dường như đã bước vào giai đoạn im lặng kéo dài trên đường đua này. Trong khi đó, những người chơi khác trên bàn cờ không hề ngồi yên. Trong hệ sinh thái mã nguồn mở, các mô hình như Flux đã hoàn toàn phá vỡ ngưỡng cửa tạo ảnh chất lượng cao tại chỗ; Về phía thương mại, không chỉ có những đối thủ cũ nắm giữ rào cản thẩm mỹ đỉnh cao, mà thậm chí còn xuất hiện những gương mặt mới đầy triển vọng như Nano-banana với tính năng tìm kiếm trực tuyến tích hợp. So sánh lại, mô hình tạo ảnh chủ lực trước đây của OpenAI là GPT-Image-1.5 từ lâu đã tỏ ra đuối sức: Không chỉ chất lượng hình ảnh kém, dàn trang cứng nhắc, mà còn thường xuyên "sập nguồn" khi đối mặt với văn bản phức tạp. Dần dần, một sự đồng thuận đã hình thành trong ngành: OpenAI đã gặp phải nút thắt kỹ thuật trong dòng tạo hình ảnh, và dưới sự bao vây của các sản phẩm cạnh tranh, họ đã tỏ ra bất lực. Cho đến vài tuần trước, bước ngoặt xuất hiện theo một cách rất kín đáo. Trên nền tảng đánh giá mù (blind test) các mô hình lớn nổi tiếng LM Arena, một mô hình hình ảnh bí ẩn với mật danh Duct Tape (băng dính) đã lặng lẽ được thêm vào. Người dùng tham gia đánh giá mù nhanh chóng phát hiện có điều gì đó không ổn: Mô hình này không chỉ kiểm soát cực kỳ chính xác các khung hình cực đoan, mà còn có thể xuất ra các poster dàn trang chứa lượng lớn văn bản đa ngôn ngữ mà không có bất kỳ lỗi nào, thậm chí trước khi xuất ảnh dường như còn có một quá trình lập kế hoạch logic vô hình. Trong chốc lát, các cộng đồng kỹ thuật đều đoán già đoán non đây là "tuyệt chiêu" của nhà nào vừa âm thầm tung ra, nhưng phía OpenAI vẫn giữ im lặng. Rạng sáng nay, sự thật cuối cùng đã được hé lộ. Không có buổi họp báo dài dòng, cũng không có sự chuẩn bị marketing rầm rộ, OpenAI trực tiếp đặt tên chính thức cho mô hình mật danh Duct Tape này là ChatGPT GPT-Image-2 và tung ra thị trường toàn diện. Đi kèm với đó là một bảng xếp hạng đấu trường Text-to-Image khiến người ta cảm thấy nghẹt thở. GPT-Image-2 giành chức vô địch với số điểm cực cao 1512, dẫn trước người đứng thứ hai (chính là Nano-banana-2 có tính năng tìm kiếm trực tuyến) tới 242 điểm. Trong bối cảnh chấm điểm các mô hình lớn, mọi người thường ca ngợi những sự vượt trội ở mức vài điểm lẻ hoặc số đơn vị, điểm số giữa các mô hình hàng đầu thường bám đuổi nhau cực kỳ sát sao. Một khoảng cách dẫn trước 242 điểm là điều chưa từng có trong lịch sử đấu trường. Đây hoàn toàn không phải là một bản cập nhật phiên bản nhỏ, đây là một sự đứt gãy kỹ thuật mạnh mẽ. Tôi đã dành hơn nửa ngày để xem xét kỹ lưỡng các khả năng cực hạn cũng như tài liệu giao diện API mới nhất của nó. Cảm nhận lớn nhất chỉ có một: OpenAI vẫn là OpenAI

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-04-25

Cập nhật mới nhất từ OpenClaw » GPT-image2 sử dụng OAuth không cần API key, đại lý phụ ba tầng lồng nhau đã trực tuyến

Độ tương đồng 170%關鍵字 image/gpt同分類 zh

2026-04-24

Jensen Huang gửi thư nội bộ: Bắt buộc 10.000 nhân viên NVIDIA chuyển sang sử dụng OpenAI Codex, GPT-5.5 chạy trên chip GB200

Độ tương đồng 170%關鍵字 openai/gpt同分類 zh

2026-04-24

Jensen Huang gửi thư toàn thể nhân viên ủng hộ OpenAI Codex: Hơn 10.000 nhân viên NVIDIA đã bắt đầu sử dụng, GPT-5.5 đang chạy trên GB200

Độ tương đồng 170%關鍵字 openai/gpt同分類 zh

2026-05-02