GPT-5.5 chính thức ra mắt: lặp lại sau sáu tuần, tập trung vào ứng dụng nghiên cứu khoa học, kiểm thử mã nguồn đạt đỉnh cao mới

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1471 từ

OpenAI đã phát hành GPT-5.5 vào ngày 23, chỉ sáu tuần sau khi GPT-5.4 ra mắt. Phiên bản tiêu chuẩn đạt 82,7% trong bài kiểm tra lập trình Terminal-Bench 2.0, trong khi phiên bản Pro đạt 39,6% trong các bài toán toán học cấp độ sau tiến sĩ FrontierMath Tier 4. (Tóm tắt trước đó: Tổng hợp toàn bộ buổi ra mắt GPT-5 mạnh nhất của OpenAI: Mở miễn phí, các điểm nổi bật về tính năng, giá API của gpt-5, gpt-5-mini và gpt-5-nano) (Bổ sung bối cảnh: Năm phút để hiểu GPT-5》Khác biệt gì với ChatGPT 4o? Ít ảo tưởng hơn và biết nghe lời, tổng hợp giá API) GPT-5.5 đã lên sóng vào ngày 23 tháng 4, chỉ đúng sáu tuần sau phiên bản trước đó là GPT-5.4. OpenAI định vị lần phát hành này là "mô hình thông minh và trực quan nhất hiện nay", nhấn mạnh rằng so với GPT-5.4, nó "suy nghĩ nhanh hơn và chính xác hơn với ít token hơn". Trong tiêu chuẩn lập trình Terminal-Bench 2.0, GPT-5.5 bản tiêu chuẩn đạt 82,7%, trong khi Claude Opus 4.7 đạt 69,4% trong cùng bài kiểm tra, khoảng cách là khoảng 13 điểm phần trăm. Trong các tác vụ tối ưu hóa cơ sở hạ tầng, tốc độ tạo token của GPT-5.5 tăng hơn 20%, đồng nghĩa với việc cải thiện hiệu quả chi phí trong xử lý ngữ cảnh dài và quy trình làm việc nhiều bước. Trọng tâm khác biệt của phiên bản Pro là suy luận toán học. FrontierMath Tier 4 là bộ đánh giá toán học khó nhất được ngành công nhận, với cấp độ câu hỏi ở trình độ nghiên cứu sau tiến sĩ, các chuyên gia con người có thể mất vài ngày để giải quyết. GPT-5.5 Pro đạt 39,6% trong bài kiểm tra này, trong khi Claude Opus 4.7 đạt 22,9%, khoảng cách gần 17 điểm phần trăm. Một con số đáng chú ý khác: Trong tiêu chuẩn tác vụ kinh tế GDPval, GPT-5.5 bản tiêu chuẩn đạt 84,9%, thậm chí cao hơn bản Pro. Kết quả này cho thấy trong các kịch bản công việc tri thức phổ thông, bản tiêu chuẩn đã là đủ và có lợi thế về chi phí; giá trị khác biệt của bản Pro tập trung nhiều hơn vào các tác vụ suy luận cường độ cao, thay vì bao phủ diện rộng. OpenAI cũng chỉ ra rằng GPT-5.5 đã có sự cải thiện đáng kể về khả năng "computer use": có thể tự chủ điều khiển giao diện phần mềm, xử lý quy trình làm việc nhiều bước và cần ít sự can thiệp của người dùng hơn trong các tác vụ agentic. Đây là trọng tâm tường thuật khá bất thường trong lần phát hành này, là tuyên bố chính thức về việc đã đạt được "tiến bộ thực chất trong quy trình làm việc nghiên cứu khoa học và công nghệ", đồng thời đặc biệt đề cập đến kịch bản khám phá thuốc, cho biết GPT-5.5 có thể giúp các nhà khoa học chuyên gia đạt được tiến bộ. Có một trường hợp được trích dẫn cụ thể: một phiên bản GPT-5.5 tùy chỉnh đã hỗ trợ các nhà nghiên cứu tìm ra chứng minh mới cho toán học tổ hợp của số Ramsey. Bài toán số Ramsey là một bài toán hóc búa trong lĩnh vực toán học thuần túy suốt nhiều thập kỷ qua, việc trường hợp này được OpenAI trực tiếp đưa ra trong bài viết phát hành chính thức cho thấy đây không phải là một minh chứng bên lề, mà là tín hiệu định hướng cho thương mại hóa trong tương lai. Tại sao kịch bản nghiên cứu khoa học lại được nhấn mạnh như vậy? Đằng sau đó là logic kinh doanh rõ ràng: các doanh nghiệp dược phẩm, phòng thí nghiệm vật liệu, tổ chức nghiên cứu khoa học là nhóm người dùng sẵn sàng chi trả chi phí tính toán cao; giá của bản Pro cao hơn nhiều so với bản tiêu chuẩn, nhưng hiện chỉ mở cho người đăng ký Business và Enterprise. Thông qua định giá khác biệt, OpenAI thực tế đang vận hành các kịch bản nghiên cứu như một SKU cao cấp, thay vì mở cửa phổ cập. Hiện tại, GPT-5.5 đã mở cho người dùng Plus, Pro, Business và Enterprise ngay trong ngày, GPT-5.5 Pro giới hạn cho Business và Enterprise, API sẽ "sớm ra mắt". Hiệu suất của bản tiêu chuẩn trong GDPval cho thấy nó

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản5 tin

2026-04-24

DeepSeek V4 ra mắt, khả năng lập trình có thể đánh bại GPT và Claude không? Chi phí lại một lần nữa đứng đầu bảng xếp hạng

Độ tương đồng 120%關鍵字 gpt同分類 zh

2026-04-24

Jensen Huang gửi thư nội bộ: Bắt buộc 10.000 nhân viên NVIDIA chuyển sang sử dụng OpenAI Codex, GPT-5.5 chạy trên chip GB200

Độ tương đồng 120%關鍵字 gpt同分類 zh

2026-04-24

Jensen Huang gửi thư toàn thể nhân viên ủng hộ OpenAI Codex: Hơn 10.000 nhân viên NVIDIA đã bắt đầu sử dụng, GPT-5.5 đang chạy trên GB200

Độ tương đồng 120%關鍵字 gpt同分類 zh

2026-04-23