Danh sách tinGPT-5.5 chính thức ra mắt: lặp lại sau sáu tuần, tập trung vào ứng dụng nghiên cứu khoa học, kiểm thử mã nguồn đạt đỉnh cao mới
動區 BlockTempo2026-04-24 02:35:34

GPT-5.5 chính thức ra mắt: lặp lại sau sáu tuần, tập trung vào ứng dụng nghiên cứu khoa học, kiểm thử mã nguồn đạt đỉnh cao mới

ORIGINALGPT-5.5 正式發布:六週迭代、主攻科研應用、程式碼測試破頂
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1471 từ
OpenAI đã phát hành GPT-5.5 vào ngày 23, chỉ sáu tuần sau khi GPT-5.4 ra mắt. Phiên bản tiêu chuẩn đạt 82,7% trong bài kiểm tra lập trình Terminal-Bench 2.0, trong khi phiên bản Pro đạt 39,6% trong các bài toán toán học cấp độ sau tiến sĩ FrontierMath Tier 4. (Tóm tắt trước đó: Tổng hợp toàn bộ buổi ra mắt GPT-5 mạnh nhất của OpenAI: Mở miễn phí, các điểm nổi bật về tính năng, giá API của gpt-5, gpt-5-mini và gpt-5-nano) (Bổ sung bối cảnh: Năm phút để hiểu GPT-5》Khác biệt gì với ChatGPT 4o? Ít ảo tưởng hơn và biết nghe lời, tổng hợp giá API) GPT-5.5 đã lên sóng vào ngày 23 tháng 4, chỉ đúng sáu tuần sau phiên bản trước đó là GPT-5.4. OpenAI định vị lần phát hành này là "mô hình thông minh và trực quan nhất hiện nay", nhấn mạnh rằng so với GPT-5.4, nó "suy nghĩ nhanh hơn và chính xác hơn với ít token hơn". Trong tiêu chuẩn lập trình Terminal-Bench 2.0, GPT-5.5 bản tiêu chuẩn đạt 82,7%, trong khi Claude Opus 4.7 đạt 69,4% trong cùng bài kiểm tra, khoảng cách là khoảng 13 điểm phần trăm. Trong các tác vụ tối ưu hóa cơ sở hạ tầng, tốc độ tạo token của GPT-5.5 tăng hơn 20%, đồng nghĩa với việc cải thiện hiệu quả chi phí trong xử lý ngữ cảnh dài và quy trình làm việc nhiều bước. Trọng tâm khác biệt của phiên bản Pro là suy luận toán học. FrontierMath Tier 4 là bộ đánh giá toán học khó nhất được ngành công nhận, với cấp độ câu hỏi ở trình độ nghiên cứu sau tiến sĩ, các chuyên gia con người có thể mất vài ngày để giải quyết. GPT-5.5 Pro đạt 39,6% trong bài kiểm tra này, trong khi Claude Opus 4.7 đạt 22,9%, khoảng cách gần 17 điểm phần trăm. Một con số đáng chú ý khác: Trong tiêu chuẩn tác vụ kinh tế GDPval, GPT-5.5 bản tiêu chuẩn đạt 84,9%, thậm chí cao hơn bản Pro. Kết quả này cho thấy trong các kịch bản công việc tri thức phổ thông, bản tiêu chuẩn đã là đủ và có lợi thế về chi phí; giá trị khác biệt của bản Pro tập trung nhiều hơn vào các tác vụ suy luận cường độ cao, thay vì bao phủ diện rộng. OpenAI cũng chỉ ra rằng GPT-5.5 đã có sự cải thiện đáng kể về khả năng "computer use": có thể tự chủ điều khiển giao diện phần mềm, xử lý quy trình làm việc nhiều bước và cần ít sự can thiệp của người dùng hơn trong các tác vụ agentic. Đây là trọng tâm tường thuật khá bất thường trong lần phát hành này, là tuyên bố chính thức về việc đã đạt được "tiến bộ thực chất trong quy trình làm việc nghiên cứu khoa học và công nghệ", đồng thời đặc biệt đề cập đến kịch bản khám phá thuốc, cho biết GPT-5.5 có thể giúp các nhà khoa học chuyên gia đạt được tiến bộ. Có một trường hợp được trích dẫn cụ thể: một phiên bản GPT-5.5 tùy chỉnh đã hỗ trợ các nhà nghiên cứu tìm ra chứng minh mới cho toán học tổ hợp của số Ramsey. Bài toán số Ramsey là một bài toán hóc búa trong lĩnh vực toán học thuần túy suốt nhiều thập kỷ qua, việc trường hợp này được OpenAI trực tiếp đưa ra trong bài viết phát hành chính thức cho thấy đây không phải là một minh chứng bên lề, mà là tín hiệu định hướng cho thương mại hóa trong tương lai. Tại sao kịch bản nghiên cứu khoa học lại được nhấn mạnh như vậy? Đằng sau đó là logic kinh doanh rõ ràng: các doanh nghiệp dược phẩm, phòng thí nghiệm vật liệu, tổ chức nghiên cứu khoa học là nhóm người dùng sẵn sàng chi trả chi phí tính toán cao; giá của bản Pro cao hơn nhiều so với bản tiêu chuẩn, nhưng hiện chỉ mở cho người đăng ký Business và Enterprise. Thông qua định giá khác biệt, OpenAI thực tế đang vận hành các kịch bản nghiên cứu như một SKU cao cấp, thay vì mở cửa phổ cập. Hiện tại, GPT-5.5 đã mở cho người dùng Plus, Pro, Business và Enterprise ngay trong ngày, GPT-5.5 Pro giới hạn cho Business và Enterprise, API sẽ "sớm ra mắt". Hiệu suất của bản tiêu chuẩn trong GDPval cho thấy nó
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản5 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:6f31e7235a
Nguồn:動區 BlockTempo
Đăng:2026-04-24 02:35:34
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận
GPT-5.5 chính thức ra mắt: lặp lại sau sáu tuần, tập trung vào ứng dụng nghiên cứu khoa học, kiểm thử mã nguồn đạt đỉnh cao mới | Feel.Trading