Danh sách tinAI mới của Baidu đã vượt qua các mô hình hàng đầu và chi phí xây dựng thấp hơn 94%
Decrypt2026-05-11 20:46:16

AI mới của Baidu đã vượt qua các mô hình hàng đầu và chi phí xây dựng thấp hơn 94%

ORIGINALBaidu's New AI Is Already Beating Top Models and Cost 94% Less to Build
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯4378 từ
Tóm tắt - Baidu cho biết chi phí tiền huấn luyện của ERNIE 5.1 chỉ bằng 6% so với các mô hình AI tương đương. - Mặc dù vậy, mô hình này vẫn xếp thứ tư trên toàn cầu trên bảng xếp hạng LMArena Search. - Baidu đã nén mô hình xuống còn khoảng một phần ba tổng số tham số so với phiên bản tiền nhiệm, ERNIE 5.0, mà không làm giảm hiệu suất ở cấp độ hàng đầu. Baidu, công ty tương đương với Google tại Trung Quốc, đã chính thức phát hành ERNIE 5.1 vào cuối tuần trước, và con số tiêu đề rất khó để bỏ qua: Chi phí huấn luyện mô hình này thấp hơn khoảng 94% so với các hệ thống AI tương đương ở cùng quy mô. Để dễ hình dung, việc huấn luyện một mô hình AI tiên phong thường tiêu tốn hàng triệu (nếu không muốn nói là hàng tỷ) đô la cho điện toán. Baidu, công ty kiểm soát hơn 76% thị trường tìm kiếm của Trung Quốc và giao dịch trên Nasdaq với mã BIDU, tuyên bố rằng họ đã đạt được hiệu suất cùng đẳng cấp với khoảng một phần hai mươi chi phí đó. Thủ thuật này được gọi là "tiền huấn luyện đàn hồi đa chiều" (multi-dimensional elastic pre-training). Thay vì xây dựng ERNIE 5.1 từ đầu, Baidu đã trích xuất một mạng con được tối ưu hóa từ kiến trúc ERNIE 5.0 hiện có—được phát hành vào tháng 1 năm 2026—và nén nó lại. Tổng số tham số giảm xuống còn khoảng một phần ba so với bản gốc. Các tham số hoạt động (những tham số thực sự thực hiện công việc trong quá trình hội thoại) đã bị cắt giảm một nửa. Kết quả là một mô hình tinh gọn hơn, kế thừa cơ sở tri thức của mô hình lớn hơn mà không cần lặp lại toàn bộ chi phí huấn luyện. Trên LMArena Search Arena—một bảng xếp hạng nơi người dùng thực so sánh các mô hình AI trên các tác vụ tìm kiếm web trực tiếp, được chấm điểm dựa trên sở thích của con người—ERNIE 5.1 đạt 1.223 điểm, đứng thứ tư toàn cầu và đứng đầu trong số tất cả các mô hình của Trung Quốc. Khả năng tác nhân (agentic capabilities) của nó—cách nó xử lý các tác vụ nhiều bước như điền vào bảng tính hoặc tự động duyệt web—đã vượt qua DeepSeek-V4-Pro, chuẩn mực trước đó của Trung Quốc. ERNIE có thể nghe như một cái tên xa lạ đối với các nhà quan sát phương Tây, nhưng thực tế đây là một mô hình lớn tại Trung Quốc. Baidu đã ra mắt Ernie Bot vào tháng 8 năm 2023, và chatbot này đã đạt 100 triệu người dùng tại Trung Quốc vào tháng 12 cùng năm—nhanh hơn hầu hết các đối thủ Trung Quốc, mặc dù vẫn chậm hơn kỷ lục toàn cầu hai tháng của ChatGPT để đạt được cột mốc tương tự. Góc độ hiệu quả này gợi nhớ đến những gì DeepSeek đã làm với ngành công nghiệp AI vào tháng 1 năm 2025. Khi startup Trung Quốc này phát hành R1—một mô hình sánh ngang với o1 của OpenAI với chi phí truy vấn thấp hơn 98%—nó đã gây ra sự sụt giảm 600 tỷ USD giá trị thị trường của Nvidia và buộc mọi phòng thí nghiệm AI lớn phải suy nghĩ lại liệu việc đổ tiền vào điện toán có phải là chiến lược khả thi duy nhất hay không. ERNIE 5.1 là một câu chuyện hiệu quả khác—về phía huấn luyện thay vì suy luận—nhưng thông điệp cơ bản vẫn giống nhau: Các phòng thí nghiệm Trung Quốc liên tục tìm ra cách để làm được nhiều hơn với ít tài nguyên hơn. Quy trình hậu huấn luyện cũng đáng chú ý. Baidu đã xây dựng một hệ thống học tăng cường bốn giai đoạn mà họ gọi là MOPD (Multi-Teacher On-Policy Distillation). Thay vì cố gắng dạy mọi kỹ năng cùng một lúc—điều thường gây ra "hiệu ứng bập bênh" (seesaw effects) như việc cải thiện hiệu suất toán học làm giảm khả năng viết sáng tạo—Baidu đã huấn luyện các mô hình chuyên gia song song cho các tác vụ mã hóa, lập luận và tác nhân, sau đó chưng cất tất cả chúng thành một mô hình thống nhất duy nhất. Một giai đoạn học tăng cường trực tuyến cuối cùng đã xử lý các cuộc hội thoại mở và đầu ra sáng tạo, bảo tồn những gì quá trình chưng cất không thể nắm bắt tốt. Về lý
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:33e5487b0b
Nguồn:Decrypt
Đăng:2026-05-11 20:46:16
Danh mục:Chung · Danh mục xuất neutral
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận
AI mới của Baidu đã vượt qua các mô hình hàng đầu và chi phí xây dựng thấp hơn 94% | Feel.Trading