Danh sách tinQwen3.6-27B ra mắt mã nguồn mở "Lựa chọn hàng đầu cho Openclaw, Hermes": Hiệu suất AI ngang bằng Claude Opus 4.5 với chi phí giảm 14 lần
動區 BlockTempo2026-04-23 06:04:06

Qwen3.6-27B ra mắt mã nguồn mở "Lựa chọn hàng đầu cho Openclaw, Hermes": Hiệu suất AI ngang bằng Claude Opus 4.5 với chi phí giảm 14 lần

ORIGINALQwen3.6-27B 開源發表「Openclaw、Hermes首選」:AI 表現打平Claude Opus 4.5 成本縮 14 倍
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯2710 từ
Dòng flagship mới nhất thuộc series Qwen của Alibaba là Qwen3.6-27B đã chính thức được mã nguồn mở vào tối ngày 22 tháng 4 năm 2026. Mô hình 27B dense này đạt 59,3 điểm trên Terminal-Bench 2.0, ngang bằng với Claude 4.5 Opus, đồng thời với số lượng tham số chưa đến 1/14, nó đã vượt qua flagship 397B MoE thế hệ trước với 77,2 điểm trên SWE-bench Verified (so với 76,2 điểm). Mô hình đầy đủ nặng 55,6 GB, sau khi lượng tử hóa Q4_K_M giảm xuống còn 16,8 GB, có thể chạy trên phần cứng tiêu dùng, giúp các framework agent cục bộ như OpenClaw, Hermes Agent lần đầu tiên sở hữu một bộ não cục bộ thực sự hữu dụng. (Tóm tắt trước đó: Bị Anthropic điểm danh phong tỏa, OpenClaw khuyến nghị người dùng chuyển sang sử dụng API Key hoặc chuyển sang các phương án thay thế như Qwen, Kimi) (Bối cảnh bổ sung: AI của Mỹ cần "kiểm duyệt" và nhốt vào phòng thí nghiệm! Trong khi Trung Quốc toàn lực tung ra các mô hình mã nguồn mở, tại sao lại như vậy?) Tối ngày 22 tháng 4 năm 2026, đội ngũ Qwen của Alibaba đã lặng lẽ tung ra một quả bom trên Hugging Face: Qwen3.6-27B chính thức mã nguồn mở, giấy phép Apache 2.0, bất kỳ ai cũng có thể tự do sử dụng cho mục đích thương mại. Những con số tưởng chừng bình thường nhưng ý nghĩa đằng sau lại không hề tầm thường — kiến trúc 27B dense (không phải MoE), lần đầu tiên trong các bài kiểm tra agent đầu cuối đã bắt kịp flagship đóng Claude 4.5 Opus của Anthropic, đồng thời với dung lượng 55,6 GB, nó đã đánh bại con quái vật 397B MoE thế hệ trước vốn cần tới 807 GB VRAM để chạy hoàn chỉnh. Triển khai cục bộ, agent chạy được, phần cứng tiêu dùng chứa được, Qwen3.6-27B đáp ứng đầy đủ cả ba điều kiện. Đội ngũ Qwen đã chọn 10 bài kiểm tra tiêu chuẩn phản ánh khả năng lập trình agent thực tế, kết quả của Qwen3.6-27B như sau: Ba kết luận then chốt đáng được nhấn mạnh riêng: Thứ nhất, Terminal-Bench 2.0 đạt 59,3 điểm ngang bằng Claude 4.5 Opus — đây là lần đầu tiên một mô hình 27B dense bắt kịp flagship đóng của Anthropic trong các tác vụ agent đầu cuối, trong khi phiên bản cũ Qwen3.5-27B chỉ đạt 41,6, đồng nghĩa với việc cải thiện 17,7 điểm trong một thế hệ. Thứ hai, SWE-bench Verified đạt 77,2 điểm vượt qua 76,2 điểm của Qwen3.5-397B-A17B — 27B dense đã đánh bại flagship 397B MoE thế hệ trước, dung lượng mô hình giảm từ 807 GB xuống còn 55,6 GB, thu nhỏ hơn 14 lần. Thứ ba, SkillsBench tăng từ 27,2 lên 48,2 (+77%), Claw-Eval Pass^3 đạt 60,6 vượt qua 59,6 của Claude 4.5 Opus — tính nhất quán qua nhiều vòng, nhiều bước là nâng cấp lớn nhất lần này, cho thấy mô hình không dễ bị sụp đổ hoặc đi chệch hướng khi thực hiện liên tục các tác vụ agent phức tạp. Về kiến thức và suy luận cũng rất ấn tượng: MMLU-Pro 86.2, MMLU-Redux 93.5, GPQA Diamond 87.8, AIME 2026 94.1, LiveCodeBench v6 83.9, vượt trội toàn diện so với thế hệ trước cùng số lượng tham số. Qwen3.6-27B là kiến trúc thuần dense, số lượng tham số 27B không phải là tham số active của MoE, mà là tham số thực tế được kích hoạt đầy đủ mỗi khi suy luận. Độ dài context gốc là 262.144 tokens, thông qua mở rộng YaRN có thể đạt tối đa 1.010.000 tokens (khoảng 1M), đây là thông số kỹ thuật cần thiết cho
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản3 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:038ec11992
Nguồn:動區 BlockTempo
Đăng:2026-04-23 06:04:06
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận
Qwen3.6-27B ra mắt mã nguồn mở "Lựa chọn hàng đầu cho Openclaw, Hermes": Hiệu suất AI ngang bằng Claude Opus 4.5 với chi phí giảm 14 lần | Feel.Trading