Daftar beritaQwen3.6-27B dirilis secara open-source "Pilihan utama Openclaw, Hermes": Performa AI setara Claude Opus 4.5 dengan biaya 14 kali lebih hemat
動區 BlockTempo2026-04-23 06:04:06

Qwen3.6-27B dirilis secara open-source "Pilihan utama Openclaw, Hermes": Performa AI setara Claude Opus 4.5 dengan biaya 14 kali lebih hemat

ORIGINALQwen3.6-27B 開源發表「Openclaw、Hermes首選」:AI 表現打平Claude Opus 4.5 成本縮 14 倍
Analisis Dampak AIGrok sedang menganalisis...
📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯2710 kata
Seri flagship terbaru Alibaba Qwen, Qwen3.6-27B, resmi dirilis secara open source pada malam 22 April 2026. Model 27B dense ini mencetak skor 59,3 di Terminal-Bench 2.0, menyamai Claude 4.5 Opus, dan dengan jumlah parameter kurang dari 1/14, ia melampaui flagship MoE 397B generasi sebelumnya yang mencetak 76,2 dengan skor 77,2 di SWE-bench Verified. Model lengkap berukuran 55,6 GB, dan dengan kuantisasi Q4_K_M dapat ditekan hingga 16,8 GB sehingga dapat dijalankan pada perangkat keras kelas konsumen, memungkinkan framework agent lokal seperti OpenClaw dan Hermes Agent untuk pertama kalinya memiliki otak lokal yang benar-benar layak digunakan. (Ringkasan: Setelah ditegur dan diblokir oleh Anthropic, OpenClaw menyarankan pengguna untuk beralih menggunakan API Key atau beralih ke alternatif seperti Qwen atau Kimi) (Latar belakang: AI Amerika perlu "disensor" dan dikurung di laboratorium! Sementara Tiongkok mengerahkan segalanya untuk model open source, mengapa demikian?) Pada malam 22 April 2026, tim Alibaba Qwen diam-diam menjatuhkan bom di Hugging Face: Qwen3.6-27B resmi dirilis secara open source dengan lisensi Apache 2.0, bebas digunakan secara komersial oleh siapa saja. Angkanya tampak biasa, namun maknanya luar biasa—arsitektur 27B dense (bukan MoE) ini untuk pertama kalinya dalam pengujian agent terminal menyamai flagship tertutup Anthropic, Claude 4.5 Opus, sekaligus dengan ukuran 55,6 GB, mengalahkan monster MoE 397B generasi sebelumnya yang membutuhkan 807 GB VRAM untuk dijalankan sepenuhnya. Deployment lokal, agent yang bisa berjalan, dan muat di perangkat keras kelas konsumen, ketiga syarat tersebut dipenuhi sepenuhnya oleh Qwen3.6-27B. Tim Qwen memilih 10 benchmark yang mencerminkan kemampuan pemrograman agent yang nyata, dengan hasil Qwen3.6-27B sebagai berikut: Tiga kesimpulan kunci layak disorot secara terpisah: Pertama, Terminal-Bench 2.0 59,3 menyamai Claude 4.5 Opus—ini adalah pertama kalinya model 27B dense mengejar flagship tertutup Anthropic dalam tugas agent terminal, sementara versi lama Qwen3.5-27B hanya mencetak 41,6, yang berarti peningkatan 17,7 poin dalam satu generasi. Kedua, SWE-bench Verified 77,2 melampaui 76,2 milik Qwen3.5-397B-A17B—27B dense mengalahkan flagship MoE 397B generasi sebelumnya, dengan ukuran model menyusut dari 807 GB menjadi 55,6 GB, pengurangan lebih dari 14 kali lipat. Ketiga, SkillsBench melonjak dari 27,2 ke 48,2 (+77%), dan Claw-Eval Pass^3 dengan 60,6 melampaui 59,6 milik Claude 4.5 Opus—konsistensi multi-putaran dan multi-langkah adalah peningkatan terbesar kali ini, yang berarti model tidak mudah rusak atau melenceng saat menjalankan tugas agent yang kompleks secara terus-menerus. Dalam hal pengetahuan dan penalaran, hasilnya juga sangat memukau: MMLU-Pro 86,2, MMLU-Redux 93,5, GPQA Diamond 87,8, AIME 2026 94,1, LiveCodeBench v6 83,9, semuanya melampaui generasi sebelumnya dengan jumlah parameter yang sama. Qwen3.6-27B adalah arsitektur pure dense, jumlah parameter 27B bukanlah parameter aktif MoE, melainkan parameter nyata yang diaktifkan sepenuhnya setiap kali inferensi dilakukan. Panjang context asli adalah 262.144 tokens, dan melalui ekstensi YaRN dapat mencapai hingga 1.010.000 tokens (sekitar 1M), yang merupakan spesifikasi kebutuhan mendesak bagi coding agent yang memerlukan analisis dokumen panjang atau pemahaman lintas repositori. Model presisi penuh berukuran 55,6 GB, jika menggunakan kuantisasi Q4_K_M, ukurannya terkompresi menjadi 16,8 GB, sehingga Mac seri M dengan 24 GB VRAM atau GPU kelas konsumen dapat memuatnya secara langsung. Lisensinya adalah Apache 2.0, tanpa biaya lisensi
Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)
🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset3 berita
💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang
Informasi mentah
ID:038ec11992
Sumber:動區 BlockTempo
Diterbitkan:2026-04-23 06:04:06
Kategori:zh_news · Kategori ekspor zh
Aset:Tidak ditentukan
Voting komunitas:+0 /0 · ⭐ 0 Penting · 💬 0 Komentar