Daftar beritaMiMo 2.5 Pro AI baru Xiaomi dapat melihat, mendengar, dan bertindak—semuanya dalam satu model
Decrypt2026-04-22 19:42:35

MiMo 2.5 Pro AI baru Xiaomi dapat melihat, mendengar, dan bertindak—semuanya dalam satu model

ORIGINALXiaomi's New MiMo 2.5 Pro AI Can See, Hear, and Act—All in One Model
Analisis Dampak AIGrok sedang menganalisis...
📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯5703 kata
Singkatnya - Xiaomi meluncurkan MiMo-V2.5 dan V2.5-Pro, yang menggabungkan kemampuan teks, gambar, audio, dan video ke dalam satu model AI multimodal. - Versi Pro menyaingi model frontier teratas dalam tolok ukur pengodean dan agen, sekaligus meningkatkan efisiensi token dan biaya secara signifikan. - Model baru ini menandai dorongan AI yang cepat dari Xiaomi, dengan rencana sumber terbuka dan iterasi agresif menyusul adopsi yang kuat di platform seperti OpenRouter. Xiaomi baru saja meluncurkan keluarga model AI baru. Lagi. Beberapa minggu lalu, perusahaan merilis MiMo-V2-Pro—model dengan triliunan parameter yang diam-diam beredar di OpenRouter dengan alias "Hunter Alpha" sebelum Xiaomi mengungkapkan identitasnya. Model ini berubah dari anonim menjadi papan atas dalam semalam. Kami mengujinya, dan hasilnya mengesankan. Sekarang Xiaomi kembali dengan MiMo-V2.5 dan MiMo-V2.5-Pro, keluarga dua model yang menambahkan sesuatu yang tidak pernah dimiliki generasi sebelumnya dalam satu paket: mata, telinga, dan kemampuan untuk memproses video. Oh, dan perusahaan berencana untuk membuka sumber (open source) model-model tersebut dalam waktu dekat. V2-Pro hanya untuk teks dan kode. Kemampuan multimodal ada pada model saudaranya, MiMo-V2-Omni, tetapi itu adalah produk terpisah dengan skor tolok ukur yang lebih rendah. MiMo-V2.5 menggabungkan semua itu menjadi satu model—lebih cepat, lebih mampu, dan dengan pemahaman gambar, video, dan audio asli yang sudah terpasang sejak awal. Hal itu lebih penting daripada kedengarannya bagi pengguna biasa. Misalnya, sekarang Anda dapat mengunggah foto lemari es Anda dan memintanya untuk menyarankan resep makan malam. Masukkan tutorial video dan dapatkan ringkasan langkah demi langkah. Rekam rapat dan minta model tersebut menarik poin-poin tindakan. Semua di satu tempat, tanpa harus menggunakan alat terpisah dan model terpisah dengan strategi harga yang berbeda. Xiaomi mengklaim MiMo-V2.5-Pro mewakili "lompatan besar dari MiMo-V2-Pro dalam kemampuan agen umum, rekayasa perangkat lunak yang kompleks, dan tugas berjangka panjang," dan mengatakan bahwa model ini sekarang menandingi model frontier seperti Claude Opus 4.6 dan GPT-5.4 di sebagian besar tolok ukur pengodean dan agen. Angka-angka tersebut sebagian besar mendukung klaim itu—dengan beberapa celah yang masih terlihat pada tugas penalaran yang lebih sulit. Model dasar dan pro melayani tujuan yang berbeda. MiMo-V2.5-Pro adalah pekerja keras. Xiaomi mengatakan model ini dapat "menyelesaikan tugas profesional secara otonom yang melibatkan 1.000+ panggilan alat, pekerjaan yang akan memakan waktu berhari-hari bagi pakar manusia." Itu untuk pengembang yang menjalankan alur kerja otomatis yang kompleks dan multi-langkah. Model ini berjalan pada 60–80 token per detik dan berharga $1,00 input / $3,00 output per juta token. MiMo-V2.5 adalah versi sehari-hari. Lebih cepat (100–150 token per detik), lebih murah ($0,40 input / $2,00 output), dan mendukung semua modalitas—gambar, audio, dan video yang dilewati oleh tingkat Pro-saja. Kedua model membawa jendela konteks 1 juta token, yang berarti mereka dapat menampung sekitar 750.000 kata dalam satu percakapan. Pada SWE-bench Pro—tolok ukur pengodean di mana model memperbaiki bug nyata dalam basis kode startup aktual, dinilai sebagai tingkat kelulusan dari 100—MiMo-V2.5-Pro menyelesaikan 57,2% tugas. Itu mendekati puncak bidang; model rata-rata mengelola sekitar 25%. Ceritanya serupa pada τ3-bench dan ClawEval, di mana model ini mendarat dalam beberapa poin dari Claude Opus 4.6 dan GPT-5.4. Kesenjangan terbuka pada Humanity's Last Exam, ujian masalah tingkat pascasarjana di puluhan bidang akademik: MiMo mencetak 48,0% dibandingkan dengan 58,7% milik GPT-5.4—defisit 10 poin yang sulit ditutupi. Di mana model ini benar-benar menonjol adalah efisiensi token. Xiaomi mengatakan MiMo-V2.5-Pro menggunakan 42% lebih sedikit token daripada Kimi K2.6 pada skor tolok ukur yang setara, dan MiMo-V2.5 menggunakan hampir setengah token dari Muse Spark untuk hasil yang serupa.
Status data✓ Teks lengkap telah diambilBaca artikel asli (Decrypt)
🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset1 berita
💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang
Informasi mentah
ID:ca63fe28aa
Sumber:Decrypt
Diterbitkan:2026-04-22 19:42:35
Kategori:Umum · Kategori ekspor neutral
Aset:Tidak ditentukan
Voting komunitas:+0 /0 · ⭐ 0 Penting · 💬 0 Komentar
MiMo 2.5 Pro AI baru Xiaomi dapat melihat, mendengar, dan bertindak—semuanya dalam satu model | Feel.Trading