MiMo 2.5 Pro AI baru Xiaomi dapat melihat, mendengar, dan bertindak—semuanya dalam satu model

📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯5703 kata

Singkatnya - Xiaomi meluncurkan MiMo-V2.5 dan V2.5-Pro, yang menggabungkan kemampuan teks, gambar, audio, dan video ke dalam satu model AI multimodal. - Versi Pro menyaingi model frontier teratas dalam tolok ukur pengodean dan agen, sekaligus meningkatkan efisiensi token dan biaya secara signifikan. - Model baru ini menandai dorongan AI yang cepat dari Xiaomi, dengan rencana sumber terbuka dan iterasi agresif menyusul adopsi yang kuat di platform seperti OpenRouter. Xiaomi baru saja meluncurkan keluarga model AI baru. Lagi. Beberapa minggu lalu, perusahaan merilis MiMo-V2-Pro—model dengan triliunan parameter yang diam-diam beredar di OpenRouter dengan alias "Hunter Alpha" sebelum Xiaomi mengungkapkan identitasnya. Model ini berubah dari anonim menjadi papan atas dalam semalam. Kami mengujinya, dan hasilnya mengesankan. Sekarang Xiaomi kembali dengan MiMo-V2.5 dan MiMo-V2.5-Pro, keluarga dua model yang menambahkan sesuatu yang tidak pernah dimiliki generasi sebelumnya dalam satu paket: mata, telinga, dan kemampuan untuk memproses video. Oh, dan perusahaan berencana untuk membuka sumber (open source) model-model tersebut dalam waktu dekat. V2-Pro hanya untuk teks dan kode. Kemampuan multimodal ada pada model saudaranya, MiMo-V2-Omni, tetapi itu adalah produk terpisah dengan skor tolok ukur yang lebih rendah. MiMo-V2.5 menggabungkan semua itu menjadi satu model—lebih cepat, lebih mampu, dan dengan pemahaman gambar, video, dan audio asli yang sudah terpasang sejak awal. Hal itu lebih penting daripada kedengarannya bagi pengguna biasa. Misalnya, sekarang Anda dapat mengunggah foto lemari es Anda dan memintanya untuk menyarankan resep makan malam. Masukkan tutorial video dan dapatkan ringkasan langkah demi langkah. Rekam rapat dan minta model tersebut menarik poin-poin tindakan. Semua di satu tempat, tanpa harus menggunakan alat terpisah dan model terpisah dengan strategi harga yang berbeda. Xiaomi mengklaim MiMo-V2.5-Pro mewakili "lompatan besar dari MiMo-V2-Pro dalam kemampuan agen umum, rekayasa perangkat lunak yang kompleks, dan tugas berjangka panjang," dan mengatakan bahwa model ini sekarang menandingi model frontier seperti Claude Opus 4.6 dan GPT-5.4 di sebagian besar tolok ukur pengodean dan agen. Angka-angka tersebut sebagian besar mendukung klaim itu—dengan beberapa celah yang masih terlihat pada tugas penalaran yang lebih sulit. Model dasar dan pro melayani tujuan yang berbeda. MiMo-V2.5-Pro adalah pekerja keras. Xiaomi mengatakan model ini dapat "menyelesaikan tugas profesional secara otonom yang melibatkan 1.000+ panggilan alat, pekerjaan yang akan memakan waktu berhari-hari bagi pakar manusia." Itu untuk pengembang yang menjalankan alur kerja otomatis yang kompleks dan multi-langkah. Model ini berjalan pada 60–80 token per detik dan berharga $1,00 input / $3,00 output per juta token. MiMo-V2.5 adalah versi sehari-hari. Lebih cepat (100–150 token per detik), lebih murah ($0,40 input / $2,00 output), dan mendukung semua modalitas—gambar, audio, dan video yang dilewati oleh tingkat Pro-saja. Kedua model membawa jendela konteks 1 juta token, yang berarti mereka dapat menampung sekitar 750.000 kata dalam satu percakapan. Pada SWE-bench Pro—tolok ukur pengodean di mana model memperbaiki bug nyata dalam basis kode startup aktual, dinilai sebagai tingkat kelulusan dari 100—MiMo-V2.5-Pro menyelesaikan 57,2% tugas. Itu mendekati puncak bidang; model rata-rata mengelola sekitar 25%. Ceritanya serupa pada τ3-bench dan ClawEval, di mana model ini mendarat dalam beberapa poin dari Claude Opus 4.6 dan GPT-5.4. Kesenjangan terbuka pada Humanity's Last Exam, ujian masalah tingkat pascasarjana di puluhan bidang akademik: MiMo mencetak 48,0% dibandingkan dengan 58,7% milik GPT-5.4—defisit 10 poin yang sulit ditutupi. Di mana model ini benar-benar menonjol adalah efisiensi token. Xiaomi mengatakan MiMo-V2.5-Pro menggunakan 42% lebih sedikit token daripada Kimi K2.6 pada skor tolok ukur yang setara, dan MiMo-V2.5 menggunakan hampir setengah token dari Muse Spark untuk hasil yang serupa.

Status data✓ Teks lengkap telah diambilBaca artikel asli (Decrypt)

🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita

2026-04-30

Mistral AI Merilis Model Open-Source Baru. Internet Tidak Terkesan, Kecuali untuk Satu Hal

Tingkat kemiripan 180%關鍵字 new/model/one

2026-04-23

Model AI Hy3 baru Tencent adalah LLM Tiongkok paling efisien yang tidak dibicarakan siapa pun

Tingkat kemiripan 180%關鍵字 new/model/one

2026-04-18

Model AI baru OpenAI, Rosalind, dapat memangkas waktu penemuan obat hingga bertahun-tahun. Anda mungkin tidak bisa menggunakannya

Tingkat kemiripan 180%關鍵字 new/model/can

2026-05-21