
Xiaomi meluncurkan tiga model kecerdasan buatan baru yang menandai ekspansi serius perusahaan itu di sektor AI, yaitu MiMo-V2-Pro, MiMo-V2-Omni, dan MiMo-V2-TTS. Ketiganya tidak hanya dirancang untuk tugas percakapan, tetapi juga untuk pekerjaan yang lebih kompleks seperti otomasi alur kerja, pemrosesan multimodal, hingga sintesis suara yang lebih alami.
Fokus utama peluncuran ini ada pada MiMo-V2-Pro, yang disebut Xiaomi sebagai “otak” untuk generasi baru AI agent. Model ini ditujukan untuk sistem yang bisa merencanakan, mengeksekusi, dan menyelesaikan tugas bertahap dengan campur tangan manusia yang minim.
MiMo-V2-Pro masuk jajaran model AI papan atas
Menurut Artificial Analysis Intelligence Index, MiMo-V2-Pro menempati peringkat kedelapan secara global. Dalam daftar yang sama, model ini juga menjadi large language model asal China dengan peringkat tertinggi kedua.
Pencapaian itu penting karena benchmark tersebut dikenal luas sebagai salah satu rujukan untuk menilai kemampuan sistem AI. Xiaomi juga menyebut performa MiMo-V2-Pro kuat di benchmark yang berfokus pada agen seperti ClawEval dan PinchBench, terutama dalam aspek penalaran, perencanaan, dan penggunaan alat.
Dirancang untuk tugas dunia nyata
Berbeda dari banyak model yang menonjol di pembuatan teks, MiMo-V2-Pro dibangun untuk skenario agentic AI. Artinya, model ini diarahkan untuk mengambil inisiatif dan menyelesaikan target kerja digital yang terdiri dari beberapa langkah.
Contoh penggunaan yang disorot Xiaomi mencakup eksekusi workflow bertahap, interaksi dengan tools dan API, bantuan pengembangan perangkat lunak, serta otomasi proses digital yang rumit. Pendekatan ini menunjukkan bahwa perusahaan tidak hanya mengejar skor benchmark, tetapi juga kegunaan praktis di lingkungan kerja.
Model ini dilatih memakai kombinasi supervised fine-tuning dan feedback-based learning. Xiaomi menyatakan fokus pelatihannya diarahkan pada pemakaian nyata, bukan semata performa teoritis.
Skala besar dengan efisiensi lebih tinggi
Dari sisi teknis, MiMo-V2-Pro hadir dengan skala yang jauh lebih besar dari generasi sebelumnya. Xiaomi menyebut total parameternya melampaui 1 triliun, dengan 42 miliar parameter aktif saat runtime.
Model ini juga mendukung jendela konteks hingga 1 juta token. Kapasitas ini memungkinkan pemrosesan dokumen, kode, atau rangkaian instruksi yang sangat panjang dalam satu sesi kerja.
Untuk menjaga efisiensi, Xiaomi membekalinya dengan mekanisme Hybrid Attention yang diperbarui. Perusahaan juga menambahkan lapisan Multi-Token Prediction atau MTP, yang diklaim mampu mempercepat generasi respons tanpa mengorbankan kualitas.
Kuat di coding dan rekayasa perangkat lunak
Salah satu area yang paling disorot adalah kemampuan pemrograman. Xiaomi menyatakan MiMo-V2-Pro melampaui Claude 4.6 Sonnet pada tugas terkait coding dan mendekati Claude Opus 4.6 dalam desain sistem serta pemecahan masalah.
Indikasi penggunaan riil juga mulai terlihat dari pengujian awal dengan nama kode Hunter Alpha di platform OpenRouter. Menurut Xiaomi, alat bantu coding menjadi kategori penggunaan tertinggi, yang mengisyaratkan bahwa pengembang menilai model ini cukup praktis untuk workflow sehari-hari.
Integrasi dengan ekosistem pengembang
Untuk mempercepat adopsi, Xiaomi mengintegrasikan MiMo-V2-Pro dengan sejumlah framework agent yang populer. Daftarnya meliputi:
- OpenClaw
- OpenCode
- KiloCode
- Blackbox
- Cline
Perusahaan itu juga menawarkan akses API gratis selama satu minggu. Langkah ini membuka ruang bagi pengembang untuk menguji kemampuan model dalam aplikasi nyata sebelum mengadopsinya lebih lanjut.
Struktur harga API MiMo-V2-Pro
Xiaomi sudah membuka akses publik untuk MiMo-V2-Pro melalui API. Berikut ringkasan harga yang diumumkan:
| Model | Input Cost | Output Cost | Cache Read | Cache Write |
|---|---|---|---|---|
| MiMo-V2-Pro (≤256K) | $1 | $3 | $0.20 | $0 |
| MiMo-V2-Pro (256K–1M) | $2 | $6 | $0.40 | $0 |
| Claude Sonnet 4.6 | $3 | $15 | $0.30 | $3.75 |
| Claude Opus 4.6 | $5 | $25 | $0.50 | $6.25 |
Dari tabel itu, Xiaomi memosisikan MiMo-V2-Pro sebagai opsi yang lebih agresif dari sisi biaya. Pricing semacam ini dapat menjadi faktor penting bagi pengembang dan perusahaan yang mempertimbangkan efisiensi penggunaan model skala besar.
MiMo-V2-Omni perluas kemampuan ke multimodal
Selain model utama, Xiaomi juga merilis MiMo-V2-Omni. Model ini dirancang untuk memahami teks, gambar, audio, dan video dalam satu aliran terpadu.
Pendekatan tersebut berbeda dari sistem yang menggabungkan kemampuan multimodal secara terpisah. Xiaomi mengklaim hasilnya adalah penalaran yang lebih natural dan lebih peka terhadap konteks lintas format.
Beberapa kemampuan yang disorot mencakup pemahaman audio tingkat lanjut, termasuk analisis banyak pembicara. Model ini juga disebut kuat dalam penalaran visual, pembacaan grafik, dan pemahaman video, termasuk kemampuan mengantisipasi apa yang terjadi berikutnya.
Berdasarkan evaluasi internal Xiaomi, MiMo-V2-Omni mampu bersaing dengan sistem papan atas seperti Gemini 3 Pro dan GPT-5.2. Namun, klaim ini masih perlu dibaca secara hati-hati karena sebagian basis pembanding berasal dari pengujian internal perusahaan.
MiMo-V2-TTS fokus pada suara yang lebih ekspresif
Model ketiga adalah MiMo-V2-TTS, sistem text-to-speech yang dikembangkan untuk membuat interaksi AI terdengar lebih manusiawi. Xiaomi menempatkan model ini sebagai solusi suara yang bukan hanya jelas, tetapi juga ekspresif.
Fitur yang diumumkan mencakup generasi suara yang sadar emosi, kontrol gaya fleksibel lewat prompt bahasa alami, dukungan dialek dan suara karakter, serta kemampuan menghasilkan ucapan maupun nyanyian. Xiaomi menyebut model ini dilatih menggunakan lebih dari 100 juta jam data suara, sehingga dapat meniru ritme, intonasi, dan nuansa emosional dengan lebih realistis.
Secara keseluruhan, peluncuran tiga model ini menunjukkan arah strategi Xiaomi yang makin luas di bidang AI, dari agentic system hingga multimodal dan voice synthesis. Dengan posisi MiMo-V2-Pro yang sudah muncul di benchmark global serta dukungan API dan framework pengembang, persaingan model AI tingkat lanjut diperkirakan akan semakin ketat dalam waktu dekat.
Source: true-tech.net








