
Xiaomi memperluas strategi kecerdasan buatannya dengan meluncurkan MiMo-V2-Pro, model bahasa besar yang diposisikan sebagai produk unggulan untuk kebutuhan AI generatif tingkat lanjut. Model ini diumumkan bersama dua model lain, yakni MiMo-V2-Omni dan MiMo-V2-TTS, sebagai bagian dari perluasan keluarga MiMo.
Fokus utama ada pada MiMo-V2-Pro karena Xiaomi menyebutnya dirancang untuk era “agent”, yaitu fase ketika AI tidak hanya menjawab pertanyaan, tetapi juga menjalankan rangkaian tugas kompleks secara lebih mandiri. Berdasarkan informasi yang dibagikan perusahaan, model ini membawa total parameter lebih dari 1TB dan jendela konteks 1MB.
MiMo-V2-Pro untuk beban kerja berat
Xiaomi menyatakan MiMo-V2-Pro ditujukan untuk beban kerja nyata yang berat, termasuk orkestrasi alur kerja dan perencanaan jangka panjang. Klaim itu menempatkan model ini pada kategori LLM yang tidak sekadar fokus pada percakapan, tetapi juga pada kemampuan agen digital dalam menangani proses bertahap.
Dalam keterangan resminya, Xiaomi juga menyebut performa MiMo-V2-Pro mendekati model kelas atas seperti Claude Opus 4.6. Namun, perusahaan menekankan bahwa biaya penggunaan melalui API dibuat lebih rendah, dengan harga mulai dari $1 per juta token untuk input pada konteks yang lebih kecil.
Angka tersebut penting karena persaingan model AI kini tidak lagi hanya soal kualitas, tetapi juga efisiensi biaya. Di pasar yang semakin padat, kombinasi performa tinggi dan tarif API agresif bisa menjadi faktor penentu bagi pengembang dan perusahaan yang ingin mengadopsi model AI dalam skala besar.
Sudah masuk ke ekosistem Xiaomi
Salah satu langkah yang paling menonjol dari peluncuran ini adalah integrasinya yang langsung ke layanan milik Xiaomi. Tiga model baru itu mulai diterapkan di MiMo Studio, Xiaomi Browser, dan Kingsoft Office, sehingga pengguna tidak perlu menunggu terlalu lama untuk melihat penerapan nyatanya.
Khusus MiMo-V2-Pro, Xiaomi menyebut model ini telah terhubung dengan alat produktivitas WPS Office dari Kingsoft. Itu berarti model dapat dipakai lintas Word, Excel, PowerPoint, dan PDF untuk membantu pemrosesan dokumen, analisis data, hingga pembuatan materi presentasi.
Pendekatan ini menunjukkan Xiaomi tidak hanya membangun model dasar, tetapi juga menyiapkan jalur distribusi penggunaan di produk yang sudah memiliki basis pengguna. Strategi semacam ini mirip dengan langkah perusahaan teknologi besar lain yang menggabungkan model AI dengan aplikasi kerja dan layanan digital sehari-hari.
Dua model lain lengkapi strategi AI Xiaomi
Selain MiMo-V2-Pro, Xiaomi juga memperkenalkan MiMo-V2-Omni untuk tugas multimodal. Model ini dirancang untuk memproses audio, gambar, dan video secara bersamaan, dengan kemampuan yang diklaim kuat pada pemahaman audio dan penalaran visual.
Xiaomi menyebut MiMo-V2-Omni mampu menangani audio panjang, percakapan multi-pembicara, dan analisis gabungan audio-video. Perusahaan bahkan menyatakan performa pemahaman audionya dalam beberapa skenario melampaui Gemini 3 Pro, meski klaim seperti ini tetap perlu dilihat dalam konteks pengujian internal dan penggunaan di lapangan.
Model ketiga adalah MiMo-V2-TTS, yang difokuskan pada sintesis suara. Xiaomi mengatakan model ini memungkinkan pengaturan nada, emosi, dan gaya bicara secara rinci, serta dapat dipakai untuk percakapan alami hingga nyanyian dengan dukungan beberapa dialek Tiongkok.
Akses pengembang dan poin penting peluncuran
Xiaomi juga membuka akses model-model tersebut melalui platform API miliknya. Selain itu, perusahaan menyediakan masa uji coba gratis selama satu pekan bagi pengembang, lalu kompatibilitasnya diperluas ke alat seperti OpenClaw, OpenCode, dan Cline.
Berikut ringkasan tiga model baru Xiaomi:
-
MiMo-V2-Pro
Fokus pada tugas agen, alur kerja kompleks, dan perencanaan jangka panjang. -
MiMo-V2-Omni
Fokus pada pemrosesan multimodal yang mencakup audio, gambar, dan video. - MiMo-V2-TTS
Fokus pada sintesis suara dengan kontrol detail terhadap ekspresi dan gaya bicara.
Peluncuran ini juga memperlihatkan kecepatan iterasi Xiaomi dalam mengembangkan AI. Setelah memperkenalkan MiMo-7B pada Mei dan melanjutkannya dengan MiMo-V2-Flash pada Desember, perusahaan kini bergerak lebih jauh dengan menghadirkan model flagship, model multimodal, dan model suara dalam satu rangkaian produk.
Bila dilihat dari arah pengembangannya, Xiaomi sedang membangun tumpukan AI yang lengkap, mulai dari teks, multimodal, hingga suara. Integrasi erat ke perangkat lunak internal dan penawaran harga API yang kompetitif membuat MiMo-V2-Pro dan dua model pendampingnya layak diperhatikan dalam persaingan LLM global yang kini bergerak semakin cepat.
Source: www.gizmochina.com








