Xiaomi Membuka Era Agent, MiMo-V2-Pro Hadir dengan Lebih dari 1TB Parameter

Xiaomi memperluas strategi kecerdasan buatannya dengan meluncurkan MiMo-V2-Pro, model bahasa besar yang diposisikan sebagai produk unggulan untuk kebutuhan AI generatif tingkat lanjut. Model ini diumumkan bersama dua model lain, yakni MiMo-V2-Omni dan MiMo-V2-TTS, sebagai bagian dari perluasan keluarga MiMo.

Fokus utama ada pada MiMo-V2-Pro karena Xiaomi menyebutnya dirancang untuk era “agent”, yaitu fase ketika AI tidak hanya menjawab pertanyaan, tetapi juga menjalankan rangkaian tugas kompleks secara lebih mandiri. Berdasarkan informasi yang dibagikan perusahaan, model ini membawa total parameter lebih dari 1TB dan jendela konteks 1MB.

MiMo-V2-Pro untuk beban kerja berat

Xiaomi menyatakan MiMo-V2-Pro ditujukan untuk beban kerja nyata yang berat, termasuk orkestrasi alur kerja dan perencanaan jangka panjang. Klaim itu menempatkan model ini pada kategori LLM yang tidak sekadar fokus pada percakapan, tetapi juga pada kemampuan agen digital dalam menangani proses bertahap.

Dalam keterangan resminya, Xiaomi juga menyebut performa MiMo-V2-Pro mendekati model kelas atas seperti Claude Opus 4.6. Namun, perusahaan menekankan bahwa biaya penggunaan melalui API dibuat lebih rendah, dengan harga mulai dari $1 per juta token untuk input pada konteks yang lebih kecil.

Angka tersebut penting karena persaingan model AI kini tidak lagi hanya soal kualitas, tetapi juga efisiensi biaya. Di pasar yang semakin padat, kombinasi performa tinggi dan tarif API agresif bisa menjadi faktor penentu bagi pengembang dan perusahaan yang ingin mengadopsi model AI dalam skala besar.

Sudah masuk ke ekosistem Xiaomi

Salah satu langkah yang paling menonjol dari peluncuran ini adalah integrasinya yang langsung ke layanan milik Xiaomi. Tiga model baru itu mulai diterapkan di MiMo Studio, Xiaomi Browser, dan Kingsoft Office, sehingga pengguna tidak perlu menunggu terlalu lama untuk melihat penerapan nyatanya.

Khusus MiMo-V2-Pro, Xiaomi menyebut model ini telah terhubung dengan alat produktivitas WPS Office dari Kingsoft. Itu berarti model dapat dipakai lintas Word, Excel, PowerPoint, dan PDF untuk membantu pemrosesan dokumen, analisis data, hingga pembuatan materi presentasi.

Pendekatan ini menunjukkan Xiaomi tidak hanya membangun model dasar, tetapi juga menyiapkan jalur distribusi penggunaan di produk yang sudah memiliki basis pengguna. Strategi semacam ini mirip dengan langkah perusahaan teknologi besar lain yang menggabungkan model AI dengan aplikasi kerja dan layanan digital sehari-hari.

Dua model lain lengkapi strategi AI Xiaomi

Selain MiMo-V2-Pro, Xiaomi juga memperkenalkan MiMo-V2-Omni untuk tugas multimodal. Model ini dirancang untuk memproses audio, gambar, dan video secara bersamaan, dengan kemampuan yang diklaim kuat pada pemahaman audio dan penalaran visual.

Xiaomi menyebut MiMo-V2-Omni mampu menangani audio panjang, percakapan multi-pembicara, dan analisis gabungan audio-video. Perusahaan bahkan menyatakan performa pemahaman audionya dalam beberapa skenario melampaui Gemini 3 Pro, meski klaim seperti ini tetap perlu dilihat dalam konteks pengujian internal dan penggunaan di lapangan.

Model ketiga adalah MiMo-V2-TTS, yang difokuskan pada sintesis suara. Xiaomi mengatakan model ini memungkinkan pengaturan nada, emosi, dan gaya bicara secara rinci, serta dapat dipakai untuk percakapan alami hingga nyanyian dengan dukungan beberapa dialek Tiongkok.

Akses pengembang dan poin penting peluncuran

Xiaomi juga membuka akses model-model tersebut melalui platform API miliknya. Selain itu, perusahaan menyediakan masa uji coba gratis selama satu pekan bagi pengembang, lalu kompatibilitasnya diperluas ke alat seperti OpenClaw, OpenCode, dan Cline.

Berikut ringkasan tiga model baru Xiaomi:

MiMo-V2-Pro
Fokus pada tugas agen, alur kerja kompleks, dan perencanaan jangka panjang.
MiMo-V2-Omni
Fokus pada pemrosesan multimodal yang mencakup audio, gambar, dan video.
MiMo-V2-TTS
Fokus pada sintesis suara dengan kontrol detail terhadap ekspresi dan gaya bicara.

Peluncuran ini juga memperlihatkan kecepatan iterasi Xiaomi dalam mengembangkan AI. Setelah memperkenalkan MiMo-7B pada Mei dan melanjutkannya dengan MiMo-V2-Flash pada Desember, perusahaan kini bergerak lebih jauh dengan menghadirkan model flagship, model multimodal, dan model suara dalam satu rangkaian produk.

Bila dilihat dari arah pengembangannya, Xiaomi sedang membangun tumpukan AI yang lengkap, mulai dari teks, multimodal, hingga suara. Integrasi erat ke perangkat lunak internal dan penawaran harga API yang kompetitif membuat MiMo-V2-Pro dan dua model pendampingnya layak diperhatikan dalam persaingan LLM global yang kini bergerak semakin cepat.

Source: www.gizmochina.com

Qoo MediaKamis, 19 Maret 2026 - 9:57 am

Xiaomi Membuka Era Agent, MiMo-V2-Pro Hadir dengan Lebih dari 1TB Parameter

Lucid Gravity Makin Canggih Seketika, Update OTA Bawa Mode Hands-Free Di Jalan Tol

Nomad Ubah Charger MagSafe Jadi Edisi Orange Mewah, Ada Kartu AirTag Tipis yang Ikut Dapat Versi Khusus

Bocoran Galaxy S26 FE Muncul, Samsung Ubah Satu Detail yang Langsung Terasa Berbeda

Xiaomi 17T Bawa Kamera Periskop 5X, Harga Mulai Rp 7,9 Juta Bikin Lawan Waspada

Bukan Cuma Siri, 5 Perbaikan iOS 27 Ini Bisa Ubah Pengalaman iPhone Total

Nasib 21 Ribu Motor Listrik MBG, Tak Disita Kejagung Meski Dugaan Korupsi Rp 1,03 Triliun Diusut

Berita Terkait

Bukan Cuma Siri, 5 Perbaikan iOS 27 Ini Bisa Ubah Pengalaman iPhone Total

Samsung Rp1 Jutaan Ternyata Tak Murahan, 4 Galaxy A Ini Paling Masuk Akal di Juni 2026

Honor Siapkan Win Pad Mini, Tablet Gaming 8 Inci OLED dengan Baterai yang Bisa Ganggu Rival

Apple Kena Tegas Soal Siri AI, Aturan Uni Eropa Tak Beri Celah untuk Pengecualian