Xiaomi kembali menarik perhatian di pasar kecerdasan buatan dengan merilis mode UltraSpeed untuk MiMo-V2.5-Pro. Klaim utamanya terdengar agresif: model ini dikatakan mampu menghasilkan lebih dari 1.000 token per detik.
Lonjakan kecepatan itu menempatkan MiMo-V2.5-Pro UltraSpeed sebagai salah satu sistem AI tercepat yang pernah diperkenalkan Xiaomi. Peningkatan ini juga menegaskan bahwa persaingan model AI kini tidak hanya soal ukuran, tetapi juga soal efisiensi inferensi.
Model 1 triliun parameter dengan fokus efisiensi
Xiaomi menyebut MiMo-V2.5-Pro UltraSpeed dibangun di atas model berukuran 1 triliun parameter. Model ini dioptimalkan agar tetap bisa berjalan pada GPU serbaguna tanpa mengorbankan performa.
Perusahaan menjelaskan bahwa lonjakan performa tidak datang dari model yang lebih besar saja. Peningkatan itu juga berasal dari integrasi mendalam antara arsitektur model dan sistem inferensi yang mendasarinya.
Kolaborasi dengan TileRT
Xiaomi mengatakan peningkatan ini lahir dari kolaborasi dengan TileRT. Pendekatannya mengandalkan desain bersama antara model AI dan sistem inferensi agar respons tetap cepat.
Perusahaan menyebut strategi itu sebagai salah satu implementasi co-design paling mutakhir yang pernah dipakai pada platform AI mereka. Pendekatan tersebut ditujukan untuk menjaga model berparameter besar tetap responsif tanpa infrastruktur yang terlalu khusus.
Jauh lebih cepat dari generasi sebelumnya
Kecepatan lebih dari 1.000 token per detik menjadi lompatan besar dibanding generasi sebelumnya. Xiaomi membandingkannya dengan MiMo-V2-Flash yang diperkenalkan pada Desember 2025.
Pada saat itu, MiMo-V2-Flash mampu menghasilkan sekitar 150 token per detik. Xiaomi menyebut capaian tersebut sudah sangat cepat karena setara dengan sekitar 110 kata per detik.
Dengan UltraSpeed, Xiaomi mengklaim pengalaman output bisa mencapai 10 kali lebih cepat dibanding layanan API standar MiMo-V2.5-Pro. Klaim itu menjadi salah satu daya tarik utama dari peluncuran mode baru ini.
Tarif akses lebih mahal
Di balik performa yang lebih tinggi, Xiaomi juga menetapkan harga yang lebih mahal untuk akses UltraSpeed. Tarifnya disebut sekitar tiga kali lebih mahal dibanding versi reguler.
Untuk layanan standar MiMo-V2.5-Pro, Xiaomi menetapkan biaya 0,025 yuan per juta token untuk cache hit, 3 yuan per juta token untuk input cache miss, dan 6 yuan per juta token untuk output. Namun, fitur Token Package tidak tersedia untuk mode UltraSpeed karena statusnya masih uji coba API.
Xiaomi menilai biaya yang lebih tinggi itu sebanding dengan peningkatan kecepatan respons. Perusahaan menekankan bahwa target utamanya adalah pengguna yang membutuhkan output sangat cepat untuk kebutuhan nyata.
Uji coba terbatas untuk perusahaan dan pengembang
Karena keterbatasan sumber daya inferensi berkecepatan tinggi, Xiaomi membuka program uji coba terbatas pada 9 Juni hingga 23 Juni 2026. Seleksi dilakukan melalui sistem aplikasi dan tidak semua pendaftar dijamin diterima.
Prioritas diberikan kepada perusahaan dan pengembang profesional yang memiliki kebutuhan bisnis nyata terhadap layanan AI berkecepatan tinggi. Peserta yang lolos akan mendapat akses gratis selama dua minggu untuk mencoba MiMo UltraSpeed.
Selama masa uji coba, Xiaomi juga menerapkan sejumlah pembatasan. Setiap akun hanya mendapat maksimal 10 entri antrian per hari, durasi sesi dibatasi 30 menit, dan sumber daya akan dilepas otomatis jika tidak ada aktivitas lebih dari 5 menit.
Bagian dari ekspansi AI Xiaomi
MiMo-V2.5-Pro pertama kali diperkenalkan pada April 2026 sebagai bagian dari ekspansi besar Xiaomi di bidang kecerdasan buatan. Kini, keluarga MiMo telah berkembang mencakup pemrosesan teks, suara, hingga kemampuan multimodal.
Dengan hadirnya mode UltraSpeed, Xiaomi memperlihatkan ambisinya untuk bersaing lebih serius di pasar model AI generatif global. Jika klaim performanya terbukti dalam penggunaan nyata, MiMo-V2.5-Pro UltraSpeed berpotensi menjadi salah satu solusi AI tercepat untuk pengembangan aplikasi dan layanan berbasis kecerdasan buatan.
