Xiaomi Bikin Lonjakan AI Baru, MiMo Tembus Kecepatan Jauh Di Atas ChatGPT dan Claude

Xiaomi kembali menarik perhatian di industri kecerdasan buatan lewat model AI baru bernama MiMo-V2.5-Pro-UltraSpeed. Model ini diklaim mampu menghasilkan lebih dari 1.000 token per detik, jauh di atas banyak chatbot AI populer yang saat ini digunakan publik.

Dalam laporan yang dikutip dari Decrypt, kecepatan model tersebut bahkan sempat mendekati 1.200 token per detik saat diuji. Capaian itu membuat Xiaomi disebut berhasil menghadirkan salah satu sistem AI tercepat yang pernah dipublikasikan ke pasar pengembang.

Kecepatan yang jauh melampaui chatbot populer

Token adalah potongan teks yang diproses AI saat membaca atau menyusun jawaban. Satu token umumnya setara dengan sekitar tiga perempat kata, sehingga semakin banyak token yang diproses per detik, semakin singkat pula waktu respons yang diterima pengguna.

Data Artificial Analysis menunjukkan perbedaan yang sangat lebar antara MiMo dan model populer lain. GPT-5.5 yang digunakan banyak pengguna ChatGPT berada di kisaran 68 token per detik, Claude Opus 4.6 sekitar 71 token per detik, sedangkan Gemini Flash mencapai kurang lebih 192 token per detik.

Dengan perbandingan itu, klaim Xiaomi terlihat menonjol bukan hanya karena angka kecepatannya, tetapi juga karena jaraknya yang sangat jauh dari model AI komersial yang sudah dikenal luas. Performa tersebut membuat MiMo-V2.5-Pro-UltraSpeed langsung menjadi sorotan di komunitas teknologi.

Tidak bergantung pada chip khusus

Yang membuat pencapaian ini semakin menarik adalah pendekatan yang dipilih Xiaomi. Perusahaan itu tidak memakai perangkat keras khusus yang mahal, melainkan hanya satu server standar berisi delapan GPU.

Pendekatan ini berbeda dari perusahaan seperti Cerebras dan Groq yang mengandalkan chip khusus untuk mengejar kecepatan AI. Xiaomi justru memaksimalkan efisiensi lewat optimasi perangkat lunak, termasuk sistem TileRT dan sejumlah teknik kompresi data.

Salah satu teknik yang dipakai adalah FP4 Quantization. Metode ini mengecilkan sebagian data model agar kebutuhan memori turun dan proses berjalan lebih cepat, tanpa menurunkan kualitas jawaban secara signifikan.

Cara Xiaomi mempercepat proses AI

Xiaomi juga menggunakan teknologi DFlash untuk mempercepat pembuatan respons. Teknologi ini memungkinkan AI memprediksi dan memproses beberapa kata sekaligus dalam satu langkah, sehingga waktu yang dibutuhkan untuk menyusun jawaban menjadi lebih singkat.

Kombinasi teknologi tersebut disebut membuat model AI berukuran lebih dari satu triliun parameter tetap berjalan sangat cepat. Parameter sendiri adalah angka internal yang membantu AI mengenali pola dan menghasilkan respons, dan jumlah parameter yang besar biasanya berkaitan dengan kemampuan model yang lebih canggih.

Menariknya, MiMo-V2.5-Pro disebut bukan versi yang diperkecil demi kecepatan. Model ini tetap diklaim memiliki kemampuan setara model AI kelas atas dan disebut mampu bersaing dengan Claude Opus dalam berbagai pengujian coding.

Potensi penggunaan untuk kebutuhan yang lebih luas

Kecepatan tinggi seperti ini membuka peluang penggunaan yang lebih luas di berbagai bidang. Beberapa contoh yang disebutkan dalam laporan mencakup analisis data real-time, deteksi penipuan, sistem perdagangan otomatis, hingga agen AI yang bisa berpikir dan bertindak lebih cepat.

Untuk saat ini, Xiaomi telah membuka program uji coba API MiMo-V2.5-Pro-UltraSpeed bagi pengembang dan perusahaan. Sebagian teknologi yang dipakai juga sudah dirilis secara open source, sehingga komunitas pengembang di berbagai negara bisa ikut menguji dan mempelajarinya.

Langkah tersebut menunjukkan bahwa Xiaomi tidak hanya ingin bersaing lewat perangkat konsumen, tetapi juga mulai membangun posisi di arena AI yang semakin kompetitif. Dengan performa yang diklaim melampaui ChatGPT dan Claude dalam hal kecepatan, MiMo-V2.5-Pro-UltraSpeed kini menjadi salah satu model yang paling banyak diperhatikan di ranah AI generatif.

Source: teknologi.bisnis.com
Exit mobile version