Xiaomi baru saja meluncurkan Xiaomi-Robotics-0, sebuah model vision-language-action (VLA) yang mengusung teknologi artificial intelligence (AI) terbaru. Model ini memiliki 4,7 miliar parameter dan dikembangkan secara open-source, menandai langkah besar Xiaomi dalam menghadirkan robot dengan kecerdasan fisik yang lebih maju.
Xiaomi-Robotics-0 dirancang untuk menyelesaikan siklus tertutup antara persepsi, pengambilan keputusan, dan eksekusi tindakan. Dengan kemampuan melihat lingkungan, memahami instruksi manusia secara detail, dan melakukan aksi yang tepat, robot ini menjanjikan performa yang lebih efisien dan responsif dibandingkan generasi sebelumnya.
Teknologi Mixture-of-Transformers (MoT) sebagai Kunci Kecanggihan
Model Xiaomi-Robotics-0 menggunakan arsitektur inovatif Mixture-of-Transformers (MoT). Pendekatan ini membagi tugas utama ke dalam dua komponen khusus. Komponen pertama disebut Visual Language Model (VLM), yang berperan sebagai otak robot untuk mengartikan perintah manusia yang sering kali samar dan kompleks.
Sebagai contoh, robot dengan VLM dapat memahami instruksi “Tolong lipat handuk ini” hanya dengan input visual berdetail tinggi. Komponen kedua adalah Action Expert berbasis Diffusion Transformer (DiT), yang bukan hanya menghasilkan satu gerakan tunggal, melainkan menciptakan rangkaian gerakan berurutan yang disebut “Action Chunk”.
Pemakaian Action Chunk memungkinkan tindakan robot berjalan lebih mulus dan terkoordinasi, sehingga meminimalkan getaran dan kesalahan saat melaksanakan tugas. Ini menjadi keunggulan utama dibandingkan sistem robotik yang kaku dan statis.
Pengujian Simulasi dan Uji Coba di Dunia Nyata
Xiaomi-Robotics-0 telah melalui serangkaian pengujian ketat pada berbagai benchmark industri robotika internasional. Model ini berhasil mengalahkan lebih dari 30 pesaing dalam simulasi LIBERO, CALVIN, dan SimplerEnv, yang menguji kapabilitas robot dalam menangani tugas beragam.
Lebih dari itu, Xiaomi juga menguji robot ini pada platform robot dua lengan di lingkungan nyata. Robot dapat menyelesaikan pekerjaan yang rumit seperti membongkar balok bangunan dan menangani benda fleksibel dengan koordinasi tangan-mata presisi. Teknik Clean Action Prefix yang dipakai menjamin gerakan halus dan stabil meski lingkungan berubah mendadak.
Dampak dan Potensi Ekosistem Robotika
Kehadiran Xiaomi-Robotics-0 memberikan dampak signifikan bagi ekosistem robotika global. Dengan statusnya yang open-source, model ini membuka peluang besar bagi para pengembang dan peneliti untuk berinovasi dan mengadaptasi teknologi AI terbaru secara bebas.
Xiaomi menyediakan fondasi teknologi yang mempercepat kolaborasi serta pengembangan robot pintar yang lebih intuitif dan praktis untuk kebutuhan masyarakat. Pemanfaatan asynchronous inference memungkinkan robot beroperasi tanpa jeda, mengatasi hambatan klasik berupa latensi dalam pemrosesan data berat.
Secara keseluruhan, Xiaomi membawa era baru di mana robot tidak hanya sekadar alat otomatis, melainkan entitas cerdas yang mampu berinteraksi dan beradaptasi secara dinamis. Model Xiaomi-Robotics-0 mengukuhkan posisi Xiaomi sebagai pemimpin di bidang integrasi AI dan teknologi hardware robotik yang paling mutakhir. Inovasi ini akan menjadi dasar pengembangan robot pintar yang semakin dekat dengan kebutuhan manusia sehari-hari di masa depan.
Fakta Utama Xiaomi-Robotics-0:
- Memiliki 4,7 miliar parameter dan dikembangkan open-source.
- Menggunakan arsitektur Mixture-of-Transformers (MoT) untuk integrasi visi, bahasa, dan aksi.
- Mencetak rekor performa unggul dalam berbagai simulasi benchmark global.
- Diuji pada robot dua lengan untuk tugas kompleks di dunia nyata.
- Menerapkan teknik aksi berurutan (Action Chunk) dan prefix stabilitas (Clean Action Prefix).
- Mengatasi latensi dengan asynchronous inference agar gerakan robot kontinu tanpa jeda.
Pengembangan teknologi ini menandai langkah signifikan Xiaomi menuju realisasi robot cerdas dengan kemampuan adaptasi yang mendalam. Xiaomi-Robotics-0 tidak hanya memberikan solusi teknis, tapi juga membangun fondasi bagi ekosistem AI robotik masa depan yang lebih sehat dan produktif.





