Microsoft Research baru saja merilis Rho-alpha (ρα), model robotik inovatif yang dikembangkan dari seri model bahasa-visi Phi. Produk ini dirancang untuk membebaskan robot dari keterbatasan lingkungan pabrik yang terstruktur dan memberikan kemampuan beradaptasi dalam situasi yang lebih dinamis serta tidak terduga.
Selama ini, robot bekerja sangat baik dalam lingkungan industri yang terkontrol ketat, dengan tugas yang bisa diprediksi dan skrip yang terbatas. Namun, di luar lingkungan tersebut, robot belum mampu beradaptasi dengan perubahan kondisi secara efektif.
Meningkatkan Kecerdasan Fisik Robot
Rho-alpha menghubungkan pemahaman bahasa alami langsung ke kontrol gerakan robotik. Model ini memungkinkan robot menerjemahkan perintah bahasa ke sinyal kontrol untuk menjalankan tugas manipulasi bimanual yang memerlukan koordinasi dua lengan dan presisi tinggi.
Ashley Llorens, Corporate Vice President dan Managing Director Microsoft Research Accelerator, menjelaskan bahwa model vision-language-action (VLA) memungkinkan robot mempersepsikan, bernalar, dan bertindak dengan otonomi lebih tinggi pada lingkungan yang kurang terstruktur. Hal ini merupakan kemajuan signifikan dalam pengembangan kecerdasan buatan fisik yang memungkinkan mesin menghadapi situasi kompleks di lingkungan nyata.
Rho-alpha mengembangkan pendekatan VLA dengan menambahkan penginderaan taktil selain penglihatan. Fitur penginderaan ini meningkatkan kemampuan robot dalam menerima umpan balik sentuhan, sangat penting untuk tugas seperti memasukkan steker atau memanipulasi objek yang bergerak saat disentuh. Penelitian juga mengarah ke pengembangan modalitas penginderaan tambahan seperti gaya (force) untuk mengoptimalkan kontrol gerak.
Peran Simulasi dan Kolaborasi dalam Pelatihan Robot
Salah satu hambatan utama dalam pelatihan model robotik adalah kurangnya data dunia nyata yang kaya dan beragam, khususnya data sentuhan. Microsoft mengatasinya dengan memanfaatkan simulasi melalui Nvidia Isaac Sim yang berjalan di platform Azure. Simulasi ini menghasilkan trajektori gerakan sintetis dengan menggunakan pembelajaran penguatan, lalu digabungkan dengan data demonstrasi fisik dari sumber komersial dan terbuka.
Deepu Talla, Vice President of Robotics and Edge AI di Nvidia, menyatakan bahwa melatih model dasar yang efisien memerlukan data dunia nyata yang beraneka dan sulit diperoleh. Dengan penggunaan Nvidia Isaac Sim dan Azure untuk menghasilkan data sintetis yang akurat secara fisik, Microsoft mempercepat pengembangan Rho-alpha sehingga mampu menguasai manipulasi objek yang kompleks.
Selain simulasi, Microsoft juga menekankan pentingnya intervensi manusia dalam proses pelatihan dan penerapan. Operator dapat memberikan umpan balik langsung melalui perangkat teleoperasi. Pendekatan ini memungkinkan sistem belajar dan meningkatkan kinerjanya dari koreksi yang diterima.
Profesor Abhishek Gupta dari University of Washington menyebutkan bahwa teleoperasi memang menjadi praktik standar dalam menghasilkan data pelatihan. Namun, terdapat banyak situasi di mana teleoperasi tidak praktis. Kolaborasi timnya dengan Microsoft menghasilkan kumpulan data pra-pelatihan yang diperkaya dengan simulasi dan demonstrasi sintetis beragam.
Signifikansi Rho-alpha dalam Pengembangan Robotika
Rho-alpha membuka jalan bagi robot dengan kecerdasan buatan fisik yang mampu bekerja lebih otonom di lingkungan nyata yang tidak terstruktur. Model ini memberikan kemampuan robot untuk merespons beragam keadaan tak terduga, sesuatu yang selama ini menjadi tantangan utama dalam robotika.
Dengan kemampuan untuk memahami bahasa alami dan mengintegrasikannya langsung ke dalam kendali gerak, robot-robot cerdas dapat mengerjakan tugas-tugas rumit di sektor manufaktur, layanan, hingga aplikasi rumah tangga. Penambahan modalitas sensorik meningkatkan kemampuan manipulasi halus, memperluas potensi penggunaan robot di berbagai bidang.
Pemanfaatan simulasi untuk pelatihan dan pembelajaran kolaboratif dengan manusia menjadi strategi efisien untuk mempercepat pengembangan teknologi robotik canggih. Pendekatan ini juga mengurangi ketergantungan pada data eksperimental dunia nyata yang sulit dan mahal untuk dikumpulkan.
Rho-alpha menjadi tonggak penting yang memperlihatkan bagaimana kecerdasan buatan fisik dan pengendalian robotik masa depan dapat menyatu. Model ini diharapkan berkontribusi besar terhadap kemajuan robotika yang lebih adaptif dan cerdas menghadapi lingkungan yang penuh variabilitas.
