Robot Bisa Ikuti Perintah Tulisan di Lingkungan, Bukan Perintah Anda, Berkat AI Prompt Injection

Add on Google

Robot berbasis kecerdasan buatan (AI) kini menghadapi ancaman baru yang cukup berbahaya dan unik. Sebuah teknik bernama AI robot prompt injection memungkinkan robot untuk dipengaruhi oleh tulisan di lingkungan fisik, bukan oleh perintah langsung dari pengguna atau sistem kontrol internal. Hal ini berarti robot dapat saja mengikuti instruksi yang tertulis pada tanda atau poster yang ditempel di sekitar mereka, meski perintah tersebut tidak berasal dari pengendali robot itu sendiri.

Teknik ini tidak memerlukan akses langsung ke sistem software robot maupun sensor robot. Penyerang hanya perlu menempatkan teks dengan rancangan khusus di daerah yang dapat terlihat oleh kamera robot. Tulisan tersebut kemudian diproses oleh model bahasa visual robot dan dialihkan menjadi perintah yang mengubah perilaku robot. Para peneliti melaporkan keberhasilan serangan ini mencapai 81,8% pada simulasi pengendalian kendaraan otonom dan 68,1% pada tugas pendaratan darurat drone.

Metode CHAI dan Pengaruhnya pada Robot

Metode yang dinamakan CHAI ini menargetkan lapisan perintah di mana model bahasa visual mengubah input visual menjadi instruksi pergerakan. Jika proses ini dimanipulasi untuk menghasilkan instruksi yang salah, maka robot akan menjalankan arahan tersebut tanpa mengetahui ada kesalahan di baliknya. Teknik ini mengandalkan sebuah pendekatan low-tech, di mana sang penyerang dianggap sebagai pihak luar yang hanya bisa menempatkan teks dalam bidang pandang kamera robot tanpa harus membobol sistem onboard.

Keberhasilan metode CHAI mengindikasikan adanya potensi risiko yang lebih luas pada penggunaan robot yang bergantung pada visi komputer dan pemrosesan bahasa alami. Peneliti dalam eksperimen nyata membuktikan bahwa teks cetak yang ditempel pada mobil robot kecil mampu mengalihkan rute navigasinya dengan tingkat keberhasilan minimal 87% dalam berbagai kondisi pencahayaan dan sudut pandang.

Optimasi Visual dan Prompt Universal

Selain isi teks, CHAI juga mengoptimasi aspek visual seperti warna, ukuran, dan posisi tulisan agar lebih mudah dibaca dan diinterpretasi oleh model AI dalam robot. Ini membuat serangan lebih efektif dan sulit dihindari. Lebih lanjut, peneliti menunjukkan bahwa prompt yang dirancang secara “universal” dapat bekerja di berbagai skenario dan model yang berbeda dengan sukses rata-rata minimal 50%.

Keunggulan lain dari metode ini adalah kemampuannya menggunakan bahasa yang beragam seperti Mandarin, Spanyol, atau bahasa campuran agar pesan yang disampaikan sulit dikenali oleh manusia yang berada di dekat lokasi. Kondisi ini menambah tingkat kesulitan untuk mendeteksi dan menghentikan serangan pada robot yang beroperasi di dunia nyata.

Upaya Pertahanan dan Adaptasi Keselamatan Robot

Sebagai tanggapan atas ancaman ini, peneliti mengusulkan tiga pendekatan utama demi meningkatkan keselamatan robot. Pertama, melakukan filter dan deteksi agar sistem mampu mengenali teks mencurigakan dalam citra atau interpretasi perintah. Kedua, memperbaiki alignment atau penyelarasan model agar tidak mudah menganggap tulisan di lingkungan sebagai instruksi yang harus dijalankan.

Ketiga, riset jangka panjang diarahkan untuk mengembangkan jaminan keamanan yang lebih kuat dan tahan terhadap serangan semacam ini. Selanjutnya, langkah praktis yang disarankan adalah memperlakukan semua teks yang terlihat oleh robot sebagai input yang tidak terpercaya. Setiap perintah yang berasal dari tulisan tersebut harus melewati pemeriksaan tugas dan keamanan sebelum robot mengubah rute atau tindakannya.

Penelitian terkait akan dipresentasikan pada konferensi SaTML mendatang, di mana topik ini diharapkan menjadi pusat perhatian bagi para pengembang dan pengguna robot yang terus berkembang. Dengan semakin meluasnya penerapan robot otonom di berbagai bidang, penting untuk memastikan bahwa teknologi AI mampu membedakan perintah yang valid dari yang berpotensi berbahaya untuk menghindari kesalahan fatal akibat manipulasi lingkungan fisik.

Dengan demikian, kesadaran dan adaptasi terhadap risiko AI robot prompt injection menjadi bagian krusial dalam pengembangan ekosistem robot yang lebih aman dan dapat dipercaya di masa depan. Robot yang sebelumnya hanya diprogram patuh pada perintah manusia kini bisa saja mengikuti arahan dari sebuah tanda yang terpasang sembarangan, menandai babak baru tantangan keamanan pada kecerdasan buatan dan pengendalian mesin otonom.