Google memamerkan lompatan baru Gemini untuk mobil dengan fungsi yang langsung terasa praktis: AI kini bisa menjawab pertanyaan tentang apa yang ada di luar kendaraan. Bukan sekadar memberi rute atau membaca data peta, sistem ini memanfaatkan kamera depan mobil untuk memahami lingkungan nyata di depan pengemudi.
Demo itu menarik karena menunjukkan arah baru asisten di mobil modern. Gemini tidak hanya merespons perintah suara, tetapi juga mulai “melihat” dunia di sekitar kendaraan saat diminta pengguna.
Fitur ini masih berstatus eksperimental dan diperlihatkan oleh Presiden Android Google, Sameer Samat, dalam percakapan dengan Logan Kilpatrick, Product Lead untuk Google AI Studio. Demonstrasi berlangsung di dalam Volvo EX60 yang menjalankan platform Google built-in dengan Gemini.
Volvo EX60 yang dipakai dalam demo juga belum mulai dikirim ke konsumen. Untuk saat ini, mobil tersebut tampaknya menjadi satu-satunya kendaraan yang mendukung kemampuan baru ini, dan Google belum menjelaskan rencana perluasan dukungannya ke model lain.
Gemini memakai kamera mobil sebagai “mata”
Konsepnya mirip dengan mode kamera Gemini Live di ponsel Android. Bedanya, pengguna tidak perlu mengarahkan ponsel ke objek karena kamera depan mobil yang menjadi sumber visual bagi AI.
Sameer Samat mengatakan Google ingin melihat apa yang terjadi jika Gemini bisa melihat dunia saat pengguna berkendara melewatinya. Dari sana, asisten dapat menjawab pertanyaan berdasarkan apa yang benar-benar ada di depan mobil pada saat itu.
Pendekatan ini penting karena selama ini asisten di kendaraan umumnya bergantung pada navigasi, data peta, dan perintah suara biasa. Dengan akses visual sementara, Gemini berpotensi memberi jawaban yang lebih kontekstual sesuai situasi nyata di jalan.
Privasi jadi perhatian utama
Google juga langsung menyinggung isu privasi yang hampir pasti muncul dari fitur seperti ini. Menurut Samat, Gemini tidak memantau kondisi sekitar secara terus-menerus.
Akses kamera hanya diberikan setelah pengguna secara eksplisit memanggil Gemini dan mengajukan pertanyaan. Setelah itu, kamera mengirim umpan visual ke Gemini, AI memprosesnya untuk menjawab, lalu kembali tidak bisa melihat lagi.
Penjelasan ini menunjukkan Google mencoba membatasi akses visual hanya pada momen yang memang diminta pengguna. Model seperti ini berbeda dari sistem yang aktif sepanjang waktu dan terus mengamati lingkungan tanpa jeda.
Meski begitu, pengalaman yang ditunjukkan belum sepenuhnya mulus. Dalam demonstrasi itu terlihat ada jeda saat umpan kamera terhubung ke Gemini sebelum jawaban diberikan.
Tidak seperti Gemini Live di ponsel, layar infotainment mobil tidak menampilkan viewfinder langsung. Pengguna hanya mendengar respons suara Gemini setelah sistem selesai memproses apa yang ditangkap kamera.
Hasil demo menunjukkan pemahaman visual yang kuat
Walau ada sedikit keterlambatan, kemampuan visual Gemini dalam demo itu terlihat cukup mengesankan. Samat meminta Gemini mengidentifikasi tengara yang terlihat melalui kaca depan di sekitar kampus Google di Mountain View.
Gemini disebut mampu mengenali beberapa lokasi penting setempat dengan benar. AI itu juga menjelaskan detail instalasi seni publik The Orb, menggambarkan Gradient Canopy yang merupakan atap surya, dan memaparkan sejarah arsitektur Shoreline Amphitheater di dekatnya.
Kemampuan semacam ini menunjukkan Gemini tidak hanya mengenali objek secara umum. Dalam contoh yang diperlihatkan, AI juga bisa menambahkan konteks dan penjelasan yang lebih kaya tentang apa yang dilihatnya.
Bagi pengguna, potensi manfaatnya cukup luas jika fitur ini benar-benar matang. Asisten bisa menjadi sumber informasi spontan saat mobil sedang melintas di area baru, tanpa harus bergantung penuh pada informasi peta yang sudah tersedia.
Google sendiri memberi contoh penggunaan yang lebih dekat ke kebutuhan perjalanan sehari-hari. Salah satunya adalah membantu memahami rambu jalan yang ditulis dalam bahasa asing saat pengguna sedang bepergian.
Arah baru untuk mobil dengan Google built-in
Demo ini memberi sinyal bahwa Google sedang mengeksplorasi cara memperluas kemampuan multimodal Gemini dari ponsel ke kendaraan. Artinya, mobil bukan lagi hanya tempat menjalankan aplikasi dan navigasi, tetapi juga perangkat yang bisa memahami situasi visual di sekitarnya.
Perubahan itu bisa membuat interaksi dengan asisten di mobil terasa lebih alami. Pengguna cukup bertanya tentang apa yang sedang ada di depan kendaraan, lalu AI merespons berdasarkan penglihatan aktual, bukan hanya lokasi digital.
Namun, Google belum mengumumkan peluncuran lebih luas untuk fitur ini. Perusahaan juga belum memastikan apakah kemampuan tersebut nantinya akan hadir ke kendaraan lain yang memakai Google built-in.
Di akhir demonstrasi, Samat menyebut Google masih mencari cara terbaik untuk menghadirkan kemampuan ini ke kendaraan. Pernyataan itu menunjukkan fitur tersebut masih dalam tahap eksplorasi, meski arah pengembangannya sudah terlihat jelas dari demo yang diperlihatkan.
