Google Rilis Gemini 3.5 Live Translate, Terjemahan Real-Time Tanpa Jeda yang Terasa Makin Natural

Author: Qoo Media

Google kembali mendorong batas terjemahan mesin dengan memperkenalkan Gemini 3.5 Live Translate. Teknologi ini dirancang untuk membuat percakapan lintas bahasa terasa lebih hidup, luwes, dan natural, jauh dari kesan kaku alat penerjemah konvensional.

Yang paling menarik, sistem ini tidak menunggu pembicara selesai bicara sebelum menerjemahkan. Gemini 3.5 Live Translate bekerja hampir secara real-time, sehingga potongan kalimat bisa langsung diproses dan dialihkan ke bahasa tujuan hanya dalam jeda beberapa detik.

Mesin Gemini 3 Pro di balik terjemahan instan

Fondasi utama teknologi ini berasal dari arsitektur Gemini 3 Pro. Sistem tersebut disebut mampu menangani context window audio hingga 128 ribu token dan menghasilkan output hingga 64 ribu token, baik dalam bentuk teks maupun suara.

Kemampuan lainnya mencakup pengenalan lebih dari 70 bahasa secara otomatis tanpa pengaturan manual. Suara hasil terjemahan juga dirancang tetap mempertahankan intonasi, kecepatan, dan nada asli pembicara, sambil menyaring background noise agar percakapan tetap jelas di lingkungan ramai.

Tiga pengujian untuk menjaga kualitas

Google DeepMind menguji model ini melalui tiga tolok ukur utama. Fokusnya mencakup kualitas terjemahan dengan AutoMQM, kecepatan respons sejak suara masuk hingga keluaran terjemahan, serta kealamian suara agar hasil audio tidak terdengar putus atau menyimpang.

Di sisi lain, Google juga mengakui teknologi ini belum sepenuhnya sempurna. Karakter suara AI masih bisa menjadi tidak konsisten atau berubah gender secara tiba-tiba setelah jeda percakapan yang terlalu panjang.

Cocok untuk percakapan harian hingga kebutuhan bisnis

Gemini 3.5 Live Translate diposisikan untuk banyak skenario penggunaan. Teknologi ini dinilai cocok untuk layanan pelanggan, pendidikan global, hingga live streaming karena mampu menjaga percakapan tetap cepat dan lancar.

Grab bahkan sudah menguji teknologi ini untuk membantu komunikasi antara penumpang asing dan pengemudi lokal. Di ranah korporat, integrasi ke layanan panggilan video massal juga membuka peluang rapat daring dengan ribuan kombinasi bahasa dalam satu ruangan virtual.

Sudah mulai hadir di aplikasi dan platform Google

Bagi pengguna umum Android dan iOS, fitur ini bisa dicoba melalui pembaruan aplikasi Google Translate. Pengguna cukup menghubungkan ponsel dengan headset untuk memulai percakapan lintas bahasa yang lebih privat.

Khusus pengguna Android, Google menambahkan mode mendengarkan atau listening mode. Mode ini memungkinkan suara terjemahan keluar langsung dari earpiece ponsel, sehingga proses mendengar hasil terjemahan terasa lebih praktis.

Akses bertahap dan pengamanan suara

Google merilis Gemini 3.5 Live Translate secara bertahap melalui berbagai platform digital miliknya. Developer sudah dapat mengaksesnya lewat API resmi dan Google AI Studio, sementara pelanggan bisnis tertentu mulai menerima pembaruan di platform pertemuan virtual.

Ekspansi ini juga dibarengi perlindungan untuk mencegah penyalahgunaan teknologi suara. Setiap audio yang dihasilkan diberi watermark digital SynthID yang melekat secara permanen pada gelombang audio, tetapi tidak terdengar oleh telinga manusia.

Langkah itu disiapkan untuk menekan risiko deepfake, misinformasi, dan penipuan berbasis suara. Dengan pendekatan ini, Google berupaya membawa terjemahan real-time ke level baru tanpa mengabaikan aspek keamanan dan kepercayaan pengguna.

Source: www.gadgetdiva.id
Terbaru