Google baru saja meluncurkan pembaruan signifikan untuk Gemini 3 Deep Think. Pembaruan ini membuat model AI tersebut mampu menaklukkan berbagai tolok ukur paling menantang saat ini.
Gemini 3 Deep Think adalah mode khusus dalam ekosistem Gemini yang dirancang khusus untuk berpikir dan bernalar pada berbagai masalah kompleks. Mode ini mendapatkan perbaikan yang dikembangkan bersama para ilmuwan dan peneliti guna menghadapi tantangan dunia nyata.
Skor Gemilang pada Benchmark Tersulit
Kepala Google, Sundar Pichai, menyatakan bahwa pembaruan tersebut membuat Gemini 3 Deep Think semakin unggul dalam berbagai tolok ukur ketat. Ia menyebutkan kemajuan ini di X (platform sebelumnya bernama Twitter) sebagai terobosan dalam menyelesaikan masalah paling rumit.
Demis Hassabis, pendiri DeepMind, juga mengumumkan prestasi Gemini 3 Deep Think melalui X. Menurutnya, AI ini mencetak rekor baru dalam kategori matematika, sains, dan keterampilan bernalar yang paling ketat.
Benchmark adalah metode standar yang mengukur seberapa baik sebuah AI dapat mengatasi berbagai skenario sulit. Hasil Gemini 3 Deep Think sangat impresif, yaitu:
- 84,6% pada ARC-AGI-2 (salah satu tes kecerdasan tingkat tinggi).
- 48,4% pada Humanity’s Last Exam tanpa menggunakan alat bantu.
- 3455 Elo rating pada Codeforces, menunjukkan kemampuan pemrograman yang mumpuni.
Keunggulan pada Humanity’s Last Exam
Humanity’s Last Exam adalah benchmark akademik tertutup yang terkenal paling sulit di dunia AI. Rata-rata skor AI lain dalam tes ini di bawah 30%, sedangkan skor manusia mencapai hampir 90%. Dengan skor 48,4%, Gemini 3 Deep Think tidak hanya melampaui AI lain, tapi juga mulai mendekati kecerdasan manusia.
Prestasi ini menandai kemajuan signifikan karena model AI tersebut mampu mengatasi soal-soal dengan tingkat kompleksitas dan pemahaman tinggi. Ini menjadi tanda bahwa AI kini mulai mengurangi kesenjangan performa dengan kemampuan kognitif manusia.
Fungsi dan Aplikasi Dalam Dunia Nyata
Gemini 3 Deep Think tidak hanya fokus pada angka dan kode. Google menegaskan bahwa model ini sudah mampu menangani masalah kompleks di berbagai bidang ilmu seperti fisika, kimia, dan penelitian teoretis tingkat lanjut. Ini membuka peluang AI sebagai asisten cerdas untuk para ilmuwan dan insinyur.
Google menyebutkan bahwa model ini telah mencapai performa setara medali emas di ujian tulis sekelas International Physics Olympiad 2025 dan International Chemistry Olympiad 2025. Skor yang kuat juga didapat pada CMT-Benchmark, memperkuat posisi AI ini sebagai alat riset yang dapat diandalkan dalam situasi ilmiah rumit.
Akses Terbatas dan Peluang bagi Pengguna dan Peneliti
Untuk saat ini, akses ke Gemini 3 Deep Think masih terbatas. Google meluncurkannya bagi pelanggan Google AI Ultra melalui aplikasi Gemini. Para peneliti, insinyur, dan perusahaan juga bisa mengajukan permohonan akses awal melalui API Gemini.
Perusahaan membuka program minat ekspresi (expression-of-interest) sebagai langkah awal memperluas penggunaan teknologi ini. Langkah ini dimaksudkan untuk memastikan teknologi dapat digunakan secara optimal oleh berbagai kalangan dengan kebutuhan tinggi dalam pengembangan inovasi.
Dampak dan Potensi Masa Depan
Kemajuan Gemini 3 Deep Think menunjukkan perkembangan teknologi AI dalam kemampuan berpikir kritis dan pengambilan keputusan berbasis data kompleks. Keberhasilan ini dapat mengubah cara penelitian sains dan rekayasa dilakukan, mempercepat penemuan serta solusi masalah global.
Dalam waktu dekat, AI seperti Gemini 3 Deep Think akan menjadi aset penting bagi bidang akademis dan industri yang menuntut analisis mendalam dan presisi tinggi. Google terus bekerja sama dengan komunitas ilmiah untuk meningkatkan kemampuan model ini dan memperluas aplikasinya.
Inovasi ini menegaskan bahwa AI semakin mendekati level kecerdasan dan pemahaman manusia, menandai era baru kolaborasi manusia dan mesin dalam mencapai terobosan ilmiah serta teknologi.





