Google Luncurkan Gemini 3.5 Flash dan Omni, AI Kini Bisa Bikin Video dari Input Apa Pun

Google memperluas lini kecerdasan buatannya dengan meluncurkan keluarga model Gemini 3.5 dan model baru bernama Gemini Omni. Langkah ini menandai dorongan baru Google untuk memperkuat AI yang tidak hanya memahami teks, tetapi juga semakin fokus pada pembuatan video dari beragam jenis input.

Sorotan terbesarnya datang dari dua produk yang langsung menyentuh pengguna. Gemini 3.5 Flash sudah tersedia untuk semua orang melalui aplikasi Gemini dan juga hadir di AI Mode dalam Google Search, sementara Gemini Omni Flash mulai digulirkan untuk pelanggan paket berbayar Google AI dan sebagian layanan kreator video Google.

Gemini 3.5 Flash jadi model default

Model pertama yang tersedia dari keluarga Gemini 3.5 adalah Gemini 3.5 Flash. Google menyebut model ini menghadirkan tingkat kecerdasan yang menyaingi model flagship besar di banyak aspek, dengan kecepatan yang selama ini menjadi ciri seri Flash.

Google juga menempatkan Gemini 3.5 Flash sebagai model default. Keputusan ini menunjukkan bahwa perusahaan ingin menjadikan model tersebut sebagai fondasi utama pengalaman AI sehari-hari di layanan konsumennya.

Dalam klaim Google, Gemini 3.5 Flash menjadi model Gemini terkuat untuk tugas agentic dan coding. Model ini disebut melampaui Gemini 3.1 Pro pada benchmark yang menantang di bidang coding dan kemampuan agentic, sekaligus memimpin dalam pemahaman multimodal.

Kemampuan agentic merujuk pada model yang bisa menjalankan rangkaian tindakan atau tugas dengan lebih mandiri. Sementara itu, pemahaman multimodal menjadi penting karena AI kini semakin sering diminta memahami kombinasi teks, gambar, audio, dan format lain dalam satu alur kerja.

Kehadiran Gemini 3.5 Flash di aplikasi Gemini memperluas akses pengguna umum terhadap model terbaru ini. Integrasinya ke AI Mode di Google Search juga menandakan bahwa peningkatan model tidak hanya berhenti di chatbot, tetapi ikut memengaruhi cara mesin pencari menyajikan bantuan berbasis AI.

Gemini Omni fokus ke video dari input apa pun

Di saat yang sama, Google memperkenalkan Gemini Omni sebagai model baru yang dirancang untuk membuat video dari jenis input apa pun. Model ini dapat menggabungkan gambar, audio, video, dan teks sebagai masukan untuk menghasilkan video berkualitas tinggi yang, menurut Google, berpijak pada pengetahuan dunia nyata milik Gemini.

Posisi Gemini Omni cukup penting karena memperlihatkan arah pengembangan AI Google yang semakin menyatu antara pemahaman multimodal dan generasi media. Bukan hanya menerima prompt teks, model ini dirancang untuk memproses berbagai bentuk materi awal menjadi video yang lebih kompleks.

Setelah video dibuat, hasilnya juga dapat diedit lewat percakapan. Pendekatan ini membuat proses penyuntingan lebih natural karena pengguna tidak harus memulai ulang dari awal setiap kali ingin mengubah hasil generasi.

Model pertama di keluarga ini adalah Gemini Omni Flash. Google menyebut model tersebut memungkinkan pengguna mengubah elemen tertentu dari video, atau bahkan seluruh isi video, lalu menyempurnakannya dalam banyak putaran tanpa kehilangan konteks dari adegan aslinya.

Fitur semacam ini penting untuk alur kreatif yang biasanya berjalan bertahap. Pengguna bisa mempertahankan benang merah adegan sambil terus menyempurnakan detail, suasana, atau komponen visual yang diinginkan.

Google juga mengatakan model ini memiliki pemahaman intuitif yang ditingkatkan terhadap gaya, energi kinetik, dan dinamika fluida. Klaim itu diarahkan untuk mendukung pembuatan adegan yang lebih realistis dibanding generasi video yang sering gagal menggambarkan gerakan fisik secara meyakinkan.

Distribusi ke Gemini, Flow, dan YouTube

Gemini Omni Flash tersedia mulai hari ini untuk semua pelanggan paket Google AI Plus, Pro, dan Ultra secara global. Aksesnya diberikan melalui aplikasi Gemini dan Google Flow.

Distribusi ini menunjukkan bahwa Google tidak menempatkan Omni hanya sebagai eksperimen terbatas. Model tersebut langsung ditautkan ke ekosistem produk yang berhubungan dengan percakapan AI dan alur kerja kreatif berbasis video.

Selain untuk pelanggan berbayar Gemini, Google juga mulai menggulirkan Gemini Omni Flash secara gratis ke pengguna YouTube Shorts dan YouTube Create. Ini memberi sinyal bahwa teknologi generasi video baru tersebut juga disiapkan untuk kebutuhan kreator konten yang lebih luas.

Google menambahkan bahwa pengguna dapat memakai suara mereka sendiri dan Avatars, yang membuat versi digital dari diri pengguna. Fitur ini membuka kemungkinan pembuatan konten yang lebih personal tanpa harus selalu merekam ulang secara manual.

Untuk aspek identifikasi konten, seluruh video yang dibuat dengan Omni akan menyertakan watermark digital SynthID. Penandaan ini menjadi salah satu elemen penting saat platform besar semakin aktif mendorong pembuatan media sintetis berbasis AI.

Peluncuran Gemini 3.5 Flash dan Gemini Omni memperlihatkan dua fokus Google yang berjalan bersamaan. Di satu sisi, perusahaan meningkatkan model inti untuk pencarian, coding, dan tugas agentic; di sisi lain, Google mendorong AI generatif ke ranah video yang lebih fleksibel, lebih dapat diedit, dan lebih dekat ke kebutuhan kreator di aplikasi sehari-hari.

Source: www.gsmarena.com

Berita Terkait

Back to top button