DeepSeek kembali menjadi sorotan setelah merilis pembaruan model AI bernama DeepSeek V4. Model baru dari perusahaan teknologi asal China itu diposisikan untuk menantang model papan atas dari OpenAI, Anthropic, dan Google seperti ChatGPT, Claude, dan Gemini.
Fokus utama DeepSeek V4 bukan hanya mengejar performa mentah, tetapi juga efisiensi biaya dan kemampuan menangani konteks sangat panjang. Di titik ini, DeepSeek mencoba menawarkan nilai yang berbeda dibanding model AI Amerika yang umumnya kuat, tetapi mahal saat dipakai untuk beban kerja besar.
DeepSeek V4 dan konteks 1 juta token
Salah satu klaim terpenting dari DeepSeek V4 adalah dukungan context window hingga 1 juta token. Artinya, model dapat menerima input sangat panjang, baik berupa kata maupun karakter, lalu menghasilkan respons dengan mempertimbangkan keseluruhan materi tersebut.
Kemampuan ini dinilai penting untuk tugas berdurasi panjang dan alur kerja AI agent yang membutuhkan banyak referensi sekaligus. DeepSeek menyatakan model barunya dirancang agar penanganan tugas kompleks, penalaran panjang, dan otomasi berbasis agen menjadi lebih praktis.
Jajaran V4 terdiri dari dua model, yakni DeepSeek-V4-Pro dan DeepSeek-V4-Flash. Versi Pro memiliki total 1,6 triliun parameter dengan 49 miliar parameter aktif saat digunakan, sedangkan versi Flash membawa 284 miliar parameter total dengan 13 miliar parameter aktif.
Kedua model ini disebut dilatih menggunakan lebih dari 32 triliun token. Dengan skala pelatihan tersebut, DeepSeek menargetkan pemrosesan teks dalam jumlah besar dalam satu kali jalan secara lebih efisien.
Strategi utama: efisiensi, bukan sekadar adu benchmark
Dalam materi yang dirilis perusahaan, DeepSeek menekankan bahwa seri V4 bisa bersaing dengan model proprietary teratas di sejumlah tolok ukur. DeepSeek juga menyoroti konfigurasi penalaran tertinggi, DeepSeek-V4-Pro-Max, yang diklaim tampil kuat pada tugas coding dan reasoning.
Menurut klaim perusahaan, model itu bahkan mampu melampaui pesaing pada beberapa benchmark pemrograman dan evaluasi shortlist. Namun hasil tersebut tidak sepenuhnya bersih karena pada sejumlah pengujian yang menuntut pengetahuan luas, DeepSeek masih tertinggal dari Claude dan ChatGPT.
Posisi ini menunjukkan arah strategi yang cukup jelas. DeepSeek tampaknya tidak hanya ingin dikenal sebagai model dengan skor tertinggi, melainkan sebagai model yang cukup kuat dengan ongkos penggunaan lebih rendah.
Perbedaan itu terlihat pada pendekatan teknis yang dipakai. DeepSeek V4 menggunakan sistem hybrid attention yang menggabungkan Compressed Sparse Attention atau CSA dan Heavily Compressed Attention atau HCA.
Secara sederhana, teknik tersebut dibuat untuk menekan jumlah data yang perlu diproses model pada satu waktu. Efeknya, kebutuhan komputasi bisa turun, terutama saat model harus menangani input yang sangat panjang.
DeepSeek menyebut dalam makalah teknisnya bahwa DeepSeek-V4-Pro hanya memerlukan 27 persen komputasi dan 10 persen memory cache dibanding model V3.2 sebelumnya pada pengaturan 1 juta token. Varian Flash disebut mendorong efisiensi itu lebih jauh lagi.
Masih menantang, tetapi belum memimpin
Meski peluncuran V4 tergolong penting, performa keseluruhannya menunjukkan bahwa AI China belum mengambil alih posisi terdepan. Artikel referensi menyebut DeepSeek V4 pada banyak benchmark berada di level yang menyamai ChatGPT 5.2 atau Claude 4.6, yang sudah satu atau dua generasi di belakang model terbaru.
Artinya, DeepSeek belum sepenuhnya menyalip pemain Amerika dalam performa absolut. Namun, jarak yang belum tertutup itu dikompensasi dengan model distribusi yang lebih terbuka dan harga API yang jauh lebih murah.
Di sinilah DeepSeek kembali memainkan kartu yang sama seperti sebelumnya, yakni open-source dan biaya rendah. Strategi tersebut memberi daya tarik bagi organisasi yang tidak selalu membutuhkan model termahal, tetapi tetap memerlukan AI yang kuat untuk coding, analisis panjang, dan automasi kerja.
Bagi perusahaan global, pertimbangan biaya bisa menjadi faktor penentu. DeepSeek tampaknya berharap banyak pengguna bisnis akan memilih V4 karena dianggap “cukup bagus” untuk banyak tugas, sambil menghindari beban biaya tinggi dari model premium seperti Claude.
Dinamika baru dalam persaingan AI China dan AS
Kemunculan DeepSeek V4 memperpanjang persaingan AI antara China dan Amerika Serikat. Jika sebelumnya DeepSeek sudah mendapat banyak perhatian karena berhasil menantang dominasi OpenAI, Anthropic, dan Google, pembaruan ini memperlihatkan bahwa persaingan itu belum mereda.
V4 menunjukkan bahwa kompetisi kini tidak hanya ditentukan oleh siapa yang punya model paling pintar. Efisiensi komputasi, konteks masif, akses open-source, dan harga API yang agresif mulai menjadi faktor yang sama pentingnya dalam menentukan model mana yang paling menarik untuk dipakai di dunia nyata.
Dengan kombinasi context window 1 juta token, arsitektur yang lebih hemat sumber daya, dan positioning harga yang murah, DeepSeek V4 muncul sebagai penantang serius di pasar AI global. Meski belum unggul mutlak atas Claude, Gemini, dan ChatGPT dalam semua aspek, model baru ini memperlihatkan bahwa tekanan terhadap pemain Amerika kini datang bukan hanya dari performa, tetapi juga dari efisiensi dan biaya.
Source: www.indiatoday.in






