Huawei Melawan Nvidia dengan Atlas 350, Pertaruhan Besar di Era AI Inference

Huawei mempertegas langkahnya dalam perang teknologi Amerika Serikat dan China lewat peluncuran Atlas 350, sebuah akselerator AI yang difokuskan untuk inference. Produk ini tidak diarahkan untuk melatih model AI dari nol, melainkan untuk menjalankan model yang sudah jadi dalam penggunaan nyata seperti chatbot, mesin rekomendasi, dan aplikasi multimodal.

Arah ini penting karena beban industri AI kini makin bergeser ke inference. Saat adopsi AI meluas ke layanan harian, tantangan terbesar bukan hanya melatih model besar, tetapi menjalankannya secara cepat, hemat daya, dan efisien dalam skala besar.

Fokus Huawei Beralih ke Inference

Atlas 350 dibangun di atas chip Ascend 950PR. Menurut data dari artikel referensi, chip ini mampu menghadirkan komputasi sekitar 1,56 petaflops pada presisi FP4 untuk beban kerja tertentu.

Huawei mengklaim Atlas 350 dapat memberi peningkatan performa hingga 2,8 kali dibanding Nvidia H20 pada skenario inference tertentu. Klaim ini menempatkan Atlas 350 sebagai produk yang secara langsung menantang posisi Nvidia di segmen AI yang sangat penting bagi pusat data dan layanan komersial.

Presisi FP4 menjadi salah satu kunci desain tersebut. Format ini memungkinkan proses komputasi berjalan lebih cepat dan penggunaan memori bisa ditekan, sehingga cocok untuk deployment model AI dalam jumlah besar ketika efisiensi lebih dibutuhkan dibanding akurasi presisi tinggi seperti pada tahap training.

Mengapa Inference Jadi Medan Pertarungan Baru

Dalam ekosistem AI, training dan inference memiliki kebutuhan yang berbeda. Training membutuhkan daya komputasi sangat besar untuk membangun model, sedangkan inference berfokus pada kecepatan respons saat model dipakai oleh pengguna akhir.

Perubahan ini sejalan dengan tren industri global. Banyak perusahaan kini lebih membutuhkan infrastruktur untuk menjalankan model bahasa besar, asisten digital, pencarian cerdas, dan sistem agen AI, bukan sekadar melatih model baru dari awal.

Huawei tampaknya membaca perubahan itu. Dengan menargetkan inference, perusahaan dapat masuk ke area yang permintaannya tumbuh cepat dan sekaligus mengurangi ketergantungan China pada chip AI asal Amerika Serikat.

Spesifikasi yang Menjadi Sorotan

Selain komputasi, aspek memori juga menjadi perhatian pada Atlas 350. Artikel referensi menyebut konfigurasi memori bandwidth tinggi buatan internal dilaporkan bisa mencapai 128GB dengan bandwidth 1,6 TB/s.

Langkah ini penting karena menunjukkan upaya Huawei memperkuat rantai pasok domestik. Semakin besar porsi komponen yang dikembangkan sendiri, semakin kecil ketergantungan pada pemasok luar negeri yang dapat terdampak pembatasan ekspor.

Chip ini juga disebut dioptimalkan untuk tahap “prefill” dalam inference. Tahap ini krusial karena menentukan seberapa cepat sistem memproses masukan awal sebelum menghasilkan respons, terutama pada layanan AI real-time.

Berikut poin utama Atlas 350 yang banyak disorot:

  1. Fokus utama pada AI inference, bukan training.
  2. Menggunakan chip Ascend 950PR.
  3. Kinerja sekitar 1,56 petaflops FP4.
  4. Klaim hingga 2,8 kali lebih baik dari Nvidia H20 pada workload tertentu.
  5. Dukungan memori hingga 128GB dengan bandwidth 1,6 TB/s.
  6. Dioptimalkan untuk tahap prefill agar respons AI lebih cepat.

Dampak dalam Persaingan Huawei dan Nvidia

Nvidia selama ini menjadi pemain dominan dalam komputasi AI global. Namun pembatasan ekspor chip canggih dari Amerika Serikat ke China membuka ruang bagi pemain domestik seperti Huawei untuk mempercepat pengembangan alternatif lokal.

Dalam konteks itu, Atlas 350 bukan sekadar produk baru. Kehadirannya menjadi simbol upaya China membangun kemandirian infrastruktur AI di tengah tekanan geopolitik dan pembatasan akses terhadap teknologi semikonduktor mutakhir.

Bagi Nvidia, perkembangan ini patut diperhatikan karena China adalah pasar besar untuk komputasi AI. Jika solusi lokal makin kompetitif, pangsa pasar perusahaan asing di segmen tertentu bisa tertekan, terutama untuk kebutuhan yang lebih spesifik di dalam negeri.

Bukan Hanya Chip, tetapi Ekosistem

Huawei juga tidak hanya mendorong satu komponen. Perusahaan ini disebut membangun ekosistem AI yang lebih luas, mencakup perangkat keras, penyimpanan, dan sistem komputasi skala besar yang dirancang agar bekerja terintegrasi.

Strategi ini mirip dengan pendekatan vertikal yang dipakai perusahaan teknologi besar lain. Bedanya, Huawei menyusunnya dengan fokus pada kebutuhan infrastruktur domestik China, sehingga kontrol atas deployment, kompatibilitas, dan optimasi dapat dibuat lebih rapat.

Bagi pasar, pendekatan itu bisa menghasilkan layanan AI yang lebih cepat dan lebih terjangkau, terutama di China. Di saat yang sama, langkah ini juga mempertegas kemungkinan munculnya dua ekosistem AI yang makin terpisah, satu dipimpin perusahaan Amerika Serikat dan satu lagi bertumpu pada teknologi China.

Jika Atlas 350 benar-benar mampu memenuhi klaim performanya dalam implementasi lapangan, persaingan AI tidak lagi hanya ditentukan oleh siapa yang punya chip training paling kuat. Medan persaingan berikutnya justru bisa bergeser ke siapa yang paling efisien menjalankan AI dalam penggunaan sehari-hari, dan di titik itu Huawei sedang berupaya menempatkan dirinya sebagai penantang serius Nvidia.

Source: www.gizmochina.com
Exit mobile version