Nvidia Dan Microsoft Sama-Sama Bertaruh, Agen AI Harus Punya Hardware Khusus

Dalam rentang 24 jam di awal Juni, Nvidia dan Microsoft menyampaikan taruhan yang sama: agen AI mungkin butuh hardware yang dirancang khusus untuk mereka. Nvidia memposisikan RTX Spark sebagai fondasi PC Windows baru yang dibangun di sekitar asisten pribadi, sementara Microsoft memperkenalkan Project Solara sebagai platform perangkat yang menjalankan agen alih-alih aplikasi tradisional.

Taruhan itu penting karena akan memengaruhi cara perusahaan membeli perangkat, menyusun anggaran, dan merancang keamanan endpoint. Jika agen benar-benar menjadi cara karyawan bekerja, pertanyaannya bukan hanya apa yang bisa dilakukan perangkat, tetapi juga di mana kecerdasan itu seharusnya berjalan.

Dua pendekatan, satu keyakinan

RTX Spark menggabungkan CPU Arm-based Grace dengan prosesor grafis Blackwell dalam sistem ringkas yang membawa hingga 128GB unified memory melalui interconnect NVLink milik Nvidia. Perusahaan menyebut platform ini sanggup menjalankan model sekitar 120 miliar parameter dengan context window hingga 1 juta token tanpa harus bolak-balik ke pusat data.

Nvidia juga menyiapkan RTX Spark dalam bentuk laptop dan desktop kecil dari Asus, Dell, HP, Lenovo, Microsoft Surface, dan MSI. Cara penyajiannya jelas: PC diposisikan bukan sekadar alat, tetapi rekan kerja.

Project Solara mengambil jalur berbeda untuk ide yang serupa. Alih-alih chip baru, Microsoft menampilkan platform software berbasis sistem operasi ringan turunan Android Open Source Project yang disebut Microsoft Device Ecosystem Platform.

Platform itu berjalan pada hardware referensi dengan chip dari Qualcomm dan MediaTek. Microsoft juga mendemonstrasikan dua konsep perangkat untuk pekerja enterprise, yaitu desk companion dan wearable badge.

Solara menonjolkan apa yang disebut Microsoft sebagai just-in-time interfaces. Dalam pendekatan ini, agen membangun layar yang diperlukan untuk tugas tertentu, sehingga developer tidak harus mendesain ulang aplikasi untuk setiap bentuk perangkat.

Pasar yang semakin ramai

Persaingan infrastruktur agen sejauh ini banyak terjadi di data center. Nvidia, Google lewat tensor processing unit Ironwood, dan AWS dengan Trainium sama-sama bersaing untuk melatih dan menjalankan model di balik sistem agentic.

RTX Spark dan Project Solara mendorong persaingan itu ke edge, langsung ke perangkat yang dipakai orang. Microsoft bukan satu-satunya pemain yang mengejar platform agen, karena Google, Salesforce, dan OpenAI juga membangun pendekatan mereka sendiri.

Namun Microsoft termasuk yang paling awal berargumen bahwa agen layak mendapat perangkat khusus yang bukan ponsel dan bukan PC tradisional. Itulah yang membuat Solara menarik sekaligus dipertanyakan, karena kategori perangkatnya masih sangat baru.

Perbedaan pandangan soal di mana kerja berat dilakukan

Nvidia dan Microsoft sebenarnya tidak hanya memperkenalkan produk, tetapi juga dua teori berbeda. Nvidia ingin komputasi berat berlangsung secara lokal, sehingga sebagian besar silikon RTX Spark dipakai untuk GPU yang kuat.

Microsoft justru membangun Solara dengan model chip-to-cloud. Pada pendekatan ini, perangkat berdaya rendah menangani input dan keamanan, sementara inferensi yang berat berjalan di Azure.

Dengan kata lain, Nvidia melihat perangkat sebagai mesin utama. Microsoft melihat perangkat sebagai pintu depan yang aman menuju kecerdasan yang berada di tempat lain.

Keraguan yang belum hilang

Argumen paling kuat yang meragukan kebutuhan hardware agen datang dari luar kedua perusahaan itu. Ben Thompson dari Stratechery menilai konfigurasi ideal untuk agen lokal adalah CPU kuat yang tetap mengandalkan cloud untuk inferensi.

Dalam pandangan itu, RTX Spark mengalokasikan die space ke core GPU yang tetap kalah dibandingkan data center dalam hal memori dan bandwidth. Artinya, pembeli berpotensi membayar mahal untuk tenaga lokal yang tetap lebih baik dan lebih murah jika dijalankan di cloud.

Keraguan serupa juga muncul dari desain Microsoft sendiri. Jika perangkat Solara pada akhirnya memanggil agen berbasis cloud untuk menjalankan tugas utama, maka hardware di meja kerja lebih mirip terminal terkelola daripada workstation AI.

Masalahnya, Solara masih sangat awal menurut pengakuan Microsoft sendiri. Program ini baru berupa pilot, sementara ketersediaan luas baru diharapkan pada akhir 2027 atau 2028.

Apa yang perlu dicermati perusahaan

Untuk pengambil keputusan, yang paling berguna adalah memisahkan lapisan orkestrasi dan keamanan dari lapisan inferensi. Dua pengumuman ini kuat pada sisi pertama, tetapi masih lemah pada sisi kedua.

Keuntungan seperti konteks lokal, latensi lebih rendah, data yang tidak keluar dari gedung, dan manajemen perangkat terpusat memang konkret. Namun menjalankan model frontier di meja kerja tetap menjadi penjualan yang sulit selama cloud masih unggul untuk model terbesar.

Langkah paling realistis adalah memantau pilot, bukan hanya presentasi panggung. Jika AccuWeather, CVS Health, dan Target menunjukkan bahwa perangkat agen khusus bisa menurunkan waktu penanganan atau tingkat kesalahan dalam tugas tertentu, kategori ini bisa masuk ke pembahasan anggaran 2027.

Sampai bukti itu muncul, pembacaan yang lebih aman adalah bahwa agen akan lebih dulu mengubah cara orang memakai perangkat yang sudah ada. Hardware baru mungkin datang, tetapi jalan menuju ke sana masih harus dibuktikan oleh hasil pilot di dunia nyata.

Berita Terkait

Back to top button