Google memperkenalkan generasi kedelapan Tensor Processing Unit atau TPU untuk pusat datanya. Pembaruan ini menonjol karena Google kini memisahkan chip untuk pelatihan AI dan chip untuk inferensi, dengan klaim utama berupa efisiensi energi yang lebih baik.
Langkah itu penting karena beban kerja AI tidak selalu membutuhkan jenis perangkat keras yang sama. Di satu sisi, pendekatan ini berpotensi mengurangi konsumsi daya dan dampak lingkungan, tetapi di sisi lain belum ada kepastian apakah penghematan tersebut akan menurunkan biaya bagi pengguna.
Google membagi TPU berdasarkan fungsi
Dalam pengumuman di ajang Cloud Next 2026, Google memperkenalkan dua arsitektur baru. TPU 8t ditujukan untuk melatih model AI, sedangkan TPU 8i difokuskan untuk tugas inferensi.
Pemisahan ini didasarkan pada kebutuhan komputasi yang berbeda di antara keduanya. Google menyebut desain terpisah itu bisa membantu pusat data menekan konsumsi energi sekaligus menurunkan biaya operasional.
Inferensi adalah tahap ketika model AI yang sudah dilatih digunakan untuk menarik kesimpulan atau membuat prediksi. Fungsi ini menjadi inti layanan chatbot dan asisten AI, termasuk saat sistem merespons pertanyaan pengguna.
Mengapa pelatihan dan inferensi tidak sama
Pelatihan model AI jauh lebih berat dibanding inferensi. Proses ini membutuhkan memori berbandwidth tinggi dan klaster pemroses besar karena miliaran parameter harus diperbarui secara terus-menerus.
Artikel referensi menjelaskan bahwa pelatihan melibatkan “backward propagation of errors,” yaitu rangkaian umpan balik berulang untuk menguji dan mengoptimalkan jaringan saraf hingga mampu menghasilkan jawaban yang akurat. Karena beban ini sangat besar, perangkat keras untuk pelatihan juga harus jauh lebih kuat.
Sebaliknya, inferensi dinilai lebih ringan. Tugas ini bisa dijalankan pada perangkat keras yang tidak sekompleks sistem pelatihan dan dengan kebutuhan memori yang lebih rendah.
Dari sini, alasan pemisahan TPU menjadi lebih jelas. Jika satu jenis perangkat keras dipakai untuk dua tugas yang sangat berbeda, biaya aktual untuk pekerjaan inferensi bisa menjadi lebih tinggi dari yang semestinya.
Klaim ramah lingkungan jadi sorotan
Google menekankan manfaat lingkungan dari strategi barunya. Dengan memakai TPU khusus untuk inferensi, kebutuhan energi pada penggunaan nyata disebut bisa ditekan.
Dampaknya tidak hanya terkait listrik. Artikel referensi juga menyinggung kemungkinan berkurangnya kebutuhan air untuk mendinginkan pusat data, terutama untuk layanan AI seperti Gemini yang digunakan dalam skala besar.
Narasi ini sejalan dengan tekanan global terhadap industri AI yang dinilai semakin boros sumber daya. Karena pusat data menjadi tulang punggung layanan AI modern, efisiensi perangkat keras kini menjadi isu teknis sekaligus lingkungan.
Google sebelumnya juga pernah memperkenalkan TPU v5e, yang huruf “e”-nya disebut terkait efisiensi, untuk operasi berskala lebih kecil. TPU 8i tampak sebagai pengembangan konsep serupa untuk kebutuhan yang lebih besar.
Efisiensi belum tentu berarti harga lebih murah
Meski manfaat lingkungan cukup jelas dalam penjelasan Google, sisi biaya masih menyisakan pertanyaan. Artikel referensi menegaskan belum ada janji bahwa efisiensi baru ini akan diteruskan menjadi harga yang lebih rendah bagi pelanggan.
Ini menjadi titik penting dalam pembahasan soal AI dan infrastruktur cloud. Jika biaya operasional turun tetapi tarif layanan tetap sama, maka keuntungan terbesar dari efisiensi tersebut akan lebih banyak dinikmati penyedia platform.
Dengan kata lain, langkah Google bisa sangat baik bagi jejak lingkungan pusat data. Namun, manfaat ekonominya bagi konsumen dan pelanggan bisnis belum terlihat.
Kondisi itu juga relevan karena inferensi adalah bagian yang paling dekat dengan penggunaan sehari-hari. Saat pengguna memakai chatbot, generator teks, atau layanan AI lain, yang bekerja di belakang layar terutama adalah proses inferensi, bukan pelatihan.
Bila tugas inferensi kini bisa dijalankan pada hardware yang lebih hemat, secara teori biaya layanan dapat ditekan. Namun untuk saat ini, Google belum menyampaikan komitmen bahwa penghematan tersebut akan berdampak langsung pada harga.
Persaingan infrastruktur AI makin mengarah ke spesialisasi
Pendekatan Google bukan tanpa pembanding. Artikel referensi menyebut Amazon juga mengejar tujuan serupa melalui AWS Inferentia, yang dirancang untuk beban inferensi.
Fakta ini menunjukkan perubahan arah industri cloud AI. Vendor besar kini tidak hanya mengejar chip yang paling kuat, tetapi juga chip yang paling sesuai untuk jenis pekerjaan tertentu.
Spesialisasi seperti ini dapat membuat pusat data bekerja lebih efisien. Namun, ukuran keberhasilannya pada akhirnya tidak hanya ditentukan oleh klaim teknis, melainkan juga oleh dampaknya terhadap biaya layanan, konsumsi energi, dan penggunaan sumber daya dalam operasi AI skala besar.
Untuk saat ini, generasi kedelapan TPU Google memberi sinyal kuat bahwa efisiensi lingkungan mulai menjadi bagian inti dari desain chip AI. Pertanyaan yang belum terjawab adalah apakah keuntungan dari efisiensi itu nantinya ikut dirasakan pengguna, atau hanya memperkuat posisi bisnis penyedia infrastruktur cloud.
Source: www.androidauthority.com