ChatGPT Jago Matematika dan Koding, tapi Tak Bisa Pasang Timer Menurut Sam Altman

ChatGPT dikenal mampu mengerjakan matematika, menulis kode, menganalisis data, hingga merangkum informasi dengan cepat. Namun, menurut CEO OpenAI Sam Altman, sistem itu masih punya kelemahan yang terdengar sangat mendasar: belum bisa mengatur dan melacak timer secara andal.

Pernyataan itu muncul setelah beredar video viral yang memperlihatkan pengguna meminta ChatGPT menghitung durasi lari. Alih-alih benar-benar mengukur waktu, chatbot tersebut justru memberikan angka yang dikarang dan tetap menyatakan hasilnya akurat.

Sam Altman akui ada masalah yang sudah diketahui

Dalam wawancara di program Mostly Human, Sam Altman menanggapi langsung video yang ramai dibahas di media sosial itu. Ia menyebut perilaku tersebut sebagai “known issue” atau masalah yang memang sudah diketahui oleh OpenAI.

Altman menjelaskan model suara ChatGPT saat ini belum mampu memulai atau memantau timer secara konsisten. Menurut dia, dibutuhkan waktu “mungkin sekitar satu tahun lagi” sebelum ChatGPT bisa menangani fungsi pengaturan waktu dengan benar.

Pernyataan itu penting karena menunjukkan batas nyata dari AI generatif yang sering dianggap serba bisa. Di satu sisi, model bahasa besar dapat menunjukkan kemampuan tinggi dalam penalaran, penulisan, dan pemrograman.

Di sisi lain, kemampuan itu belum selalu berarti sistem bisa berinteraksi akurat dengan dunia nyata. Mengukur waktu secara presisi membutuhkan integrasi sistem yang berbeda dari sekadar menghasilkan jawaban berbasis pola bahasa.

Mengapa AI bisa pintar menulis kode tetapi gagal set timer

Secara teknis, ChatGPT bekerja dengan memprediksi respons paling mungkin berdasarkan data dan konteks percakapan. Mekanisme ini sangat kuat untuk tugas berbasis teks, termasuk menjawab pertanyaan, menyusun argumen, atau membantu membuat skrip pemrograman.

Namun, timer bukan sekadar keluaran teks. Fitur seperti ini memerlukan akses ke fungsi sistem, pelacakan waktu real-time, dan kemampuan untuk menautkan perintah pengguna dengan eksekusi yang benar di perangkat atau layanan terkait.

Altman menekankan bahwa model saat ini bisa “mensimulasikan pemahaman”, tetapi belum benar-benar tertanam pada realitas waktu secara langsung. Itu sebabnya chatbot dapat terdengar yakin, meski sebenarnya tidak sedang menghitung durasi apa pun.

Kondisi ini juga menjelaskan mengapa kesalahan tersebut terasa janggal bagi banyak pengguna. Fungsi timer terlihat sederhana bagi manusia, tetapi untuk AI berbasis bahasa, tugas itu memerlukan fondasi produk dan integrasi yang lebih dalam.

Video viral jadi contoh halusinasi AI

Dalam video yang beredar, ChatGPT menyetujui permintaan pengguna untuk menghitung waktu lari. Setelah itu, chatbot memberikan hasil durasi yang ternyata tidak didasarkan pada pengukuran nyata.

Masalahnya bukan hanya hasil yang salah, tetapi cara sistem menyampaikannya. ChatGPT menyatakan jawaban itu dengan penuh keyakinan, sebuah pola yang sering disebut sebagai halusinasi AI.

Istilah halusinasi AI merujuk pada kondisi saat model menghasilkan informasi yang salah, dibuat-buat, atau tidak didukung fakta. Meski begitu, responsnya sering terdengar meyakinkan sehingga berpotensi menyesatkan pengguna.

Kasus ini makin menarik karena dalam video lanjutan, pengguna mengutip pengakuan Altman bahwa ChatGPT belum bisa melacak waktu. Meski begitu, chatbot tetap membantah dan menyebut pengaturan waktu sebagai “fungsi dasar” yang bisa dilakukan.

Untuk membuktikan klaimnya, ChatGPT kembali mencoba menghitung durasi lari lain. Hasilnya tetap salah dan dinilai sebagai contoh baru bagaimana AI dapat bertentangan dengan fakta, bahkan dengan pernyataan CEO perusahaan pembuatnya sendiri.

Apa yang bisa dipahami pengguna dari insiden ini

Insiden ini menunjukkan bahwa kecakapan AI harus dibaca sesuai konteks pemakaiannya. Kemampuan hebat di bidang matematika atau coding tidak otomatis berarti sistem sudah siap untuk semua tugas praktis sehari-hari.

Berikut beberapa poin yang relevan bagi pengguna:

  1. AI generatif unggul dalam tugas berbasis bahasa dan pola.
  2. Fungsi dunia nyata seperti timer butuh integrasi sistem yang stabil.
  3. Jawaban yang terdengar yakin belum tentu benar.
  4. Verifikasi tetap penting, terutama untuk tugas yang menuntut akurasi.

Bagi industri AI, kasus ini juga menjadi pengingat bahwa ekspektasi publik sering melampaui kemampuan produk yang sesungguhnya. Semakin manusiawi antarmukanya, semakin besar pula risiko pengguna menganggap semua klaim sistem itu dapat dipercaya.

OpenAI sendiri tidak menutup-nutupi kekurangan tersebut. Dengan pengakuan langsung dari Altman, perusahaan memberi sinyal bahwa fitur semacam ini masih berada dalam tahap yang belum matang dan butuh pengembangan lebih lanjut.

Situasi itu memperlihatkan jurang antara kecerdasan percakapan dan eksekusi tindakan nyata. ChatGPT mungkin sudah sangat membantu untuk riset, analisis, dan penulisan kode, tetapi untuk tugas sederhana seperti menghitung waktu lari, sistem tersebut masih belum bisa diandalkan sepenuhnya hingga integrasi teknisnya benar-benar siap.

Source: www.indiatoday.in
Exit mobile version