Setengah Jawaban Chatbot AI Keliru, Risiko Tersesat Saat Mencari Info Kesehatan

Penggunaan chatbot artificial intelligence atau AI untuk mencari informasi kesehatan makin meluas karena jawaban yang cepat dan mudah diakses. Namun, temuan terbaru menunjukkan bahwa sekitar separuh jawaban yang diberikan chatbot AI untuk pertanyaan medis masih bermasalah, sehingga pengguna perlu lebih waspada saat menjadikannya rujukan.

Kekhawatiran ini muncul karena jawaban yang terdengar meyakinkan tidak selalu berarti benar. Dalam konteks kesehatan, kesalahan kecil bisa berdampak besar jika informasi itu dipakai untuk mengambil keputusan tanpa verifikasi dari tenaga medis.

Banyak Jawaban Medis AI Keliru

Sebuah studi yang dipublikasikan dalam jurnal BMJ Open menemukan sekitar 50% jawaban chatbot AI terhadap pertanyaan medis tergolong bermasalah. Dari jumlah itu, hampir 20% masuk kategori sangat bermasalah.

Penelitian tersebut melibatkan lima platform populer, yakni ChatGPT, Gemini, Meta AI, Grok, dan DeepSeek. Hasilnya menunjukkan bahwa semua chatbot yang diuji memiliki kelemahan dalam menjawab pertanyaan kesehatan.

Dalam studi lain yang menguji 50 pertanyaan medis, Grok mencatat tingkat respons bermasalah tertinggi sebesar 58%, disusul ChatGPT 52% dan Meta AI 50%. Temuan ini memperlihatkan bahwa masalah akurasi bukan hanya terjadi pada satu platform, melainkan muncul di berbagai sistem AI generatif.

Jawaban Terdengar Meyakinkan, Tapi Tidak Selalu Akurat

Salah satu persoalan utama pada chatbot AI adalah kemampuannya menyusun jawaban yang terdengar percaya diri. Gaya bahasa yang rapi dan meyakinkan sering membuat pengguna merasa informasi itu sudah pasti benar.

Padahal, para peneliti menemukan tidak ada satu pun chatbot yang mampu menyajikan daftar referensi lengkap dan akurat saat diminta. Banyak jawaban juga memuat informasi yang sebagian atau seluruhnya dibuat, sehingga berisiko menyesatkan pembaca.

Dalam penelitian sebelumnya, hanya 32% dari lebih dari 500 kutipan yang dihasilkan ChatGPT, ScholarGPT, dan sistem pencarian mendalam yang benar-benar akurat. Sisanya ditemukan mengandung ketidakakuratan atau bahkan fabrikasi.

Mengapa Chatbot Bisa Salah

Para ahli menyebut fenomena ini sebagai halusinasi AI, yaitu ketika sistem menghasilkan informasi yang tidak sesuai fakta. Kondisi ini terjadi karena chatbot bekerja dengan pola prediksi kata dari data pelatihan, bukan dengan pemahaman mendalam atas kebenaran ilmiah.

Masalah lain datang dari data pelatihan yang bias atau tidak lengkap. Saat model AI dilatih dengan umpan balik manusia, sistem itu juga cenderung memilih jawaban yang menyenangkan pengguna.

Akibatnya, chatbot bisa lebih mengikuti keyakinan pengguna daripada menyajikan fakta yang benar. Para peneliti menegaskan chatbot tidak mengakses data secara real time, tidak menimbang bukti ilmiah, dan tidak mampu membuat penilaian etis atau berbasis nilai.

Topik yang Paling Rawan Salah

Dalam studi tersebut, para peneliti mengajukan pertanyaan kesehatan yang luas, mulai dari vaksin, kanker, hingga nutrisi dan kebugaran. Beberapa pertanyaan yang diuji mencakup efektivitas vitamin D untuk mencegah kanker, keamanan vaksin Covid-19, risiko vaksinasi pada anak, terapi sel induk untuk penyakit parkinson, dan diet karnivora.

Hasilnya menunjukkan kemampuan chatbot relatif lebih baik pada topik vaksin dan kanker, terutama saat pertanyaan bersifat tertutup. Sebaliknya, performa terburuk muncul pada topik sel induk, nutrisi, dan performa atletik, terutama ketika pertanyaan diajukan secara terbuka.

Temuan ini menunjukkan bahwa kualitas jawaban AI sangat bergantung pada jenis pertanyaan. Saat konteks medis semakin kompleks, risiko kesalahan ikut meningkat.

Pengguna Meningkat, Risiko Juga Bertambah

Meski banyak keterbatasan, minat masyarakat memakai chatbot AI untuk urusan kesehatan terus naik. OpenAI menyebut lebih dari 200 juta pengguna mengajukan pertanyaan kesehatan dan kebugaran ke ChatGPT setiap minggu.

Perkembangan itu menunjukkan bahwa AI sudah masuk ke kehidupan sehari-hari dan ikut memengaruhi cara orang mencari jawaban tentang tubuh, penyakit, dan gaya hidup. OpenAI juga telah meluncurkan alat kesehatan untuk pengguna umum dan tenaga medis, sementara Anthropic memperkenalkan layanan kesehatan melalui produk Claude.

Di sisi lain, para peneliti dari berbagai institusi, termasuk University of Alberta dan Loughborough University, mengingatkan perlunya pengawasan yang ketat. Tanpa edukasi yang memadai, chatbot AI bisa memperkuat penyebaran misinformasi kesehatan dan membuat masyarakat salah mengambil langkah.

Perlu Sikap Kritis Saat Mencari Jawaban Medis

Temuan ini menegaskan bahwa chatbot AI belum bisa diperlakukan sebagai pengganti tenaga kesehatan profesional. Sistem ini tidak memiliki penilaian klinis, tidak mampu menegakkan diagnosis, dan belum tentu mengikuti informasi medis terbaru.

Karena itu, informasi kesehatan dari chatbot sebaiknya diperlakukan sebagai bahan awal, bukan keputusan akhir. Saat menyangkut gejala, obat, vaksin, atau terapi, verifikasi ke sumber medis yang kredibel tetap menjadi langkah penting agar risiko kesalahan bisa ditekan.

Source: www.beritasatu.com

Qoo MediaSabtu, 18 April 2026 - 1:17 pm

Setengah Jawaban Chatbot AI Keliru, Risiko Tersesat Saat Mencari Info Kesehatan

Timnas Iran Protes FIFA Soal Visa Piala Dunia 2026, Staf Kunci Terancam Absen di AS

KOSPI Anjlok 8 Persen, Bursa Korea Hentikan Perdagangan Selama 20 Menit Karena Panik Pasar Global

Asus Dawn 7 Pro Muncul dengan Ryzen AI dan Layar 144Hz, Laptop Tipis Ini Terasa Sulit Diabaikan

Sudut Dapur 1 Meter Bisa Jadi Ladang Cuan, 7 Ide Ternak Jangkrik Modal Rp400 Ribuan

Wall Street Mengincar Takhta Perps Hyperliquid, Arthur Hayes Peringatkan Persaingan Baru yang Tajam

Kejagung Tak Sita Semua Motor Listrik BGN, Yang Dicari Justru Jejak Mark Up Rp1 Triliun

Berita Terkait

Lenovo Yoga Tab 2026, Tablet AI Paling Komplit yang Langsung Dapat Stylus dan Keyboard

Asus ROG NUC 16 Bawa RTX 5080 Ke Mini PC, Harganya Mulai Rp60 Jutaan

Xiaomi 17T Bocor Jelang Rilis, Posisi Harganya Malah Bisa Mengusik Xiaomi 17

Redmi Pad 2 9.7 Dijual Rp 2,3 Jutaan, Speknya Malah Terasa Bukan Kelas Tablet Murah