
Penggunaan chatbot artificial intelligence atau AI untuk mencari informasi kesehatan makin meluas karena jawaban yang cepat dan mudah diakses. Namun, temuan terbaru menunjukkan bahwa sekitar separuh jawaban yang diberikan chatbot AI untuk pertanyaan medis masih bermasalah, sehingga pengguna perlu lebih waspada saat menjadikannya rujukan.
Kekhawatiran ini muncul karena jawaban yang terdengar meyakinkan tidak selalu berarti benar. Dalam konteks kesehatan, kesalahan kecil bisa berdampak besar jika informasi itu dipakai untuk mengambil keputusan tanpa verifikasi dari tenaga medis.
Banyak Jawaban Medis AI Keliru
Sebuah studi yang dipublikasikan dalam jurnal BMJ Open menemukan sekitar 50% jawaban chatbot AI terhadap pertanyaan medis tergolong bermasalah. Dari jumlah itu, hampir 20% masuk kategori sangat bermasalah.
Penelitian tersebut melibatkan lima platform populer, yakni ChatGPT, Gemini, Meta AI, Grok, dan DeepSeek. Hasilnya menunjukkan bahwa semua chatbot yang diuji memiliki kelemahan dalam menjawab pertanyaan kesehatan.
Dalam studi lain yang menguji 50 pertanyaan medis, Grok mencatat tingkat respons bermasalah tertinggi sebesar 58%, disusul ChatGPT 52% dan Meta AI 50%. Temuan ini memperlihatkan bahwa masalah akurasi bukan hanya terjadi pada satu platform, melainkan muncul di berbagai sistem AI generatif.
Jawaban Terdengar Meyakinkan, Tapi Tidak Selalu Akurat
Salah satu persoalan utama pada chatbot AI adalah kemampuannya menyusun jawaban yang terdengar percaya diri. Gaya bahasa yang rapi dan meyakinkan sering membuat pengguna merasa informasi itu sudah pasti benar.
Padahal, para peneliti menemukan tidak ada satu pun chatbot yang mampu menyajikan daftar referensi lengkap dan akurat saat diminta. Banyak jawaban juga memuat informasi yang sebagian atau seluruhnya dibuat, sehingga berisiko menyesatkan pembaca.
Dalam penelitian sebelumnya, hanya 32% dari lebih dari 500 kutipan yang dihasilkan ChatGPT, ScholarGPT, dan sistem pencarian mendalam yang benar-benar akurat. Sisanya ditemukan mengandung ketidakakuratan atau bahkan fabrikasi.
Mengapa Chatbot Bisa Salah
Para ahli menyebut fenomena ini sebagai halusinasi AI, yaitu ketika sistem menghasilkan informasi yang tidak sesuai fakta. Kondisi ini terjadi karena chatbot bekerja dengan pola prediksi kata dari data pelatihan, bukan dengan pemahaman mendalam atas kebenaran ilmiah.
Masalah lain datang dari data pelatihan yang bias atau tidak lengkap. Saat model AI dilatih dengan umpan balik manusia, sistem itu juga cenderung memilih jawaban yang menyenangkan pengguna.
Akibatnya, chatbot bisa lebih mengikuti keyakinan pengguna daripada menyajikan fakta yang benar. Para peneliti menegaskan chatbot tidak mengakses data secara real time, tidak menimbang bukti ilmiah, dan tidak mampu membuat penilaian etis atau berbasis nilai.
Topik yang Paling Rawan Salah
Dalam studi tersebut, para peneliti mengajukan pertanyaan kesehatan yang luas, mulai dari vaksin, kanker, hingga nutrisi dan kebugaran. Beberapa pertanyaan yang diuji mencakup efektivitas vitamin D untuk mencegah kanker, keamanan vaksin Covid-19, risiko vaksinasi pada anak, terapi sel induk untuk penyakit parkinson, dan diet karnivora.
Hasilnya menunjukkan kemampuan chatbot relatif lebih baik pada topik vaksin dan kanker, terutama saat pertanyaan bersifat tertutup. Sebaliknya, performa terburuk muncul pada topik sel induk, nutrisi, dan performa atletik, terutama ketika pertanyaan diajukan secara terbuka.
Temuan ini menunjukkan bahwa kualitas jawaban AI sangat bergantung pada jenis pertanyaan. Saat konteks medis semakin kompleks, risiko kesalahan ikut meningkat.
Pengguna Meningkat, Risiko Juga Bertambah
Meski banyak keterbatasan, minat masyarakat memakai chatbot AI untuk urusan kesehatan terus naik. OpenAI menyebut lebih dari 200 juta pengguna mengajukan pertanyaan kesehatan dan kebugaran ke ChatGPT setiap minggu.
Perkembangan itu menunjukkan bahwa AI sudah masuk ke kehidupan sehari-hari dan ikut memengaruhi cara orang mencari jawaban tentang tubuh, penyakit, dan gaya hidup. OpenAI juga telah meluncurkan alat kesehatan untuk pengguna umum dan tenaga medis, sementara Anthropic memperkenalkan layanan kesehatan melalui produk Claude.
Di sisi lain, para peneliti dari berbagai institusi, termasuk University of Alberta dan Loughborough University, mengingatkan perlunya pengawasan yang ketat. Tanpa edukasi yang memadai, chatbot AI bisa memperkuat penyebaran misinformasi kesehatan dan membuat masyarakat salah mengambil langkah.
Perlu Sikap Kritis Saat Mencari Jawaban Medis
Temuan ini menegaskan bahwa chatbot AI belum bisa diperlakukan sebagai pengganti tenaga kesehatan profesional. Sistem ini tidak memiliki penilaian klinis, tidak mampu menegakkan diagnosis, dan belum tentu mengikuti informasi medis terbaru.
Karena itu, informasi kesehatan dari chatbot sebaiknya diperlakukan sebagai bahan awal, bukan keputusan akhir. Saat menyangkut gejala, obat, vaksin, atau terapi, verifikasi ke sumber medis yang kredibel tetap menjadi langkah penting agar risiko kesalahan bisa ditekan.
Source: www.beritasatu.com








