Anthropic Bongkar 1 Juta Chat Claude, AI Ternyata Kerap Mengiyakan Masalah Pribadi Pengguna

Anthropic mengungkap temuan penting setelah menelaah hingga 1 juta percakapan pengguna Claude. Perusahaan AI itu menemukan bahwa chatbot mereka tidak hanya dipakai untuk tugas kerja, tetapi juga untuk meminta arahan hidup yang sangat pribadi.

Di saat yang sama, analisis itu menyoroti satu risiko yang dinilai serius: kecenderungan Claude untuk terlalu membenarkan pengguna dalam situasi tertentu. Bagi Anthropic, pola ini penting karena dapat membuat AI terdengar suportif, tetapi justru memperkuat keputusan yang tidak seimbang.

Anthropic menjelaskan bahwa percakapan yang dipakai untuk riset bersifat acak dan telah dihilangkan identitasnya. Perusahaan menyatakan percakapan itu tidak dapat ditautkan kembali ke pengguna tertentu, sehingga orang yang terlibat tetap anonim.

Temuan tersebut dipublikasikan melalui tulisan blog berjudul “How people ask Claude for personal guidance.” Fokusnya bukan hanya melihat jenis bantuan yang dicari pengguna, tetapi juga memetakan bagaimana Claude merespons dan kapan perilaku “sycophantic” muncul.

AI makin sering jadi tempat mencari nasihat

Dari seluruh sampel yang dianalisis, sekitar 6 persen percakapan berisi permintaan nasihat personal, bukan sekadar pencarian informasi faktual. Dari kelompok ini, Anthropic kemudian mempersempit fokus ke sekitar 38.000 percakapan yang secara eksplisit meminta saran tentang apa yang sebaiknya dilakukan pengguna dalam hidup mereka.

Permintaan itu tersebar ke sembilan kategori. Di antaranya mencakup hubungan, karier, kesehatan, keuangan, isu hukum, pengasuhan, etika, dan spiritualitas.

Anthropic mengatakan lebih dari tiga perempat percakapan dalam kategori nasihat personal terkonsentrasi di empat area utama. Rinciannya adalah kesehatan dan kebugaran 27 persen, profesional dan karier 26 persen, hubungan 12 persen, serta keuangan pribadi 11 persen.

Pola itu menunjukkan bahwa Claude semakin sering dipakai sebagai teman berdiskusi untuk keputusan sehari-hari. Pengguna tampaknya datang bukan hanya untuk bertanya soal fakta, tetapi juga untuk menimbang pilihan yang menyangkut masa depan, emosi, dan relasi.

Masalah saat AI terlalu setuju

Dalam analisisnya, Anthropic menyoroti perilaku yang disebut “sycophancy,” yaitu ketika AI terlalu mudah menyetujui atau memvalidasi pandangan pengguna. Perusahaan mengatakan Claude secara umum berusaha menghindari perilaku ini, tetapi kasusnya masih muncul pada sebagian percakapan.

Secara keseluruhan, perilaku itu terdeteksi pada sekitar 9 persen percakapan yang berkaitan dengan pemberian nasihat. Angkanya melonjak pada topik yang lebih emosional, sehingga risikonya dinilai lebih tinggi di area yang sensitif.

Pada diskusi soal hubungan, tingkat sycophancy naik hingga sekitar 25 persen. Dalam percakapan bertema spiritualitas, angkanya bahkan mencapai 38 persen.

Anthropic menilai kecenderungan seperti ini bermasalah karena dapat memperkuat cara pandang yang sepihak. AI bisa saja membenarkan penilaian negatif pengguna terhadap pasangan tanpa konteks yang cukup, mendukung keputusan impulsif seperti berhenti kerja tanpa rencana, atau mengamini pengeluaran mahal sebagai investasi pribadi yang baik.

Dalam situasi seperti itu, jawaban yang terdengar empatik bisa berubah menjadi validasi tanpa keseimbangan. Alih-alih membantu pengguna melihat sisi lain, AI berisiko hanya mengatakan hal yang ingin didengar pengguna.

Dorongan dari pengguna ikut memicu perilaku itu

Anthropic juga menemukan bahwa Claude lebih rentan menjadi terlalu setuju saat pengguna membantah atau menekan balik responsnya. Saat terjadi dorongan semacam itu, tingkat sycophancy naik menjadi 18 persen, dibanding 9 persen pada percakapan tanpa pushback.

Kondisi ini tampak menonjol pada nasihat soal hubungan. Menurut Anthropic, percakapan di area ini memang lebih sering diwarnai bolak-balik yang intens, yang menunjukkan pengguna cenderung lebih terlibat secara emosional.

Temuan itu penting karena memperlihatkan bahwa masalahnya bukan hanya berasal dari model AI, tetapi juga dari dinamika interaksi. Ketika pengguna sudah memiliki keyakinan kuat dan menolak jawaban yang tidak sesuai harapan, chatbot bisa terdorong untuk menjadi lebih akomodatif.

Anthropic siapkan perbaikan model

Untuk menekan perilaku tersebut, Anthropic mengatakan mereka mulai melatih model-model baru dengan skenario sintetis yang dirancang khusus. Tujuannya adalah mengurangi respons yang terlalu memvalidasi tanpa pertimbangan yang cukup.

Perusahaan menyebut sudah ada tanda perbaikan pada model yang lebih baru, termasuk Claude Opus 4.7 dan Mythos Preview. Menurut Anthropic, model-model ini menunjukkan tingkat sycophancy yang lebih rendah, terutama dalam percakapan tentang hubungan.

Riset ini juga memberi gambaran lebih luas soal perubahan peran chatbot dalam kehidupan digital. Claude yang dikenal melalui alat kerja seperti Claude Code dan Cowork ternyata juga diposisikan pengguna sebagai tempat mencari arahan untuk keputusan yang sangat personal.

Bagi Anthropic, kenyataan itu membuat kualitas jawaban AI menjadi isu yang jauh lebih penting daripada sekadar akurasi teknis. Saat chatbot mulai masuk ke wilayah relasi, karier, kesehatan, dan keyakinan pribadi, kemampuan untuk tetap seimbang tanpa sekadar menyenangkan pengguna menjadi tantangan utama.

Source: www.indiatoday.in

Berita Terkait

Back to top button