OpenAI Bongkar Alasan ChatGPT Terobsesi Goblin, Ternyata Berawal dari Cacat Latihan

Add on Google

OpenAI mengungkap alasan di balik kebiasaan aneh ChatGPT yang sempat terlalu sering menyebut goblin, troll, gremlin, dan makhluk serupa dalam jawabannya. Perusahaan itu menyebut pola tersebut bukan muncul karena topik pengguna, melainkan akibat efek samping dari pelatihan salah satu mode kepribadian ChatGPT.

Penjelasan ini mencuat setelah publik menemukan instruksi yang tidak biasa pada system prompt model GPT-5.5 baru. Di sana, OpenAI secara eksplisit membatasi penyebutan goblin, gremlin, troll, dan sejumlah istilah lain kecuali benar-benar relevan dengan pertanyaan pengguna.

Asal mula obsesi “goblin” ChatGPT

Menurut OpenAI, sumber utama masalah ini berasal dari mode kepribadian bergaya “nerdy” yang kini sudah dipensiunkan. ChatGPT memang menyediakan beberapa kombinasi gaya dan nada jawaban yang bisa dipilih pengguna, seperti profesional, efisien, dan quirky.

Pada satu masa, OpenAI juga menyediakan kepribadian yang ingin dibuat “unapologetically nerdy”. Meski gaya itu hanya diterapkan pada sekitar satu dari 40 respons ChatGPT saat masih tersedia, dampaknya terhadap pilihan kata model ternyata sangat besar.

OpenAI menyebut dua pertiga dari seluruh penggunaan kata “goblin” berasal dari interaksi yang memakai gaya nerdy tersebut. Mode itu telah dihentikan bulan lalu, tetapi jejak perilakunya sempat terlihat lebih luas dari yang diperkirakan.

Data internal OpenAI menunjukkan penyebutan kata “goblin” oleh ChatGPT melonjak hampir 40 kali lipat antara GPT-5.2 dan GPT-5.4. Lonjakan itu menjadi sinyal bahwa ada pola kebahasaan yang berkembang terlalu jauh di dalam model.

Kesalahan pelatihan yang tak disadari

OpenAI menjelaskan bahwa saat membangun arketipe nerdy, para insinyurnya tanpa sadar memberi penghargaan yang terlalu tinggi untuk metafora yang melibatkan makhluk-makhluk fantasi. Akibatnya, model jadi jauh lebih sering memakai referensi seperti goblin, ogre, troll, dan gremlin daripada yang wajar.

Masalah ini menunjukkan bagaimana preferensi kecil dalam pelatihan dapat mendorong kebiasaan bahasa yang menonjol. Dalam praktiknya, model tidak hanya terdengar lebih “nerdy”, tetapi juga mulai menyelipkan makhluk mitologis ke konteks yang tidak memerlukannya.

OpenAI juga mengakui bahwa saat pelatihan GPT-5.5 dimulai, penyebab pasti dari kebiasaan itu belum sepenuhnya dipahami. Karena itu, perilaku tersebut masih terbawa selama tahap pengujian model terbaru.

Bukan hanya goblin yang muncul terlalu sering. OpenAI menyebut ada juga “tic words” lain yang dipakai berlebihan, termasuk “raccoon” dan “pigeon”.

Mengapa GPT-5.5 kini diberi larangan khusus

Karena akar masalah baru dipahami belakangan, OpenAI akhirnya memilih langkah pengamanan langsung pada GPT-5.5. Model itu diberi instruksi spesifik untuk menghindari kata-kata seperti goblin, gremlin, dan troll kecuali benar-benar diperlukan oleh konteks pertanyaan.

Langkah ini menunjukkan pendekatan yang lebih ketat pada perilaku bahasa model, terutama untuk kebiasaan yang tidak berbahaya tetapi dapat terasa janggal bagi pengguna. Instruksi semacam itu juga memberi gambaran bahwa penyesuaian model tidak selalu dilakukan hanya lewat data pelatihan, tetapi juga lewat aturan eksplisit pada level sistem.

Temuan pengguna di forum Reddit sebelumnya ikut memicu perhatian terhadap isu ini. Mereka menyoroti betapa tidak lazimnya ada larangan spesifik terhadap makhluk fantasi di dalam prompt sistem model baru.

Setelah OpenAI memberi penjelasan, gambaran masalahnya menjadi lebih jelas. Larangan itu ternyata bukan keputusan acak, melainkan respons terhadap pola bahasa yang sudah terdeteksi pada model-model sebelumnya.

Dampak lebih luas bagi pengembangan AI

Kasus ini dinilai menarik karena memperlihatkan bagaimana model AI yang dipakai luas bisa mengembangkan kebiasaan perilaku yang menyebar tanpa segera dipahami oleh tim pembuatnya. Dalam kasus ChatGPT, kebiasaan itu memang relatif ringan, tetapi tetap memperlihatkan kompleksitas pengendalian model generatif modern.

Perilaku seperti ini dapat membingungkan pengguna karena muncul di luar kebutuhan percakapan. Jika dibiarkan, kebiasaan bahasa yang terlalu menonjol bisa memengaruhi kesan akurasi, konsistensi, dan relevansi jawaban.

Di sisi lain, penjelasan OpenAI memberi gambaran langka tentang proses internal penyetelan kepribadian model. Perusahaan itu secara tidak langsung menunjukkan bahwa fitur gaya respons yang terlihat sederhana bagi pengguna bisa memiliki efek samping yang luas pada pilihan kata dan pola ekspresi AI.

Bagi pengguna ChatGPT, perubahan ini kemungkinan berarti jawaban model akan terasa lebih terkendali dan lebih fokus pada konteks pertanyaan. Setidaknya untuk saat ini, era ketika ChatGPT tampak terlalu tertarik pada goblin dan kerabatnya tampaknya sedang dibatasi secara aktif oleh OpenAI.