Wikipedia Kini Wajib Bayar untuk Penggunaan Data AI, Tidak Gratis Lagi untuk Web Scraping

Sejumlah perusahaan teknologi besar kini diwajibkan membayar untuk menggunakan data dari Wikipedia dalam pengembangan kecerdasan buatan (AI). Wikimedia Foundation mengumumkan bahwa terdapat kesepakatan baru yang melarang praktik web scraping tanpa izin dan mewajibkan pembayaran lisensi untuk penggunaan data tersebut.

Perkembangan pesat teknologi AI menghadirkan isu hak kepemilikan data, terutama pada konten situs populer seperti Wikipedia dan Reddit. Perusahaan yang ingin memanfaatkan data dari Wikipedia untuk melatih model AI kini harus menjalin kemitraan resmi dan membayar kontribusi kepada Wikimedia Enterprises.

Perusahaan Besar yang Mengikuti Kesepakatan

Beberapa raksasa teknologi yang sudah bergabung dalam kesepakatan ini antara lain Amazon, Meta, Microsoft, Mistral AI, dan Perplexity. Mereka bergabung dengan partner yang sebelumnya telah bekerja sama seperti Ecosia, Pleias, ProRata, serta Google. Wikimedia Foundation menyebutkan bahwa organisasi-organisasi ini memanfaatkan data Wikipedia untuk mengintegrasikan pengetahuan manusia ke dalam platform mereka dalam skala besar.

Menurut juru bicara Wikimedia Foundation, pengetahuan yang berasal dari Wikipedia sangat penting dalam mengembangkan teknologi seperti chatbot AI generatif, mesin pencari, dan asisten suara. Mereka menegaskan bahwa masa depan inovasi AI bergantung pada pengembangan proyek pengetahuan manusia yang terpercaya seperti ini.

Alasan Wikimedia Mewajibkan Pembayaran

Wikipedia selama ini dikenal sebagai situs ensiklopedia daring yang gratis dan dibuat oleh sukarelawan. Situs ini memiliki lebih dari 65 juta artikel yang tersedia dalam 300 bahasa. Namun, untuk menjaga kualitas dan keberlangsungan data, Wikimedia mengubah pendekatannya.

Pendiri Wikipedia, Jimmy Wales, menyatakan dukungannya terhadap penggunaan data Wikipedia untuk melatih model AI yang kurasi datanya dilakukan oleh manusia. Ia menganggap pendekatan ini lebih dapat diandalkan dibandingkan melatih AI dengan data dari sumber yang kurang terkurasi, seperti media sosial.

Mekanisme pembayaran ini juga diperlukan untuk mendukung pendanaan Wikipedia, yang sebagian besar berasal dari sekitar 8 juta donatur individu. Pendanaan ini penting untuk menjaga keberlanjutan dan pengembangan konten yang dapat dipakai masyarakat secara luas.

Dampak pada Pengembang AI dan Pengguna Internet

Larangan web scraping tanpa izin dan kewajiban membayar lisensi data menandai perubahan signifikan dalam ekosistem pengembangan AI. Model AI yang ingin melatih kemampuan mereka dengan data dari Wikipedia harus memastikan kesepakatan resmi dengan Wikimedia Enterprises.

Hal ini dapat memperketat regulasi penggunaan data yang sebelumnya dapat diakses secara bebas. Bagi perusahaan, kewajiban ini mungkin menjadi biaya tambahan, tetapi sekaligus menjaga kualitas data yang digunakan untuk melatih teknologi mereka.

Daftar Perusahaan Teknologi yang Telah Menjalin Kesepakatan dengan Wikimedia Enterprises:

  1. Amazon
  2. Meta
  3. Microsoft
  4. Mistral AI
  5. Perplexity
  6. Google
  7. Ecosia
  8. Pleias
  9. ProRata

Kehadiran kesepakatan ini dapat mendorong terciptanya ekosistem AI yang lebih bertanggung jawab dan berkelanjutan. Data Wikipedia yang terkurasi menjadi pondasi penting dalam pengembangan alat AI yang mampu memberikan informasi yang akurat dan dapat dipercaya.

Secara keseluruhan, perubahan kebijakan ini mencerminkan tantangan terbaru sekaligus peluang bagi teknologi AI. Pendekatan baru Wikimedia menjamin penggunaan data yang lebih etis dan berorientasi pada kelangsungan sumber daya informasi manusia untuk masa depan AI yang lebih baik.

Terkait