Ironi Kecerdasan Buatan: Jutaan Buku Dirusak demi Latih AI

- Ada ironi di balik kecanggihan chatbot kecerdasan buatan (artificial Intelligence/AI) macam ChatGPT. Selain memerlukan energi listrik yang besar, pelatihan AI juga melibatkan perusakan buku hingga eksploitasi hak cipta.

Fakta terbaru terungkap dari dokumen pengadilan yang memproses gugatan sejumlah penulis terhadap perusahaan AI Amerika Serikat, Anthropic. Gugatan ini dilayangkan sejak akhir 2024 lalu, menuntut Anthropic yang dinilai sudah melanggar hak cipta karyanya.

Menurut dokumen pengadilan, Anthropic menghabiskan uang jutaan dollar AS untuk membeli dan memindai buku cetak demi membangun Claude, yaitu asisten AI yang mirip ChatGPT. Beberapa di antara buku-buku itu merupakan buku bekas.

Dalam praktiknya, Anthropic melepas jutaan buku cetak dari jilidnya, memotongnya sesuai dimensi yang diinginkan. Kemudian lembaran buku itu, termasuk jilidnya, dipindai menjadi dokumen PDF.

Tujuan pemindaian isi buku tersebut yaitu untuk melatih AI. Setelah dipindai, lembaran kertas tadi dibuang. Namun tidak ada keterangan yang menunjukkan bahwa terdapat buku langka yang turut dimusnahkan.

Praktik itu dilakukan startup AI ini pada Februari 2024 lalu. Saat itu, Anthropic merekrut Tom Turvey, mantan kepala kemitraan untuk proyek pemindaian buku Google Books. Di Anthropic, dia bertugas mendapatkan "semua buku di dunia".

Pendekatan serupa, umum dilakukan sejumlah pihak termasuk Google untuk mendigitalisasi buku, dan dianggap sah secara hukum. Namun, pendekatan Anthropic di sini, dinilai tak biasa karena jumlahnya cukup masif.

Apalagi, perusahaan ini juga lebih mementingkan kecepatan dan biaya yang murah hingga mengesampingkan upaya pelestarian buku fisik.

Kendati demikian, hakim kasus ini yaitu William Alsup memutuskan bahwa praktik pemindaian destruktif yang dilakukan Anthropic itu tergolong "wajar".

Sebab, Anthropic sudah membeli buku-bukunya terlebih dahulu secara resmi, baru memindai dan membuangnya. Sementara salinan hasil pindaian buku itu disimpan secara internal tanpa didistribusikan lebih lanjut

Menurut hakim Alsup, praktik itu merupakan transformasi yang menghemat ruang dengan mengonversi format buku.

"Sebagaimana pembaca yang bercita-cita menjadi penulis, (model AI) Anthropic dilatih pada suatu karya bukan untuk menyaingi, menjiplak atau menggantikannya, tetapi untuk membuat sesuatu yang berbeda," kata Alsup dalam dokumen resmi pengadilan San Francisco yang dipublikasikan pada Senin 23 Juni lalu.

Manfaatkan buku bajakan

Sebelum memindai jutaan buku fisik, Anthropic seperti perusahaan teknologi lainnya, memanfaatkan repositori buku bajakan yang bisa diakses secara gratis.

Salah satu pendiri Anthropic, Ben Mann dengan sengaja mengunduh salinan 5 juta buku bajakan dari situs web LibGen dan 2 juta buku lainnya dari Pirate Library Mirror (PirLiMi), dilansir Cnet.

Namun karyawan Anthropic khawatir akan legalitas pendekatan tersebut, hingga akhirnya merekrut mantan eksekutif Google, Tom Turvey seperti dijelaskan di atas.

Terlepas dari keputusan "wajar" yang sudah ditetapkan, hakim menegaskan bahwa praktik pencurian karya itu lain perkara.

"Bahwa Anthropic membeli salinan buku yang dicuri dari internet, tidak akan membebaskannya dari tanggung jawab, tetapi dapat memengaruhi tingkat ganti rugi berdasarkan undang-undang," jelas hakim Alsup.

Jumlah kompensasi ganti rugi yang perlu dibayar Anthropic sendiri belum diungkap. Anthropic juga belum berkomentar soal praktik penggunaan buku bajakan tersebut, selain menyambut putusan hakim yang mewajarkan pemindaian jutaan buku untuk melatih AI, dihimpun KompasTekno dari Ars Technica, Minggu (28/6/2025).

Tag: #ironi #kecerdasan #buatan #jutaan #buku #dirusak #demi #latih