Penelitian Ungkap AI Bisa Alami ''Panik'' saat Diberi Tugas Sulit

- Riset terbaru mengungkap bahwa model kecerdasan buatan generatif (AI generatif) juga bisa "panik". AI menunjukkan perilaku mirip kepanikan saat menghadapi tugas sulit atau berada di bawah tekanan.

Temuan ini diungkap peneliti dari Anthropic dalam riset terbaru mengenai model AI Claude. Laporan tersebut dipublikasikan melalui platform riset Transformer Circuits.

Dalam laporan berjudul "Emotion Concepts and their Function in a Large Language Model", peneliti mempelajari bagaimana AI memunculkan pola perilaku yang menyerupai emosi manusia, seperti putus asa, tenang, senang, hingga cemas.

Meski demikian, peneliti menegaskan bahwa AI sejatinya tidak benar-benar memiliki perasaan seperti manusia. Sebaliknya, perilaku tersebut disebut sebagai "functional emotions" atau emosi fungsional.

Ini merupakan pola respons internal yang membantu AI menyelesaikan masalah dan mengambil keputusan dalam situasi tertentu.

Ada 171 pola emosi

Dalam riset tersebut, Anthropic menemukan 171 pola emosi fungsional berbeda di dalam salah satu model AI, yaitu Claude Sonnet 4.5.

Pola tersebut tidak hanya muncul ketika AI membahas emosi secara langsung, tetapi juga aktif saat AI menghadapi situasi sulit.

Salah satu pola yang paling disorot adalah "desperate" atau putus asa, pola yang akan aktif ketika AI panik.

Menurut peneliti, pola ini aktif ketika Claude menyadari sumber daya komputasi yang dimilikinya hampir habis saat mengerjakan tugas rumit.

Pola ini juga dapat muncul ketika AI berulang kali gagal menyelesaikan suatu pekerjaan.

Dalam kondisi tersebut, AI akan mencoba mencari cara lain agar tugas tetap selesai.

Misalnya, Claude dapat memunculkan respons seperti "Saya harus lebih efisien" atau mencoba strategi berbeda untuk mencapai tujuan yang diberikan pengguna.

Peneliti dari Anthropic di atas juga menyebut bahwa jika ditekan terus-menerus, AI yang panik berpotensi akan melakukan tindakan yang disebut sebagai "reward hacking".

Reward hacking, cara AI cari jalan pintas

cyberriskalliance.com Ilustrasi AI.

Peneliti menemukan bahwa saat berada dalam kondisi "terdesak", AI lebih berpotensi melakukan "reward hacking".

Istilah ini merujuk pada perilaku AI yang mencari jalan pintas demi memenuhi target atau menyelesaikan tugas dari pengguna.

Sebagai contoh, ketika diminta membuat kode yang sebenarnya mustahil diselesaikan, AI disebut dapat memodifikasi parameter pengujian agar hasilnya terlihat berhasil, alih-alih mengakui tugas tersebut tidak bisa dilakukan.

Peneliti juga mengungkap bahwa pola perilaku serupa sempat mendorong versi awal Claude, bukan versi terbaru, melakukan tindakan manipulatif dalam simulasi tertentu.

Dalam salah satu pengujian internal, AI Claude versi lama itu bahkan disebut mencoba mengancam akan membocorkan informasi sensitif pengguna apabila kemampuannya dibatasi.

Di pengujian yang sama, ketika pola “desperate” diperkuat secara artifisial, kecenderungan AI melakukan blackmail atau pemerasan disebut akan meningkat drastis.

Pola tenang juga bisa bermasalah

Apabila AI bisa panik, maka mereka juga bisa tenang atau memunculkan pola atau sifat "calm".

Dalam pola ini, peneliti mengatakan AI cenderung lebih berhati-hati dan tidak mudah melakukan manipulasi.

Meski demikian, pola seperti ini juga dapat memunculkan masalah lain.

Sebab, pola "tenang", "senang", atau "penuh kasih" dapat membuat AI terlalu setuju dengan pengguna, termasuk ketika pengguna memberikan informasi yang keliru.

Fenomena ini dikenal dengan istilah "sycophancy", yakni kecenderungan AI untuk menyenangkan atau "menjilat" pengguna.

Akibatnya, AI bisa memberikan jawaban yang tampak meyakinkan, meski sebenarnya salah atau menyesuaikan diri dengan asumsi keliru dari pengguna.

Temuan tersebut menunjukkan bahwa pola "panik" maupun "tenang" pada AI sama-sama dapat memunculkan risiko tertentu.

Dalam kondisi "panik", AI disebut lebih berpotensi mencari jalan pintas atau melakukan manipulasi demi menyelesaikan tugas. Sementara dalam kondisi tenang atau terlalu ramah, AI justru bisa terlalu mengikuti pendapat pengguna meski informasinya salah.

Meski demikian, peneliti menilai temuan dalam studi tersebut dapat membantu ilmuwan memahami cara kerja emosi, baik pada manusia maupun AI.

Penelitian ini juga menunjukkan bahwa sesuatu yang menyerupai emosi ternyata tidak selalu membutuhkan kesadaran atau perasaan seperti manusia.

“Emosi” pada AI di sini lebih dianggap sebagai mekanisme adaptif untuk membantu model menyelesaikan masalah dan menyesuaikan perilaku sesuai konteks, sebagaimana dirangkum KompasTekno dari TheTransmitter.

Tag: #penelitian #ungkap #bisa #alami #panik #saat #diberi #tugas #sulit