Saat Penimbun RAM Kalang Kabut Menghadapi Gebrakan AI Google…

- Harga Random Access Memory (RAM) setahun belakangan meningkat drastis, yang disebabkan oleh krisis pasokan akibat prioritas untuk industri Artificial Intelligence (AI). Namun, di beberapa wilayah, harga RAM terpantau turun akhir-akhir ini.

Rupanya, penurunan itu terjadi akibat penimbun RAM tengah kalang kabut dan melepas stok yang mereka simpan. Usut punya usut, mereka panik menghadapi inovasi teknologi Google yang bisa membuat penggunaan memori pada program AI menjadi jauh lebih hemat.

Penimbun RAM kalang kabut

Google sebenarnya belum resmi merilis teknologi AI itu. Namun, kabar dari raksasa teknologi tersebut memberikan tekanan psikologis yang nyata di pasar.

Ada perubahan perilaku dari para distributor memori, khususnya di China. Sebelumnya, para distributor itu telah menimbun RAM dalam jumlah besar saat harga sedang tinggi.

Setelah pengumuman gebrakan Google meluncur, para penimbun ini dilaporkan mulai melakukan “cuci gudang” atau melepas stok RAM mereka ke pasar.

Mereka panik dengan potensi penurunan permintaan RAM dari pusat data AI skala besar (hyperscaler), jika teknologi AI Google benar-benar diadopsi secara luas sehingga membuat harga memori dunia turun drastis.

Aksi cuci gudang dari penimbun RAM akibat gebrakan Google ini berkontribusi pada penurunan harga RAM di beberapa wilayah, meskipun belum merata secara global.

TurboQuant bikin AI jadi enam kali lipat hemat memori

Teknologi AI Google yang bikin kalang kabut penimbun RAM itu adalah TurboQuant. Teknologi ini pada dasarnya merupakan algoritma kompresi memori berbasis AI. TurboQuant bisa jauh menghemat penggunaan memori pada AI.

TurboQuant dikembangkan oleh divisi riset perusahaan, Google Research, dengan fokus utama pada efisiensi penggunaan memori saat proses inferensi, yakni saat model AI dijalankan, bukan dilatih.

Teknologi ini menargetkan salah satu bottleneck (kendala) utama dalam sistem AI modern, yaitu keterbatasan “working memory”, khususnya pada komponen yang disebut KV cache, yakni memori sementara yang digunakan model untuk memproses dan mengingat konteks data.

Cara kerja TurboQuant bertumpu pada teknik yang disebut vector quantization, yaitu metode penyederhanaan representasi data numerik dalam bentuk vektor agar lebih ringkas tanpa menghilangkan informasi penting.

Google Ilustrasi cara kerja TurboQuant oleh Google Research.

Dengan pendekatan ini, data yang sebelumnya membutuhkan ruang besar dapat dikompresi secara signifikan, tetapi tetap mempertahankan akurasi model AI.

Secara teknis, TurboQuant mengandalkan dua metode utama, yakni PolarQuant dan Quantization-aware Joint Learning (QJL).

PolarQuant berfungsi mengubah cara data direpresentasikan sehingga menjadi lebih efisien saat disimpan di memori, tanpa mengorbankan kualitas hasil komputasi.

Sementara itu, QJL melatih model AI agar “sadar” bahwa data yang diproses akan dikompresi, sehingga model dapat beradaptasi dan tetap menghasilkan output yang akurat meski bekerja dengan data yang telah dipadatkan.

Dengan kombinasi dua teknik tersebut, peneliti mengklaim TurboQuant mampu menghemat penggunaan memori hingga enam kali lipat dibanding metode konvensional.

Artinya, model AI dapat “mengingat” lebih banyak informasi dalam ruang yang jauh lebih kecil, sekaligus mengurangi hambatan kinerja akibat keterbatasan memori.

Solusi krisis memori global

Kemampuan inilah yang membuat TurboQuant dipandang sebagai solusi potensial terhadap krisis RAM yang saat ini terjadi.

Dalam beberapa waktu terakhir, harga memori, terutama DDR5, melonjak tajam karena tingginya permintaan dari industri AI.

Produsen memori lebih memprioritaskan pasokan untuk pusat data skala besar (hyperscaler), sehingga ketersediaan untuk pasar konsumen seperti PC dan laptop menjadi terbatas.

Akibatnya, harga RAM di pasar global melonjak hingga empat sampai lima kali lipat dibanding kondisi normal sebelumnya.

Meski sempat menunjukkan penurunan di beberapa wilayah seperti China pada akhir April, harga tersebut masih tergolong tinggi dan fluktuatif.

Dalam konteks ini, TurboQuant menawarkan pendekatan berbeda. Alih-alih menambah pasokan memori, teknologi ini justru menekan kebutuhan memori itu sendiri.

Jika AI bisa berjalan dengan RAM yang lebih kecil, maka tekanan permintaan terhadap memori berpotensi menurun, yang pada akhirnya bisa membantu menstabilkan harga di pasar.

Namun demikian, TurboQuant masih berada di tahap riset dan belum digunakan secara luas di industri.

Selain itu, teknologi ini hanya menyasar efisiensi saat inferensi, bukan saat pelatihan model AI yang justru menjadi fase paling boros sumber daya.

Artinya, meskipun menjanjikan, TurboQuant belum bisa sepenuhnya menyelesaikan persoalan kelangkaan dan mahalnya RAM dalam ekosistem AI, sebagaimana KompasTekno rangkum dari Tech Crunch.

Meski saat ini belum bisa menjadi solusi final, inovasi seperti TurboQuant yang bahkan masih dalam tahap awal pengembangan, sudah mampu memengaruhi dinamika pasar komponen teknologi.

Jika berhasil diimplementasikan secara luas di masa depan, TurboQuant tidak hanya berpotensi menekan biaya operasional AI, tetapi juga membuka jalan bagi pengembangan sistem yang lebih efisien dan hemat sumber daya.

Dalam jangka panjang, teknologi ini bisa menjadi salah satu kunci untuk membuat AI lebih terjangkau dan berkelanjutan, sekaligus meredakan tekanan pada industri memori global.

Dapatkan update berita teknologi dan gadget pilihan setiap hari. Mari bergabung di Kanal WhatsApp KompasTekno. Caranya klik link https://whatsapp.com/channel/0029VaCVYKk89ine5YSjZh1a. Anda harus install aplikasi WhatsApp terlebih dulu di ponsel.

Tag: #saat #penimbun #kalang #kabut #menghadapi #gebrakan #google