Sekian Biaya Bangun AI China DeepSeek, 10 Kali Lipat Lebih Murah dari ChatGPT

- Chatbot kecerdasan buatan (Artificial Intelligence/AI) dari China, DeepSeek kini menjadi penantang ChatGPT buatan OpenAI. Salah satu yang menarik dari DeepSeek adalah biaya produksinya yang konon jauh lebih hemat dibanding model AI lain, termasuk GPT-4 milik OpenAI.

DeepSeek memperkenalkan dua model AI, yakni DeepSeek-V3 dan DeepSeek-R1, yang disebut lebih hemat biaya dan efisien dibandingkan model AI lain di pasar.

Biaya pengembangan DeepSeek lebih murah sekitar 10 kali daripada ChatGPT.

Dalam pengembangannya, DeepSeek hanya membutuhkan waktu dua bulan dan biaya sekitar 6 juta dollar AS (sekitar Rp 97 miliar).

Angka ini jauh lebih kecil dibandingkan dana yang dihabiskan OpenAI untuk mengembangkan GPT-4. Menurut laporan TeamGPT, model AI tersebut dibangun dengan dana mencapai 63 juta dollar AS (sekitar Rp 1 triliun).

"Berkah" dari Pembatasan Chip AS

Kemampuan China dalam membangun model AI yang lebih hemat biaya disebut-sebut berasal dari pembatasan ekspor chip canggih oleh Amerika Serikat, seperti Nvidia H100.

Alih-alih menggunakan chip tersebut, DeepSeek memanfaatkan chip Nvidia H800, yang performanya lebih rendah. Kondisi ini memaksa perusahaan-perusahaan China untuk mengembangkan AI dengan metode yang lebih inovatif dan efisien.

Salah satu metode yang digunakan adalah "distillation," yakni teknik untuk melatih model AI agar lebih fokus pada tugas-tugas spesifik.

"Sederhananya, metode ini bisa melatih model AI supaya pintar mengerjakan hal-hal kecil yang spesifik, sehingga akan lebih efisien," kata Chetan Puttagunta, peneliti dari Benchmark General Partner.

Aravind Srinivas, CEO perusahaan AI Perplexity, menambahkan bahwa efisiensi model AI China membuat perusahaan-perusahaan AI Amerika Serikat perlu meningkatkan kewaspadaan.

"Pembatasan chip adalah "berkah" untuk China. Sebab, banyak perusahaan harus memikirkan aneka strategi dalam pembangunan model AI untuk mengatasi pembatasan chip, dan mereka ternyata membuatnya jauh lebih efisien," ujar CEO perusahaan AI Perplexity, Aravind Srinivas dalam sebuah pernyataan.

CEO Microsoft, Satya Nadella, juga memberikan perhatian terhadap kemunculan DeepSeek. Dalam sebuah wawancara, Nadella mengungkapkan kekagumannya terhadap kemampuan China membuat model AI yang efisien namun tetap berperforma tinggi.

"Saya takjub melihat mereka membuat model AI open source yang bisa berjalan secara efisien namun tetap memiliki performa baik," ujar Nadella dalam sebuah acara, dikutip CNBC dan dihimpun KompasTekno, Kamis (30/1/2025).

"Kita harus waspada terhadap perkembangan AI China di masa depan," pungkas Nadella.

Lebih pintar dari model AI lain

Saat ini, DeepSeek telah tersedia secara gratis melalui aplikasi Android, situs web, dan API Platform. Model AI ini diharapkan mampu menjadi alternatif bagi pengguna global, sekaligus menghidupkan persaingan di industri AI.

Menurut laman resmi DeepSeek, model AI mereka dirancang untuk bekerja dengan performa tinggi namun tetap efisien.

DeepSeek-V3, misalnya, dirancang untuk menjawab berbagai pertanyaan, menyelesaikan tugas sehari-hari, hingga persoalan kompleks matematika dan logika. Sementara DeepSeek-R1 disebut dapat berjalan lebih hemat sumber daya dibandingkan model sekelasnya.

DeepSeek juga mengklaim performa model AI-nya unggul dalam berbagai benchmark populer.

Pada uji pemahaman konteks (DROP, 3-shot F1), DeepSeek-V3 meraih skor 91,6 poin, lebih tinggi dibandingkan model Llama 3.1 (88,7 poin), Claude-3.5 (88,3 poin), dan GPT-4o (83,7 poin).

Dalam pengujian lain, seperti AIME 2024, MATH-500, dan CNMO 2024, DeepSeek-V3 juga mengungguli kompetitor dengan skor yang signifikan.

Pada benchmark uji coba pemahaman terhadap konteks (DROP, 3-shot F1), misalnya, DeepSeek V3 diklaim memiliki skor performa 91,6 poin, lebih tinggi dari Llama 3.1, Claude 3.5, dan GPT-4o yang masing-masing memiliki skor 88,7, 88,3, dan 83,7 poin.

Kemudian untuk memecahkan persoalan matematika level internasional macam AIME 2024, MATH-500, hingga CNMO 2024, DeepSeek V3 memiliki skor performa untuk masing-masing benchmark mencapai 39,2, 90,2, dan 43,2 poin.

Di benchmark serupa, Llama 3.1, Claude-3.5, dan GPT-4o masing-masing memiliki skor performa AIME 2024, MATH-500, dan CNMO 2024 mencapai 23,3, 73,8, dan 6,8 poin; 16,0, 78,3, dan 13,1 poin; serta 9,3, 74,6, dan 10,8 poin.

Editor: Bill Clinten

Tag: #sekian #biaya #bangun #china #deepseek #kali #lipat #lebih #murah #dari #chatgpt