272

17 Fakta DeepSeek, AI China Cerdas nan Murah yang Jadi Pesaing ChatGPT

Ilustrasi DeepSeek, startup artificial intelligence (AI) asal Tiongkok ini berhasil mencuri perhatian dengan model AI terbarunya, DeepSeek R1. Model AI yang disebut-sebut mampu menyaingi ChatGPT. (KOMPAS.com/ Galuh Putri Riyanto)

14:12

31 Januari 2025

17 Fakta DeepSeek, AI China Cerdas nan Murah yang Jadi Pesaing ChatGPT

- DeepSeek menjadi buah bibir beberapa waktu belakangan ini karena mampu menjadi lawan sepadan atas dominasi teknologi Artificial Intelligence (AS). DeepSeek secara format sebenarnya tak jauh berbeda dengan chatbot AI lainnya.

Model AI buatan perusahaan China itu mirip dengan ChatGPT dari OpenAI, Gemini dari Google, atau Claude dari Anthropic. DeepSeek juga mampu buat menjawab dan menanggapi berbagai perintah pengguna.

Meski formatnya sama, AI China DeepSeek punya pengembangan yang lebih efisien dibanding model-model AI lain yang selama ini didominasi oleh perusahaan Amerika Serikat (AS) seperti ChatGPT.

Tak hanya itu, lewat model yang terbaru, DeepSeek bisa menjadi AI yang lebih cerdas dibanding ChatGPT. Dengan kondisi ini, DeepSeek dapat mengancam dominasi model-model AI asal AS.

Ada sejumlah fakta menarik seputar DeepSeek yang bisa menjadi pesaing ChatGPT. Jika tertarik lebih lanjut, berikut KompasTekno rangkumkan fakta-fakta seputar DeepSeek yang mampu mengungguli model-model AI buatan perusahaan AS.

Fakta-fakta seputar AI China DeepSeek

Kehadiran DeepSeek menimbulkan kekhawatiran serius bagi AS. Pasalnya, DeepSeek punya kecerdasan yang bisa lebih unggul dibanding model AI AS, tetapi dengan biaya pengembangan yang lebih murah.

Selain lebih cerdas dan murah, usia DeepSeek sebagai pengembang juga terbilang jauh sangat muda dibanding OpenAI yang membuat ChatGPT. Adapun fakta-fakta seputar AI China DeepSeek adalah sebagai berikut.

1. Masih berusia muda

Sebagai pengembang model AI, DeepSeek ternyata masih berusia sangat muda. Usianya baru sekitar dua tahun. DeepSeek merupakan startup AI yang bermarkas di Hangzhou, Zhejiang, China, yang didirikan pada 2023.

2. Didirikan oleh Liang Wenfeng

DeepSeek didirikan oleh High Flyer, sebuah hedge fund di China, dan dikepalai oleh Liang Wenfeng. Sebagai informasi. Liang Wenfeng lahir pada tahun 1985 di Zhanjiang, Provinsi Guangdong, China.

Wenfeng merupakan lulusan Teknik Informasi Elektronik dari Zhejiang University. Untuk lebih lengkapnya, profil Wenfeng bisa dibaca di tautan ini. Meski model AI buatannya masih muda, Wenfeng optimis jika DeepSeek bisa membawa China maju dalam hal inovasi teknologi AI.

Wenfeng memiliki tujuan jangka panjang sama seperti pengembang AI lainnya, yakni membuat model AI yang dapat mencapai taraf Artificial General Intelligence (AGI) atau AI yang memiliki kecerdasan mirip manusia.

3. Menyalip ChatGPT di App Store

DeepSeek tersedia dalam berbagai format, termasuk format aplikasi mobile. Pada Senin (26/1/2025), aplikasi DeepSeek untuk HP berhasil menjadi aplikasi gratis teratas Apple App Store di 111 negara.

Kenaikan DeepSeek sangat pesat. Pasalnya, beberapa hari sebelumnya DeepSeek menempati peringkat ke-31. Di App Store, DeepSeek berhasil mengalahkan peringkat dari aplikasi sejenis seperti ChatGPT.

Menurut data Appfigures, DeepSeek juga unggul di peringkat teratas dalam daftar aplikasi gratis Google Play Store, di 18 negara. Laporan lengkapnya bisa dibaca lebih lanjut melalui artikel ini.

4. Dua model AI DeepSeek

Sejak didirikan pada 2023, DeepSeek sudah mengembangkan beberapa model AI yang juga juga diberi nama “DeepSeek”. Dua model AI terbaru yang dibuat DeepSeek adalah DeepSeek V3 dan DeepSeek R-1.

DeepSeek V3 dirilis pada Desember 2024. DeepSeek V3 adalah model berbasis Mixture-of-Experts (MoE) dengan total 671 miliar parameter. Namun, hanya 37 miliar parameter yang diaktifkan per token selama proses inferensi, membuatnya sangat efisien.

Model ini mampu menangani jendela konteks hingga 128.000 token dan menghasilkan output hingga 8.000 token. DeepSeek V3 dirancang untuk menyelesaikan tugas-tugas umum, seperti menjawab pertanyaan sehari-hari dan membuat konten kreatif.

Model ini dirancang untuk memberikan solusi yang cepat dan efektif bagi pengguna dengan kebutuhan yang beragam. Sementara itu, DeepSeek R-1 dirilis pada 20 Januari 2025. Model ini yang membuat publik geger akibat kecerdasan dan efisiensi pengembangannya.

DeepSeek R-1 dikembangkan dengan berbasis DeepSeek V3, tetapi memiliki kemampuan bernalar yang ditingkatkan. Model dibangun menggunakan teknik reinforcement learning untuk meningkatkan kemampuan penalaran (reasoning) dan pemecahan masalah kompleks.

DeepSeek R-1 mampu menyajikan proses atau langkah berpikir sebelum membuat kesimpulan. Tanggapan DeepSeek R-1 juga bisa lebih kompleks dibanding DeepSeek V3 dengan menghasilkan kapasitas output hingga 32.000 token.

Dengan kemampuan yang ditingkatkan, DeepSeek-R1 cocok dipakai untuk mengerjakan tugas-tugas yang membutuhkan analisis mendalam dan terstruktur, seperti matematika tingkat lanjut, logika berantai, dan pemrograman.

5. Lahir di tengah pembatasan ekspor chip AI dari AS

DeepSeek lahir di tengah pembatasan ekspor chip AI yang dibuat oleh Amerika Serikat. Sebagai informasi, industri AI saat ini didominasi AS dengan produsen chip AI kebanyakan berasal dari perusahaan AS seperti Nvidia.

Pada pertengahan Januari kemarin, AS mengesahkan regulasi untuk memperketat kontrol ekspor chip kecerdasan buatan (AI) dari perusahaan chip raksasa AS (seperti Nvidia, AMD) ke pasar global.

Aturan ini bertujuan untuk mengontrol distribusi teknologi AI canggih dari AS ke pasar global (terutama di luar negara sekutu dan mitra AS) serta mempertahankan dominasi AS dalam kontestasi AI global.

Aturan ini menyederhanakan proses perizinan ekspor, menutup celah penyelundupan, dan menetapkan standar keamanan baru untuk mencegah teknologi canggih jatuh ke tangan yang salah.

Lebih lanjut, aturan baru ini memperketat ekspor chip AI ke negara-negara yang dianggap dapat mengancam keamanan nasional AS, seperti China, Rusia, Iran, dan Korea Utara. Aturan ini menyebabkan DeepSeek sulit mengakses chip AI yang terbaru dan canggih.

6. 10 kali lipat lebih murah dibanding ChatGPT

Pengembangan DeepSeek bisa berjalan dengan waktu dan biaya yang lebih efisien dibanding salah satu model AI yang sudah sangat populer, yaitu GPT-4 yang digunakan di ChatGPT buatan OpenAI. Biayanya bisa 10 kali lipat lebih murah dibanding ChatGPT.

DeepSeek-R1 dilatih dalam waktu sekitar dua bulan dengan biaya sekitar 6 juta dollar AS (sekitar Rp 97 milliar). Sementara itu, pengembangan GPT-4 membutuhkan biaya 63 juta dollar AS (sekitar Rp 1 triliun) dalam waktu beberapa bulan hingga satu tahun.

7. Pakai Nvidia H800

Biaya pengembangan yang lebih murah bisa terjadi karena DeepSeek dilatih menggunakan chip AI atau GPU yang lebih murah, Nvidia H800. Sementara itu, GPT-4o dikembangkan menggunakan chipset Nvidia H100 dengan harga dan spesifikasi yang lebih tinggi.

AI China DeepSeek tidak bisa mendapatkan chip AI terbaru dan canggih seperti Nvidia H100, yang diproduksi perusahaan AS. Hal ini dikarenakan AS menerapkan pembatasan ekspor chip AI ke berbagai negara, terutama negara yang dianggap berbahaya seperti China.

Selain jenis chip yang lebih murah, jumlah chip AI yang digunakan untuk melatih DeepSeek juga lebih efisien. DeepSeek hanya dilatih menggunakan 2.048 unit GPU Nvidia H800. Sementara itu, latihan GPT-4 bisa menggunakan hingga puluhan ribu unit Nvidia H100.

8. Lebih hemat sumber daya dan efektif

DeepSeek mengadopsi pendekatan teknologi inovatif untuk memastikan efisiensi dan performa tinggi dalam model AI mereka. DeepSeek dikembangkan dengan metode Mixture-of-Experts (MoE) dan Chain of Thought (CoT).

MoE adalah arsitektur yang memungkinkan model besar, seperti DeepSeek V3, dengan total 671 miliar parameter, untuk hanya mengaktifkan 37 miliar parameter saat memproses setiap token. Metode ini membuat model lebih hemat sumber daya tanpa mengorbankan kinerja.

Kemudian, DeepSeek-R1 dilatih menggunakan teknik Chain-of-Thought (CoT), yang memecah pertanyaan kompleks menjadi langkah-langkah kecil sebelum memberikan jawaban akhir.

Dengan CoT, model tidak hanya menghasilkan respons yang lebih logis dan akurat, tetapi juga mampu mengidentifikasi dan memperbaiki kesalahan logika atau halusinasi data selama proses berpikirnya.

9. Unggul di sejumlah platform benchmark

Dengan biaya yang lebih efisien, kemampuan DeepSeek ternyata sangat memukau. Model AI China DeepSeek diklaim dapat mengungguli kemampuan model-model AI lain, seperti Claude dari Atrophic, Llama dari Meta, dan GPT dari Open AI, di beberapa benchmark.

Pada benchmark uji coba pemahaman terhadap konteks (DROP, 3-shot F1), misalnya, DeepSeek V3 diklaim memiliki skor performa 91,6 poin, lebih tinggi dari Llama 3.1, Claude 3.5, dan GPT-4o yang masing-masing memiliki skor 88,7, 88,3, dan 83,7 poin.

Kemudian, untuk memecahkan soal matematika level internasional, seperti AIME 2024, MATH-500, hingga CNMO 2024, DeepSeek V3 memiliki skor performa untuk masing-masing benchmark mencapai 39,2, 90,2, dan 43,2 poin.

Di benchmark serupa, Llama 3.1, Claude-3.5, dan GPT-4o masing-masing memiliki skor performa AIME 2024, MATH-500, dan CNMO 2024 mencapai 23,3, 73,8, dan 6,8 poin; 16,0, 78,3, dan 13,1 poin; serta 9,3, 74,6, dan 10,8 poin.

DeepSeek juga mengklaim bahwa DeepSeek-R1 mampu menyaingi dan bahkan melampaui model AI terbaru dari OpenAI, yaitu OpenAI O1, di beberapa benchmark, termasuk dalam tes pemahaman konteks dan pemecahan masalah matematika.

10. Memanfaatkan talenta dalam negeri

Pengembangan DeepSeek sepenuhnya memanfaatkan talenta muda dalam negeri. Wenfeng mengatakan, inovasi AI tidak tidak harus mempekerjakan talenta yang memiliki kemampuan sangat bagus di bidang AI dari luar China.

Karyawan DeepSeek diklaim semuanya berasal dari dalam negeri. DeepSeek mengambil lulusan baru dari kampus-kampus ternama di China dan talenta muda dalam negeri yang telah berpengalaman di bidang AI.

Wenfeng menyadari jika talenta dalam negeri yang sangat ahli di bidang AI mungkin belum ada saat ini. Akan tetapi, dia berencana untuk mendidik talenta dalam negeri agar bisa bersaing dengan talenta AI papan atas.

11. DeepSeek dibuat open source

Meski mampu membuat model AI yang mengungguli model-model AI lain yang sudah populer, DeepSeek tidak “pelit”. Pasalnya, pengembangan DeepSeek R-1 sepenuhnya bersifat open source.

Model pengembangan ini sangat jauh berbeda dengan ChatGPT yang dibuat tertutup alias close source. Dengan dibuat open source, kode DeepSeek R-1 bebas digunakan dan dikembangkan oleh siapa saja.

Pengembangan dengan pendekatan yang terbuka itu akan membantu model AI China ini tumbuh lebih cepat dengan memungkinkan pengembang di seluruh dunia untuk meningkatkan dan mengembangkannya.

12. Bikin saham perusahaan teknologi AS anjlok

DeepSeek seakan menjadi alarm bagi AS bahwa dominasinya tidak akan bertahan lama. Kehadiran model AI terbaru DeepSek pada 20 Januari lalu telah mempengaruhi pasar saham, khususnya saham-saham perusahaan teknologi AS.

Pada Senin kemarin (27/1/2025), saham-saham perusahaan teknologi AS anjlok. Saham Nvidia (NVDA), pemasok chip AI terkemuka, turun hampir 17 persen dan kehilangan nilai pasar sebesar 588,8 miliar dollar AS.

Sejauh ini, angka tersebut merupakan kehilangan nilai pasar tertinggi yang pernah terjadi pada suatu saham dalam satu hari. Rekor sebelumnya dipegang Meta yang hampir tiga tahun lalu pernah kehilangan nilai pasar sebesar sebesar $240 miliar.

Selain Nvidia, saham Meta (META) dan Alphabet (GOOGL), perusahaan induk Google, juga turun tajam. Kemudian, Oracle (ORCL), Vertiv, Constellation, NuScale, dan perusahaan pusat data lainnya anjlok.

13. Membuat pasar skeptis atas kemampuan teknologi AS

Analis investasi di lembaga keungan Truist, Keith Lerner mengatakan, akibat adanya DeepSeek, pasar saat ini tengah mempertanyakan kemampuan perusahaan-perusahaan AS dalam industri teknologi AI, yang selama ini selalu diunggulkan.

"Peluncuran model DeepSeek membuat investor mempertanyakan keunggulan yang dimiliki perusahaan AS dan berapa banyak yang dibelanjakan dan apakah pengeluaran itu akan menghasilkan laba (atau pengeluaran berlebih)," kata Lerner, dikutip dari CNN Business.

Sementara itu, menurut kepala strategi investasi di Saxo, Charu Chanana, dengan pengembangan yang lebih efisien, DeepSeek yang mulai naik sangat berpotensi untuk menarik minat investor karena tampak memberikan pertumbuhan yang menjanjikan.

14. Membuat investor kripto jual aset berjamaah

Selain pasar saham, kehadiran DeepSeek juga mempengaruhi pasar kripto. Pada Senin (27/1/2025), harga kripto Bitcoin sempat turun 7 persen menjadi di bawah 98.000 dollar AS (sekitar Rp 1,58 miliar) per keping.

Platform analisis kripto Coinglass mencatat, investor ramai-ramai menjual aset kripto pada tanggal tersebut dengan total likuidasi (pencairan aset ke uang tunai) sampai 861,48 juta dollar AS (sekitar Rp 13,9 triliun).

Menurut pakar kripto, aksi jual kripto berjamaah ini berkaitan dengan kehadiran DeepSeek yang membuat saham teknologi yang overvalued mengalami penilaian ulang. Laporan lengkapnya bisa dibaca di artikel ini.

15. Membuat AS waspada

Kehadiran dan keramaian soal model AI China DeepSeek telah membuat pemerintah AS waspada. Dikutip dari Gizmochina, pemerintah AS dilaporkan sudah memperhatikan dampak yang mengganggu dari DeepSeek.

Sekretaris pers Gedung Putih Karoline Leavitt mengonfirmasi bahwa pejabat AS sedang meninjau implikasi keamanan nasional dari model AI Tiongkok. Dewan Keamanan Nasional (NSC) sedang mengevaluasi potensi ancaman yang ditimbulkan oleh DeepSeek.

Kekhawatiran tersebut muncul pada teknik distilasi yang digunakan oleh DeepSeek, yang mengarah pada diskusi tentang langkah-langkah yang lebih ketat untuk mencegah tindakan pembelajaran yang tidak sah menggunakan teknologi AI AS.

Selain pemerintah, kehadiran DeepSeek juga menimbulkan kewaspadaan pada perusahaan-perusahaan teknologi AS.

CEO Microsoft, Satya Nadella mengatakan, perusahaan AS, terutama yang fokus di bidang AI, harus hati-hati dengan gerak-gerik dan perkembangan DeepSeek dan perusahaan AI China lainnya.

"Saya takjub melihat mereka membuat model AI open source yang bisa berjalan secara efisien namun tetap memiliki performa baik," ujar Nadella dalam sebuah acara, dikutip CNBC dan dihimpun KompasTekno, Senin (27/1/2025).

"Kita harus waspada terhadap perkembangan AI China di masa depan," pungkas Nadella.

Dikutip dari Business Insider, perusahaan media sosial besar yang juga menggembangkan model AI Llama, Meta juga khawatir dengan kehadiran DeepSeek. Meta bahkan dilaporkan telah menyiapkan agenda untuk menganalisis teknologi yang dipakai DeepSeek.

Meta dikabarkan ingin menganalisis bagaimana teknologi DeepSeek bisa memangkas ongkos pengembangan. Kemudian, Meta juga ingin mengetahui data apa yang digunakan untuk mengembangkan model AI DeepSeek.

16. Disambut Trump dan bos ChatGPT

Meski sebagian pihak di AS waspada, beberapa tokoh penting malah menyambut kehadiran AI China DeepSeek. Tokoh penting AS yang senang dengan kehadiran DeepSeek antara lain adalah Presiden Donald Trump dan bos ChatGPT Sam Altman.

Trump mengatakan, DeepSeek bisa menjadi alarm bagi perusahaan-perusahaan Amerika Serikat (AS) untuk lebih kompetitif. Kehadiran AI China ini yang lebih cerdas dan murah ini adalah hal yang positif.

Senada dengan Trump, Altman juga mengungkapkan bila kehadiran DeepSeek menjadi penyegar dalam kompetisi AI. Dengan kehadiran DeepSeek, OpenAI bakal mengeluarkan model yang lebih baik. Untuk lebih lengkapnya, silakan baca artikel ini.

17. Bikin AI Image Generator Janus Pro

Di tengah popularitas DeepSeek R-1, DeepSeek baru saja meluncurkan model AI yang bisa membuat gambar secara multimodal dari perintah teks ataupun gambar atau yang biasa disebut dengan model AI Image Generator.

Sebagai informasi, DeepSeek R-1 dan DeepSeek V-3 sebelumnya belum mampu untuk membuat gambar dari teks dan gambar. Adapun nama model AI Image Generator buatan DeepSeek adalah Janus Pro.

Janus Pro diklaim mampu mengungguli model AI lain serupa seperti DALL-E 3 buatan OpenAI (induk ChatGPT) dan Stable Diffusion. Saat ini, Janus Pro bisa diunduh lewat platform AI Hugging Face. Laporan lengkapnya bisa dibaca di artikel ini.

Dapatkan update berita teknologi dan gadget pilihan setiap hari. Mari bergabung di Kanal WhatsApp KompasTekno.Caranya klik link https://whatsapp.com/channel/0029VaCVYKk89ine5YSjZh1a. Anda harus install aplikasi WhatsApp terlebih dulu di ponsel.

Tag: #fakta #deepseek #china #cerdas #murah #yang #jadi #pesaing #chatgpt