Model AI Alibaba Qwen 2.5 Max Rilis, Ungguli DeepSeek dan ChatGPT
- Perusahaan teknologi asal China, Alibaba, meluncurkan Large Languange Model (LLM) alias model kecerdasan buatan (artificial intelligence/AI) baru, disebut Qwen 2.5-Max.
Model AI ini dirilis tepat di hari Imlek. Qwen 2.5 Max merupakan versi baru dari Qwen 2.5 yang sudah dirilis sejak September 2024 lalu.
Dibanding model sebelumnya, AI Alibaba Qwen 2.5-Max dilatih dengan lebih banyak token yaitu 20 triliun lebih token. Sebagai gambaran, Qwen 2.5 dilatih memakai 18 triliun token. Dengan token yang lebih banyak, model AI akan memiliki performa yang lebih baik.
Menurut Alibaba, Qwen 2.5-Max memiliki perfoma yang lebih unggul dari model AI lainnya termasuk DeepSeek-V3 hingga GPT-4o.
"Qwen 2.5 Max unggul di hampir semua aspek GPT-4o, DeepSeek-V3, serta Llama-3.1-405B," kata Alibaba Cloud, dalam pengumuman di akun resmi WeChat perusahaaan.
Lebih spesifik, model AI baru Alibaba ini unggul di berbagai platform benchmark, termasuk Arena-Hard, LiveBench, LiveCodeBench, MMLU, dan GPQA-Diamond. Skor Qwen 2.5 Max di MMLU dan LiveCodeBench bahkan mencatatkan rekor baru, sehingga menjadi indikasi canggihnya model AI tersebut.
Terlepas dari kecanggihannya itu, jadwal rilis model AI ini menjadi sorotan, karena bertepatan dengan hari Imlek. Sebab umumnya, orang China libur kerja dan berkumpul dengan keluaraga saat perayaan tersebut.
Hal ini menunjukkan bahwa perusahaan teknologi, khususnya yang turut mengembangkan model AI, berupaya keras menyaingi produk serupa dari kompetitor, khususnya DeepSeek yang belakangan sedang hangat diperbincangkan.
DeepSeek adalah perusahaan kecerdasan buatan asal China yang mengembangkan model AI hingga asisten AI macam Opaen AI.
DeepSeek belakangan menggemparkan publik dengan model AI bikinannya yang canggih seperti model AI kenamaan lain, walaupun dengan biaya yang lebih rendah.
Popularitas DeepSeek belum lama ini juga mengguncang pasar saham Amerika Serikat, hingga membuat kapitalisasi pasar sejumlah perusahaan teknologi termasuk Nvidia ambles.
Karena itu, DeepSeek dinilai memberikan tekanan bagi perusahaan teknologi, baik di AS maupun di China, dilansir Reuters.
Model AI terbaru yang dirilis DeepSeek disebut DeepSeek R1, debut pada 20 Januari lalu.
Hanya berselang dua hari dari perilisan DeepSeek-R1, induk TikTok ByteDance meluncurkan pembaruan untuk model AI andalannya, disebut Doubao-1.5-pro.
Pembaruan itu diklaim membuat model AI-nya lebih unggul dari model AI terbaru OpenAI di benchmark AIME. Platform benchmark ini mengukur bagaimana model AI memahami dan merespons perintah yang kompleks.
Adapun DeepSeek bisa dibilang startup karena beroperasi seperti sebuah laboratorium yang dikelola oleh sejumlah anak muda yang baru lulus kuliah serta mahasiswa doktoral dari kampus kenamaan China.
Meski demikian, startup ini mampu bersaing dengan perusahaan besar dan ternama seperti Alibaba, ByteDance dan lainnya.
Lahir di tengah embargo AS
Sedikit membahas soal DeepSeek. DeepSeek lahir di tengah sanksi dagang Amerika Serikat (AS). Perusahaan-perusahaan teknologi AS dilarang berbisnis dengan China, termasuk untuk pengiriman chip AI.
Untuk mengatasi hal ini, China telah mengadopsi pendekatan kolaboratif dan open source untuk pengembangan AI-nya.
Dengan cara ini, perusahaan-perusahaan AI besar China bisa berbagi satu sama lain, demi mengembangkan DeepSeek. Masing-masing bereksperimen dengan pendekatan baru, menyumbangkan ide-ide baru, sehingga menghasilkan kemajuan yang lebih cepat.
Berbeda dengan ChatGPT yang dikontrol sendiri oleh OpenAI, DeepSeek merupakan model AI yang sifatnya terbuka, alias open source, artinya semua bisa berkontribusi pada pengembangan large language model (LLM) DeepThink (R1) yang digunakan.
Sifat DeepSeek yang terbuka inilah yang membuatnya cepat berkembang. Karena algoritmanya dioprek oleh banyak perusahaan dengan berbagai latar pengalaman, sehingga menjadi lebih efisien, meningkatkan performa dan kecepatan.
Hal ini bisa berpengaruh ke penanganan data yang lebih baik, teknik pelatihan yang efektif, atau pendekatan inovatif pada natural language processing.
Selain itu, sumber daya dan biaya yang dibutuhkan untuk melatih AI DeepSeek juga disebut-sebut lebih murah.
Tim DeepSeek mengeklaim bahwa mereka hanya menginvestasikan sekitar 6 juta dollar AS untuk pelatihan. Bandingkan dengan biaya untuk melatih ChatGPT yang mencapai 63 juta dollar AS. Ini artinya biaya pengembangan DeepSeek sepuluh kali lebih murah dari ChatGPT.
Startup ini juga mengembangkan DeepSeek hingga seperti sekarang, hanya dengan mengandalkan ribuan chip Nvidia H800 lama.
Penggunaan chip lama itu menjadi strategi cerdas dan hemat biaya oleh DeepSeek, sehingga terlepas dari ketergantungan industri pada hardware terbaru.
Dengan fokus pada optimisasi software dan memanfaatkan kemampuan chip lama yang sudah teruji, DeepSeek menunjukkan bahwa pengembangan AI bisa tetap inovatif dan terjangkau.
Pendekatan ini tak hanya menekan biaya, tapi juga memposisikan DeepSeek sebagai disruptor di industri AI, yang kemungkinan bisa mengubah cara perusahaan berpikir tentang investasi hardware di masa depan.
Tag: #model #alibaba #qwen #rilis #ungguli #deepseek #chatgpt