DeepSeek Bikin ''Janus-Pro'', AI Image Generator Pesaing DALL-E 3 OpenAI
- Setelah viral dengan model AI "R1", DeepSeek kini meluncurkan kecerdasan buatan pengolah gambar (AI Image Generator) bernama Janus-Pro.
Janus-Pro datang dengan kemampuan multimodal, di mana dapat menghasilkan gambar dari perintah teks atau gambar.
Janus-Pro bikinan DeepSeek disebut-sebut dapat mengungguli AI Image Generator beken seperti DALL-E 3 buatan OpenAI (induk ChatGPT) dan Stable Diffusion, terutama dalam hal kualitas dan akurasi gambar.
Model AI Janus-Pro-7B merupakan pengembangan dari model sebelumnya, Janus, dengan peningkatan pada strategi pelatihan, kualitas data, dan ukuran model.
Janus-Pro ini dilaporkan menggabungkan 72 juta gambar sintetis berkualitas tinggi dengan data dunia nyata untuk menghasilkan output gambar yang lebih stabil dan detail.
Berbeda dengan model difusi yang umum digunakan, Janus-Pro-7B menggunakan pendekatan autoregresif dalam pemodelannya.
Pendekatan ini memungkinkan integrasi pemahaman dan pembuatan gambar dalam satu model, meningkatkan efisiensi dan akurasi dalam menghasilkan gambar dari deskripsi teks.
Gamabran hasil AI Image Generator DeepSeek Janus-Pro.Menurut perusahaan AI DeepSeek, pada dua tolok ukur evaluasi AI (GenEval dan DPG-Bench), model Janus-Pro-7B diklaim mengalahkan DALL-E 3 serta model seperti PixArt-alpha, Emu3-Gen, dan Stable Diffusion XL dari Stability AI.
Kinerja Janus-Pro disebut mengesankan, mengingat ukuran model yang ringkas. Sebagai gambaran, DALL-E punya 12 miliar parameter.
“Janus-Pro melampaui model terpadu sebelumnya dan menyamai atau melampaui kinerja model khusus tugas,” tulis DeepSeek dalam sebuah posting di Hugging Face.
“Kesederhanaan, fleksibilitas tinggi, dan efektivitas Janus-Pro menjadikannya kandidat kuat untuk model multimoda terpadu generasi berikutnya”, imbuh DeepSeek.
Janus-Pro berada di bawah lisensi MIT, yang berarti dapat digunakan secara komersial tanpa batasan. Janus-Pro saat ini tersedia untuk diunduh di platform pengembang AI Hugging Face, sebagaimana dihimpun KompasTekno dari CNET, Kamis (30/1/2025).
Setelah viral dengan model AI R1, DeepSeek kini meluncurkan kecerdasan buatan pengolah gambar (AI Image Generator) bernama Janus-Pro. AI DeepSeek naik daun
DeepSeek sedang menjadi bahan pembicaraan di dunia teknologi. Startup artificial intelligence (AI) asal Tiongkok ini berhasil mencuri perhatian dengan model AI terbarunya, DeepSeek R1, yang disebut-sebut mampu menyaingi ChatGPT. Bahkan, model ini sudah memuncaki App Store iOS dan membuat banyak orang penasaran.
DeepSeek menawarkan dua model unggulan, DeepSeek-V3 dan DeepSeek-R1, yang diklaim memiliki efisiensi dan performa lebih baik dibandingkan model AI lain di pasar.
DeepSeek-V3 dirancang untuk memenuhi kebutuhan pengguna di berbagai bidang, mulai dari menjawab pertanyaan sehari-hari hingga menangani tugas-tugas kompleks, seperti perhitungan matematika dan pemecahan masalah logika.
Model ini disebut sebagai pesaing langsung GPT-4o milik OpenAI. Sementara itu, DeepSeek-R1, model terbaru mereka, dirancang dengan efisiensi yang lebih tinggi dan kemampuan untuk bersaing langsung dengan O1 dari OpenAI, terutama dalam tugas yang membutuhkan analisis data mendalam dan penalaran kompleks.
Dikembangkan oleh DeepSeek AI, sebuah startup yang berbasis di Hangzhou, Tiongkok, model ini menjadi sorotan karena menggabungkan efisiensi tinggi dengan biaya penggunaan yang jauh lebih rendah dibandingkan pesaingnya.
DeepSeek R1, misalnya, tidak hanya cepat dalam memproses informasi tetapi juga hemat sumber daya, membuatnya lebih terjangkau bagi banyak pengguna dibandingkan model sekelasnya.
Startup DeepSeek AI didirikan kurang dari dua tahun lalu oleh High Flyer, sebuah hedge fund Tiongkok dengan visi ambisius untuk mengembangkan artificial general intelligence (AGI).
Dalam waktu singkat, DeepSeek telah membangun reputasi sebagai pelopor AI global dengan menghadirkan model-model yang tak hanya canggih, tetapi juga mendorong persaingan harga di industri AI Tiongkok.
Hal ini akan bisa memperkuat posisinya sebagai pemain utama dalam perkembangan teknologi AI modern.
Biaya pengembangan dan otak AI DeepSeek
Biaya pengembangan DeepSeek menunjukkan efisiensi luar biasa:
- DeepSeek-R1: Dilatih dalam waktu sekitar dua bulan dengan biaya sekitar 6 juta dollar AS atau sekitar Rp 97 milliar.
- GPT-4: Dilatih dengan biaya hingga 63 juta dollar AS atau sekitar Rp 1 triliun, menggunakan infrastruktur GPU yang jauh lebih mahal dan sumber daya lebih besar.
Dengan harga yang jauh lebih murah tapi performa setara dengan OpenAI, DeepSeek membuka babak baru dalam persaingan teknologi antara Tiongkok dan Amerika Serikat.
Untuk melatih model AI-nya, DeepSeek menggunakan 2.048 unit Nvidia H800 GPU. GPU ini memiliki spesifikasi lebih rendah dibandingkan H100 yang sering digunakan perusahaan AI di AS.
Pelatihan memakan waktu sekitar 2.788 juta jam GPU, dengan biaya total sekitar 5.58 dollar juta AS. Efisiensi ini jauh melampaui model seperti GPT-4o, yang dilatih menggunakan ribuan chip H100 dan investasi puluhan miliar dolar.
Pembatasan ekspor chip oleh AS memaksa Tiongkok menggunakan chip seperti H800 yang memiliki performa lebih rendah. Namun, keterbatasan ini justru mendorong inovasi, seperti penggunaan teknik distilasi atau penyulingan.
Dengan teknik ini, model AI dilatih untuk fokus pada tugas-tugas spesifik, sehingga lebih efisien dalam hal konsumsi sumber daya, tanpa mengorbankan performa pada tugas tertentu.
Meski menggunakan chip H800 yang lebih murah dan performanya dipangkas dibandingkan H100, DeepSeek berhasil mencapai kinerja yang sebanding atau lebih baik pada beberapa tolok ukur.
Ini menunjukkan bahwa efisiensi arsitektur dan teknik pelatihan dapat menjadi keunggulan kompetitif yang signifikan.
DeepSeek mengklaim kinerja yang unggul dibanding model-model AI terkenal lainnya pada sejumlah tolok ukur (benchmarks):
- DROP (3-shot F1): DeepSeek-V3 mencetak 91,6 poin, mengungguli Llama 3.1 (88,7), Claude 3.5 (88,3), dan GPT-4o (83,7).
- MATH-500: DeepSeek-V3 mencetak 90,2 poin, lebih tinggi dari Claude 3.5 (78,3) dan GPT-4o (74,6).
- AIME 2024: DeepSeek-V3 mencapai skor 39,2, jauh di atas Llama 3.1 (23,3) dan GPT-4o (9,3).
DeepSeek juga mengeklaim bahwa DeepSeek-R1 mampu menyaingi dan bahkan melampaui OpenAI O1 di beberapa benchmark, termasuk dalam tes pemahaman konteks dan pemecahan masalah matematika.
Tag: #deepseek #bikin #janus #image #generator #pesaing #dall #openai