



Gemini 2.5 Flash Lite Meluncur, AI Google Paling Ringan dan Irit
- Raksasa teknologi Google resmi memperkenalkan anggota baru model kecerdasan buatan (artificial intelligence/AI) terbarunya dari keluarga Gemini 2.5 series, yakni Gemini 2.5 Flash Lite, Selasa (17/6/2025).
Google menyebut Gemini 2.5 Flash Lite menjadi model AI yang paling cepat dengan biaya konsumsi yang paling rendah dibandingkan model Gemini lainnya.
“Kami juga memperkenalkan pratinjau untuk model Gemini 2.5 Flash Lite, model 2.5 paling cepat dan efisien secara biaya. Anda bisa mulai mengembangkan pratinjau untuk model terbaru dan kami menunggu saran dan masukan dari Anda,” ujar Senior Director, Product Management Gemini Tulsee Doshi dalam blog resmi Google.
Model ini belum tersedia secara publik dan masih talam tahap pengembangan (versi beta), tetapi Gemini 2.5 Flash Lite sudah bisa diakses para pengembang (developers) lewat Google AI Studio atau platform Vertex AI.
Merujuk pada pengumuman Google di blog resminya, Gemini 2.5 Flash Lite mampu melampaui skor pendahulunya, Gemini 2.0 Flash Lite, untuk beberapa pengujian benchmarking.
Mulai dari pengujian pemrograman, penyelesaian tugas matematika, sains, logika penalaran, hingga penugasan multimoda.
Hasil pengujian benchmarking untuk beberapa permasalahan kepada model Gemini 2.5 Flash, 2.5 Pro, dan Gemini 2.5 Flash-Lite untuk melihat peningkatan performa penalaran dibanding model pendahulu
Google menyebut untuk pengujian spesifik GPQA (Graduate-Level Google-Proof Q7A Benchmar/penyelesaian soal sains), AIME (American Invitational Mathematics Examination), serta LiveCodeBench (pengukuran kemampuan pengkodel LLM dalam kontek pemograman) tercatat tinggi.
Skor pengujian yang berhasil diraih konsisten melampaui skor Gemini 2.0 Flash Lite. Bahkan untuk beberapa pengujian, seperti penalaran visual, perfoma multi-lingual, dan AIME 2025, skornya nyaris bersaing ketat dengan model Gemini 2.5 Flash.
Keunggulan lainnya yang dimiiliki Gemini 2.0 Flash Lite adalah konsumsi biayanya yang rendah. Dalam mode Standard dan Thinking, biaya yang dikuncurkan sekitar 0,10 dollar AS (Rp 1.631) per juta token dan 0,40 dollar AS (Rp 6.527) per juta token output.
Akan tetapi, sebagaimana dikutip KompasTekno dari The Decoder, Rabu (18/6/2025), rincian biaya token yang dikeluarkan untuk mode Thinking akan lebih banyak. Guna untuk menghasilkan pemaparan yang lebih akurat, biaya penggunaan aktualnya juga akan mengikuti.
Oleh karena itu, Gemini 2.5 Flash Lite cocok untuk mengerjakan tugas-tugas berbobot tinggi dan berlatensi rendah, seperti menerjemahkan teks dari satu bahasa ke bahasa lain, hingga melakukan klasifikasi.
Sebab, pengujian skor untuk dua tugas di atas menunjukkan hasil benchmark yang tinggi, yakni 86,8 persen untuk soal FACTS Grounding dan 84,5 persen untuk Multilingual MMLU.
FACTS Grounding dalam pengujian AI mengacu pada kemampuan model bahasa besar (LLM/Large Language Model) memberi respons terhadap informasi yang aktual, sumber dapat diverifikasi sehingga mengurangi terjadi halusinasi informasi.
Sementara itu, Multilingual MMLU merujuk pada indikator pengujian yang digunakan untuk mengevaluasi pengetahuan umum dan kemampuan penalaran model bahasa di berbagai bahasa yang berbeda dan domain.
Adapun pengujian yang lain, seperti penalaran visual (Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark/MMMU) untuk Gemini 2.5 Flash Lite tercatat tinggi dengan skor 72,9 persen, sedangkan penalaran dan pemahaman mengenai gambar berada di skor 57,5 persen.
Seperti model Gemini 2.5 series lainnya, model yang diklaim paling irit ini juga sudah mendukung input multi-modal yang terintegrasi, seperti Google Search, eksekusi kode, hingga pemahaman terhadap konteks.
Google 2.5 Flash dan Gemini 2.5 Pro
Ilustrasi model Gemini 2.5 Pro yang sudah tersedia secara publik dan bisa diakses melalui aplikasi Gemini, baik di Android, maupun iOS
Sejalan dengan peluncuran ini, Google juga mengumumkan bahwa model AI Gemini 2.5 Flash dan Pro sudah bisa diakses secara resmi oleh publik. Kedua model berhasil mencapai skor benchmark yang terbilang tinggi untuk beberapa pengujian.
Perilisan secara resmi ini akhirnya dilakukan setelah Google melakukan sejumlah perkembangan dan perbaikan. Kedua model juga sudah tersedia baik di Android, maupun iOS melalui aplikasi Gemini.
Seluruh anggota keluarga Gemini 2.5 yang dikembangkan sejatinya dirancang untuk penalaran hibrida, yakni sistem yang menggabungkan berbagai pendekatan pemecahan masalah. Mulai dari penalaran logika, hingga metode statistik.
Integrasi ini mampu membantu model AI menghasilkan solusi yang dipertanggungjawabkan dan maksimal untuk tugas-tugas kompleks.
Strategi integrasi ini juga ditujukan untuk menyeimbangkan kinerja yang tinggi, dengan biaya dan latensi yang rendah. Google juga memosisikan ketiga model Gemini 2.5 sebagai bagian dari pareto front.
“Kami mendesain Gemini 2.5 menjadi keluarga dari model penalaran hibrida dengan performa yang menakjubkan, sekaligus menerapkan Pareto Front untuk mengutamakan kecepatan dan efisiensi biaya,” ungkap Tulsee.
Pareto Front dalam konteks AI merupakan kemampuan memberikan solusi optimal pada permasalahan optimasi multi-objektif. Sederhananya, cara kerja model ini adalah proses memperbaiki satu aspek dengan mengorbankan aspek yang lain.
Model ini memungkinkan pengguna mendapatkan solusi paling efektif atau sesuai dengan kebutuhan atau prioritas di antara tujuan-tujuan yang saling bertentangan. Solusi Pareto diterapkan guna mengoptimalkan efisiensi dan kapabilitas dari model yang dirilis.
Tag: #gemini #flash #lite #meluncur #google #paling #ringan #irit