



AI Gemini 2.5 Computer Use Rilis, Bisa Buka Chrome, Isi Form, dan Belanja Otomatis
- Google resmi memperkenalkan Gemini 2.5 Computer Use, model AI yang bisa berselancar (browsing) di internet seperti manusia.
Dikembangkan oleh divisi kecerdasan Google, DeepMind, Gemini 2.5 Computer Use memungkinkan AI membuka Google Chrome, mengetik keyword, mengeklik tombol, mengisi formulir, menggulir halaman web, hingga menavigasi situs web secara mandiri hanya dari satu perintah teks pengguna.
Model AI ini mirip dengan ChatGPT Agent buatan OpenAI yang mampu mengambil alih aplikasi di PC dan menjalankan tugas kompleks secara otomatis atas perintah pengguna.
Kehadiran model AI Gemini 2.5 Computer ini diumumkan lewat pengumuman di laman blog Google. CEO Google Sundar Pichai menyebut Gemini 2.5 Computer Use menetapkan standar baru pada berbagai tolok ukur dengan latensi yang lebih rendah.
“Ini baru permulaan, tapi kemampuan model untuk berinteraksi langsung dengan web, seperti menggulir, mengisi form, dan memilih menu dropdown, adalah langkah besar menuju terciptanya agen AI serbaguna,” tulis Pichai lewat platform X.
Our new Gemini 2.5 Computer Use model is now available in the Gemini API, setting a new standard on multiple benchmarks with lower latency. These are early days, but the model’s ability to interact with the web – like scrolling, filling forms + navigating dropdowns – is an… pic.twitter.com/4PJoat9bwI
— Sundar Pichai (@sundarpichai) October 7, 2025
Diotaki Gemini 2.5 Pro
Ilustrasi model Gemini 2.5 Pro yang sudah tersedia secara publik dan bisa diakses melalui aplikasi Gemini, baik di Android, maupun iOSGemini 2.5 Computer Use dibangun di atas Gemini 2.5 Pro. Model bahasa besar yang dirilis pada Maret 2025 ini memiliki kemampuan penalaran (reasoning) dan jadi model paling cerdas dibanding sebelumnya.
Gemini 2.5 Pro yang ada di situs/aplikasi Gemini berfungsi sebagai asisten AI multimodal yang bisa menjawab pertanyaan, membuat dokumen, atau menganalisis gambar.
Berbeda dengan Gemini 2.5 Pro, Gemini 2.5 Computer Use hadir sebagai agen AI. yang . Jadi Gemini bisa mengeksekusi tindakan langsung di browser, tak lagi hanya membaca dan menjawab teks.
Contoh sederhananya, ketika pengguna mengetikkan perintah atau prompt “Cari hotel di pusat kota Bali yang punya kolam renang dan isi formulir pemesanan untuk 2 malam tanggal 15 Oktober”.
Gemini 2.5 Computer Use akan membuka browser virtual, mengetikkan pencarian, menavigasi situs, mengisi data di kolom pemesanan, bahkan mengonfirmasi langkah berikutnya. Semuanya secara otomatis, tanpa campur tangan pengguna.
Skenario penggunaan lainnya bisa untuk memproses formulir pelanggan, mencari informasi produk, atau menjadwalkan janji temu secara mandiri, memesan tiket konser, mencari resep, dan sebagainya.
Gemini 2.5 Computer Use juga bisa digunakan untuk pengujian aplikasi (UI testing) bagi pengembang software.
Demo cara kerja Gemini 2.5 Computer Use bisa dilihat lewat video di bawah ini.
Untuk saat ini, model ini belum dirancang untuk mengakses sistem file lokal, jadi belum bisa membuat atau menyimpan dokumen di komputer pengguna secara langsung. Fokusnya masih pada navigasi web dan aplikasi berbasis antarmuka.
Google mengeklaim, setiap tindakan AI Gemini 2.5 Computer Use diawasi oleh lapisan keamanan tambahan (per-step safety service). Sistem ini mengevaluasi apakah perintah aman untuk dijalankan, terutama saat menyangkut transaksi, login, atau data sensitif.
Beberapa tindakan berisiko tinggi, seperti membeli barang atau melewati CAPTCHA, akan meminta konfirmasi manual dari pengguna.
Selain itu, pengembang bisa mengatur agar model menolak atau meminta izin sebelum melakukan tindakan tertentu.
Cara coba Gemini 2.5 Computer Use
Pengguna umum bisa menjajal versi demo di situs Browserbase. Sepengalaman KompasTekno dalam pengujian singkat, Gemini 2.5 Computer Use bisa menavigasikan membuka Google Chrome lalu menelusuri situs resmi Taylor Swift dan memberikan informasi soal daftar harga album terbaru Taylor Swift The Life of a Showgirl.
Saat ini, Gemini 2.5 Computer Use tersedia dalam tahap public preview untuk pengembang melalui Gemini API di Google AI Studio dan Vertex AI.
Pengguna umum bisa menjajal versi demo di situs Browserbase atau di link berikut ini.
Sepengalaman KompasTekno dalam pengujian singkat pada Kamis (9/10/2025), Gemini 2.5 Computer Use berhasil menavigasikan membuka Google Chrome lalu menelusuri situs resmi Taylor Swift dan memberikan informasi soal daftar harga album terbaru Taylor Swift "The Life of a Showgirl".
Semua dilakukan langkah per langkah dalam kurun waktu sekitar 2 menit.
Kami kemudian menjajal lagi demo Gemini 2.5 Computer Use di Browserbase untuk mencari buku terbaru dari SenLinYu "Alchemised" di Amazon, lengkap dengan harga dan ongkos kirimnya ke Indonesia.
Namun, kali ini tidak berhasil, demo Gemini hanya sampai berhasil membuka situs Amazon saja.
Tag: #gemini #computer #rilis #bisa #buka #chrome #form #belanja #otomatis