Bukan ChatGPT, Ini Model AI dengan IQ Paling Tinggi
- Perusahaan-perusahaan kecerdasan buatan (artificial intelligence/AI) seperti OpenAI dan Anthropic terus berlomba menghadirkan model AI yang semakin pintar.
Setiap kali merilis model baru, mereka juga kerap mempublikasikan hasil benchmark untuk membuktikan keunggulan produk terbarunya.
Praktik serupa dilakukan Tracking AI, platform yang secara khusus menguji dan membandingkan performa berbagai model AI.
Platform ini mengukur tingkat kepintaran model AI menggunakan tes IQ, dan hasilnya kemudian divisualisasikan oleh Visual Capitalist, perusahaan media independen yang dikenal lewat sajian data infografis.
Pengujian dilakukan pada April 2026 menggunakan tes IQ Mensa Norwegia, melibatkan setidaknya 26 model AI dari berbagai perusahaan dalam beberapa versi.
Hasilnya menunjukkan persaingan yang sangat ketat. Grok-4.20 Expert Mode dan OpenAI GPT-5.4 Pro (Vision) sama-sama meraih skor tertinggi 145, sehingga Visual Capitalist menempatkan keduanya di posisi pertama secara bersamaan.
Gemini 3.1 Pro Preview mengikuti di belakangnya dengan skor 141. Capaian ini meningkat dibanding pengujian tahun 2025 lalu, di mana skor tertinggi hanya mencapai 135 poin.
Model AI asal China pun tak kalah bersaing. Qwen 3.5 buatan Alibaba menjadi model AI China dengan peringkat tertinggi, berada di posisi ke-10 dengan skor 130. Model-model seperti DeepSeek R1 dan DeepSeek V3 juga masuk dalam daftar. Berikut rincian selengkapnya.
Baca juga: 10 Layanan AI Generatif Terpopuler di Dunia, dari ChatGPT hingga DeepSeek
Daftar model AI dengan IQ tertinggi
- Grok-4.20 Expert Mode - 145
- OpenAI GPT-5.4 Pro (Vision) - 145
- Gemini 3.1 Pro Preview - 141
- OpenAI GPT-5.4 Thinking (Vision) - 139
- OpenAI GPT-5.3 - 136
- Grok-4.20 Expert Mode (Vision) - 133
- OpenAI GPT-5.4 Thinking - 133
- Meta Muse Spark - 133
- Gemini 3.1 Pro Preview (Vision) - 132
- Qwen 3.5 - 130
- Claude 4.6 Opus - 130
- Kimi K2.5 - 127
- Manus - 115
- DeepSeek R1 - 112
- DeepSeek V3 - 111
- Gemini 3.1 Flash - 110
- Llama 4 Maverick - 110
- GPT-5.3 (Vision) - 109
- Claude 4.6 Sonnet - 106
- Bing Copilot - 101
- Perplexity - 97
- Mistral Medium 3.1 - 96
- Claude 4.6 Sonnet (Vision) - 94
- Claude 4.6 Opus (Vision) - 82
- Llama 4 Maverick (Vision) - 79
- GPT-5.4 Pro (non-vision) - 73
Tes Mensa Norwegia yang digunakan terdiri dari 35 teka-teki pola visual. Terdapat perbedaan metode antara model berbasis teks dan model multimodal.
Model non-vision menerima soal yang telah dikonversi menjadi deskripsi verbal, sementara model vision mengerjakan soal dalam bentuk gambar asli tanpa modifikasi.
Tracking AI juga menerapkan aturan khusus, jika model menolak menjawab, pertanyaan yang sama akan diulang hingga maksimal 10 kali, dan jawaban terakhir yang dijadikan penilaian.
Meski demikian, skor ini hanya bersifat perbandingan dan bukan tolok ukur mutlak kecerdasan AI secara keseluruhan, sebab tes IQ hanya mengukur satu aspek saja, yaitu kemampuan penalaran pola, dihimpun KompasTekno dari Visual Capitalist.
Baca juga: Ask.com Resmi Tutup Setelah 30 Tahun, Cikal Bakal Chatbot AI Pamit
Dapatkan update berita teknologi dan gadget pilihan setiap hari. Mari bergabung di Kanal WhatsApp KompasTekno.
Caranya klik link https://whatsapp.com/channel/0029VaCVYKk89ine5YSjZh1a. Anda harus install aplikasi WhatsApp terlebih dulu di ponsel.