144

Bukan ChatGPT, Ini Model AI dengan IQ Paling Tinggi

Elon Musk dilaporkan mewajibkan bank yang menangani IPO SpaceX untuk berlangganan chatbot AI Grok, dengan nilai kontrak mencapai puluhan juta dollar AS per tahun.(REUTERS/DADO RUVIC)

20:06

5 Mei 2026

Bukan ChatGPT, Ini Model AI dengan IQ Paling Tinggi

- Perusahaan-perusahaan kecerdasan buatan (artificial intelligence/AI) seperti OpenAI dan Anthropic terus berlomba menghadirkan model AI yang semakin pintar.

Setiap kali merilis model baru, mereka juga kerap mempublikasikan hasil benchmark untuk membuktikan keunggulan produk terbarunya.

Praktik serupa dilakukan Tracking AI, platform yang secara khusus menguji dan membandingkan performa berbagai model AI.

Platform ini mengukur tingkat kepintaran model AI menggunakan tes IQ, dan hasilnya kemudian divisualisasikan oleh Visual Capitalist, perusahaan media independen yang dikenal lewat sajian data infografis.

Pengujian dilakukan pada April 2026 menggunakan tes IQ Mensa Norwegia, melibatkan setidaknya 26 model AI dari berbagai perusahaan dalam beberapa versi.

Hasilnya menunjukkan persaingan yang sangat ketat. Grok-4.20 Expert Mode dan OpenAI GPT-5.4 Pro (Vision) sama-sama meraih skor tertinggi 145, sehingga Visual Capitalist menempatkan keduanya di posisi pertama secara bersamaan.

Gemini 3.1 Pro Preview mengikuti di belakangnya dengan skor 141. Capaian ini meningkat dibanding pengujian tahun 2025 lalu, di mana skor tertinggi hanya mencapai 135 poin.

Model AI asal China pun tak kalah bersaing. Qwen 3.5 buatan Alibaba menjadi model AI China dengan peringkat tertinggi, berada di posisi ke-10 dengan skor 130. Model-model seperti DeepSeek R1 dan DeepSeek V3 juga masuk dalam daftar. Berikut rincian selengkapnya.

Daftar model AI dengan IQ tertinggi

Grok-4.20 Expert Mode - 145
OpenAI GPT-5.4 Pro (Vision) - 145
Gemini 3.1 Pro Preview - 141
OpenAI GPT-5.4 Thinking (Vision) - 139
OpenAI GPT-5.3 - 136
Grok-4.20 Expert Mode (Vision) - 133
OpenAI GPT-5.4 Thinking - 133
Meta Muse Spark - 133
Gemini 3.1 Pro Preview (Vision) - 132
Qwen 3.5 - 130
Claude 4.6 Opus - 130
Kimi K2.5 - 127
Manus - 115
DeepSeek R1 - 112
DeepSeek V3 - 111
Gemini 3.1 Flash - 110
Llama 4 Maverick - 110
GPT-5.3 (Vision) - 109
Claude 4.6 Sonnet - 106
Bing Copilot - 101
Perplexity - 97
Mistral Medium 3.1 - 96
Claude 4.6 Sonnet (Vision) - 94
Claude 4.6 Opus (Vision) - 82
Llama 4 Maverick (Vision) - 79
GPT-5.4 Pro (non-vision) - 73

Tes Mensa Norwegia yang digunakan terdiri dari 35 teka-teki pola visual. Terdapat perbedaan metode antara model berbasis teks dan model multimodal.

Model non-vision menerima soal yang telah dikonversi menjadi deskripsi verbal, sementara model vision mengerjakan soal dalam bentuk gambar asli tanpa modifikasi.

Tracking AI juga menerapkan aturan khusus, jika model menolak menjawab, pertanyaan yang sama akan diulang hingga maksimal 10 kali, dan jawaban terakhir yang dijadikan penilaian.

Meski demikian, skor ini hanya bersifat perbandingan dan bukan tolok ukur mutlak kecerdasan AI secara keseluruhan, sebab tes IQ hanya mengukur satu aspek saja, yaitu kemampuan penalaran pola, dihimpun KompasTekno dari Visual Capitalist.

Dapatkan update berita teknologi dan gadget pilihan setiap hari. Mari bergabung di Kanal WhatsApp KompasTekno.

Caranya klik link https://whatsapp.com/channel/0029VaCVYKk89ine5YSjZh1a. Anda harus install aplikasi WhatsApp terlebih dulu di ponsel.

Tag: #bukan #chatgpt #model #dengan #paling #tinggi