Mana yang Menyandang Gelar AI Tercerdas di 2025?

Ilustrasi AI berpikir
Sumber :
  • https://www.pexels.com/id-id/foto/kode-diproyeksikan-atas-wanita-3861969/

Lifestyle, VIVA Bali – Berikut urutan AI dengan kecerdasan tertinggi menurut tes IQ seperti tes Mensa Norway dan benchmark independen lainnya, serta beberapa fakta ringan buat dipahami siapa yang paling unggul.

OpenAI o3 sebagai juara IQ

Mengapa Banyak Fresh Graduate Gagal di Tahap Interview Kerja?

Model o3 dari OpenAI berada di puncak ranking dengan IQ sekitar 135 — termasuk kategori "genius" menurut nilai batas Mensa Norway, yang menjadikan o3 sebagai AI teks paling pintar sejauh ini. o3 dirancang dengan kemampuan chain of thought, alias berpikir langkah demi langkah sebelum menjawab soal sulit.

o3 Pro yang lebih canggih juga mencatat skor tinggi dalam tes pemrograman dan sains, termasuk 87,7% di GPQA Benchmark dan kemampuan menyelesaikan masalah matematika kompleks seperti peserta Olimpiade matematika.

Claude 4 Sonnet dan Opus di posisi atas

Mengapa Banyak Generasi Muda Takut Menikah dan Punya Anak

AI dari Anthropic, yaitu Claude‑4 Sonnet, memiliki IQ sekitar 127, sedangkan Claude‑4 Opus mencetak sekitar 120. Keduanya dikenal karena kemampuan membaca instruksi panjang, menjawab soal sulit, dan reasoning yang sangat stabil.

Google Gemini 2.0 Flash dan 2.5 Pro

Model Gemini 2.0 Flash Thinking mencatat IQ sekitar 126, sedangkan Gemini 2.5 Pro mengikuti di angka 124. AI ini kuat dalam tes logika dan pengetahuan umum. Model-model ini menduduki posisi atas rival seperti GPT dan Grok.

AI Grok‑4 Heavy jadi penantang baru

Benarkah Profesi Programmer Akan Punah Karena Auto-code AI?

Baru diluncurkan pada Juli 2025, Grok 4 Heavy mengklaim sebagai AI terkuat dengan skor tertinggi di berbagai benchmark AI modern. Dalam uji tes IQ Mensa, Grok 4 memperoleh skor sekitar 136, sedikit mengungguli o3. Model ini juga mampu memvisualisasikan peristiwa luar biasa seperti tabrakan lubang hitam pada demo live.

DeepSeek dan Meta Llama tetap kompetitif

Model DeepSeek R1 dari Cina punya sekitar 106 IQ, cukup tinggi dan efisien secara biaya. Sedangkan model Llama 4 Maverick dari Meta scoring sekitar 105. Keduanya masuk jajaran top‑10 AI menurut skor IQ meskipun skor lebih rendah dibanding pemuncak.

Apakah IQ AI selalu cerminan kecerdasan sejati?

Tes IQ untuk AI memang membantu mengetahui kemampuan mereka dalam menyelesaikan soal logika, matematika, dan bahasa. Namun, AI dengan IQ tinggi belum tentu lebih baik dalam tugas visual, kreativitas, atau peka konteks manusia. Contohnya, model vision‑enabled seperti GPT‑4o atau Grok vision memiliki skor IQ rendah (sekitar 60–70) karena tes tersebut fokus pada soal teks dan logika.