OpenAI Rilis GPT-5.2 Codex, AI Paling Jago Coding dan Kebal Retas
Ringkasan:
- OpenAI resmi merilis GPT-5.2 Codex, model AI khusus coding yang dioptimalkan untuk ekosistem Codex, dengan fokus pada pemrograman jangka panjang, refactoring besar, dan migrasi kode.
- GPT-5.2 Codex unggul di benchmark coding, mencatat skor tertinggi di SWE-Bench Pro (56,4 persen) dan Terminal-Bench 2.0 (64 persen), serta lebih andal memahami konteks panjang, screenshot, diagram, dan workflow developer nyata.
- Keamanan siber jadi fokus utama GPT-5.2 Codex, dengan peningkatan signifikan dalam deteksi dan analisis kerentanan, serta penerapan program Trusted Access Pilot untuk profesional keamanan terverifikasi.
- OpenAI resmi memperkenalkan model kecerdasan buatan (artificial intelligence, AI) terbaru mereka yang bernama GPT-5.2 Codex.
Berbeda dari GPT-5.2 versi umum yang dirilis pekan lalu, model ini hadir sebagai versi khusus yang dioptimalkan untuk penggunaan di ekosistem Codex.
Codex merupakan agen rekayasa perangkat lunak berbasis cloud yang dirancang khusus untuk membantu proses pemrograman (coding).
OpenAI menyebut, GPT-5.2 Codex telah dioptimalkan untuk pekerjaan pemrograman jangka panjang melalui Context Compaction, serta kemampuan yang lebih kuat dalam menangani perubahan kode berskala besar seperti refactor dan migrasi.
Model AI terbaru ini kini juga disebut memiliki performa kinerja yang lebih baik di lingkungan Windows, serta kemampuan keamanan siber yang meningkat secara signifikan.
Soal keamanan, OpenAI mengeklaim GPT-5.2 Codex lebih aman dari serangan siber dibandingkan model AI lain yang pernah dirilis OpenAI.
GPT-5.2 Codex sendiri mulai tersedia pada Kamis (18/12/2025) untuk pengguna ChatGPT berbayar, sementara akses API (application programming interface) dijanjikan akan menyusul dalam beberapa pekan ke depan.
Lebih jago coding
OpenAI menjelaskan bahwa GPT-5.2 Codex dibangun berdasarkan kemampuan generasi sebelumnya, yaitu GPT-5.2 dan GPT-5.1-Codex-Max.
Model AI anyar ini disebut lebih mumpuni dalam memahami konteks panjang, melakukan tool calling yang lebih andal, meningkatkan akurasi fakta, serta mendukung native compaction.
Menurut perusahaan, rangkaian peningkatan tersebut yang membuat GPT-5.2 Codex jauh lebih bisa diandalkan untuk mengerjakan tugas pemrograman yang berjalan lama.
Codex juga dapat menyelesaikan tugas-tugas kompleks, seperti refactoring besar, migrasi kode, hingga pembuatan fitur baru tanpa mudah kehilangan konteks meski prosesnya berjalan lama atau diulang beberapa kali.
Unggul di pengujian benchmark
Hasil skor pengujian SWE-Bench Pro dan Terminal-Bench 2.0 pada GPT-5.2 Codex.
Dari sisi performa, GPT-5.2 Codex menunjukkan peningkatan signifikan ketika diuji menggunakan tolok ukur internal mereka.
Model AI ini tercatat meraih skor tertinggi pada SWE-Bench Pro dan Terminal-Bench 2.0, dua tolok ukur yang dirancang untuk mengevaluasi sejauh mana coding agent dapat bekerja layaknya programer di dunia nyata.
Menurut keterangan OpenAI, pada pengujian SWE-Bench Pro, sebuah model diberikan repositori dan harus menghasilkan patch untuk menyelesaikan tugas rekayasa perangkat lunak yang realistis.
Sementara itu, terminal-Bench 2.0 menguji kemampuan model ketika bekerja di lingkungan terminal sungguhan. Tugas-tugasnya meliputi kompilasi kode, pelatihan model, dan pengaturan server.
Nah dari pengujian dua tolok ukur tersebut, GPT-5.2 Codex, masing-masing mendapatkan skor akurasi 56,4 persen dari SWE-Bench Pro, dan 64 persen pada Terminal-Bench 2.0.
Untuk peningkatan lain, GPT-5.2 Codex juga diklaim mampu membaca data tangkapan layar (screenshot), diagram teknis, grafik, atau antarmuka secara lebih akurat.
Codex turut dibekali kemampuan untuk mengubah desain tirutan (mockup) menjadi prototipe fungsional secara cepat, serta membantu pengembang membangun prototipe tersebut sampai ke tahap produksi melalui kolaborasi dalam sesi coding.
Keamanan jadi fokus utama
OpenAI menegaskan bahwa perkembangan model AI buatan mereka di bidang keamanan siber (cybersecurity) meningkat pesat. Mulai dari GPT-5 Codex, lalu melonjak lagi di GPT-5.1 Codex-Max, hingga kini kembali naik pada GPT-5.2 Codex.
Untuk memberikan gambaran peningkatannya, OpenAI memaparkan contoh kasus yang melibatkan seorang peneliti keamanan bernama Andrew MacPherson.
Andrew yang menjabat sebagai principal security engineer di Privy (sebuah perusahaan Stripe) mencoba menggunakan GPT-5.1-Codex-Max bersama Codex CLI dan agen pengkodean lainnya untuk mereproduksi dan mempelajari kerentanan React.
Namun di tengah proses penyelidikan, Andrew mendapati Codex menunjukkan perilaku sistem yang mencurigakan sehingga, menurut dia, diperlukan penyelidikan lebih dalam. Kerentanan tersebut kemudian dilaporkan secara bertanggung jawab kepada tim React.
Menurut OpenAI, kejadian tersebut justru menunjukkan bagaimana sistem AI dapat secara signifikan mempercepat pekerjaan keamanan defensif dalam perangkat lunak yang banyak digunakan di dunia nyata.
Seiring dengan sistem keamanan yang semakin kuat, OpenAI kini mulai menerapkan kontrol akses yang lebih ketat lewat program bernama Trusted Acces Pilot.
Program ini akan diberikan melalui undangan khusus kepada pihak-pihak yang memenuhi kriteria tertentu, meliputi:
- Profesional keamanan yang telah diverifikasi dan memiliki rekam jejak pengungkapan kerentanan yang bertanggung jawab, serta
- Organisasi dengan kasus penggunaan keamanan siber profesional yang jelas.
OpenAI menyebut, pihak yang memenuhi syarat akan mendapatkan akses ke model-model AI mereka yang paling mumpuni untuk keperluan keamanan, sebagaimana dihimpun KompasTekno dari blog resmi OpenAI.
Tag: #openai #rilis #codex #paling #jago #coding #kebal #retas