OpenAI Rilis GPT-5.2, Model AI Paling ''Serius'' Buat Kerjaan Kantoran
Ringkasan berita:
- OpenAI meluncurkan GPT-5.2 dengan tiga versi yaitu instant, Thinking, dan Pro yang diklaim lebih cerdas, lebih cepat, dan lebih andal untuk pekerjaan profesional. Mulai dari coding, analisis dokumen panjang, hingga pembuatan presentasi dan spreadsheet. Model ini hadir di tengah tekanan kompetitif setelah laporan “code red” internal terkait persaingan dengan Google Gemini.
- GPT-5.2 Thinking menunjukkan lompatan performa signifikan lewat berbagai benchmark, mengalahkan atau menyamai profesional manusia dalam 70,9 persen tugas kerja terstruktur, 30 persen lebih akurat dari GPT-5.1, serta mampu memahami konteks hingga 256.000 token. Meski begitu, update terkait image generation belum hadir dan diproyeksikan rilis pada Januari 2026.
- OpenAI resmi meluncurkan GPT-5.2, model AI terbaru yang digadang-gadang paling canggih mereka sejauh ini.
Menurut Fidji Simo, Chief Product Officer OpenAI, GPT-5.2 lebih jago untuk pekerjaan kantoran, seperti membuat spreadsheet, presentasi, menulis kode, memahami konteks panjang, hingga menghubungkan berbagai tool dalam proyek multi-langkah.
OpenAI juga mengeklaim, pengguna akan merasakan bahwa GPT-5.2 lebih cerdas untuk digunakan sehari-hari, lebih terstruktur, lebih andal, dan tetap menyenangkan untuk diajak berinteraksi.
Model AI GPT-5.2 hadir dalam tiga versi untuk pengguna ChatGPT berbayar dan developer API. Pertama, GPT-5.2 Instant, versi tercepat untuk tugas ringan seperti menulis, menerjemahkan, dan pencarian informasi.
Kedua, ada GPT-5.2 Thinking yang dirancang untuk pekerjaan rumit seperti coding, analisis dokumen panjang, perencanaan, dan matematika. Ketiga, GPT-5.2 Pro jadi versi paling presisi untuk problem solving tingkat tinggi.
Peluncuran model penerus GPT-5.1 ini hadir di tengah momen panas, tepat setelah laporan bahwa CEO Sam Altman mengeluarkan memo “code red” akibat kekhawatiran ChatGPT mulai kalah dari Google Gemini.
Performa GPT-5.2
Ilustrasi Superintelligence, proyek baru Meta untuk mengembangkan AI dengan kecerdasan yang dapat melampaui manusia.
OpenAI menyebut GPT-5.2 sebagai model dengan performa terbaik yang mereka rilis untuk penggunaan profesional. Klaim tersebut terlihat dari capaian GPT-5.2 Thinking di berbagai tolok ukur atau benchmark.
Misalnya, model ini diklaim menempati posisi puncak di SWE-Bench Pro, sebuah benchmark untuk menilai kemampuan agen AI dalam menyelesaikan tugas coding. Serta GPQA Diamond, tes penalaran ilmiah setingkat pascasarjana.
Kinerja GPT-5.2 juga diuji pada GDPval, sebuah evaluasi yang dirilis OpenAI awal tahun ini untuk mengukur kemampuan AI menyelesaikan tugas-tugas kerja terstruktur di 44 jenis profesi berbeda.
Dalam benchmark tersebut, GPT-5.2 Thinking mengalahkan atau menyamai kinerja profesional industri pada 70,9 persen tugas. Tugas-tugas ini mencakup pembuatan presentasi, spreadsheet, hingga penulisan laporan kompleks.
OpenAI mengeklaim model ini menyelesaikan tugas serupa 11 kali lebih cepat dengan biaya kurang dari 1 persen dibanding tenaga ahli.
Rentang profesi dalam pengujian GDPval cukup luas, mulai dari software developer, pengacara, akuntan, perawat, analis keuangan, manajer proyek, jurnalis, hingga penyedia manufaktur dan tenaga pelayanan publik.
Dengan cakupan seperti itu, OpenAI menilai GPT-5.2 Thinking mulai mendekati standar “asisten kerja” yang mampu membantu banyak jenis pekerjaan kantoran.
Dari sisi akurasi, GPT-5.2 juga membawa peningkatan signifikan. Dibanding GPT-5.1 Thinking, model ini 30 persen lebih jarang menghasilkan jawaban keliru pada kumpulan pertanyaan nyata dari ChatGPT.
OpenAI menyebut, peningkatan ini penting bagi profesional yang mengandalkan AI untuk riset, analisis, penulisan, hingga pengambilan keputusan harian. Meski begitu, perusahaan tetap mengingatkan agar pengguna melakukan pengecekan ulang pada tugas-tugas kritis.
Peningkatan paling mencolok lainnya ada pada kemampuan bekerja dengan konteks panjang.
Model AI GPT-5.2 Thinking memecahkan rekor baru di MRCRv2, evaluasi yang menguji kemampuan AI menggabungkan informasi dalam dokumen yang sangat panjang.
Model ini menjadi yang pertama mencapai akurasi hampir 100 persen pada varian “4-needle”, yang menguji pemahaman konteks hingga 256.000 token (setara 180.000–200.000 kata).
Sebagai gambaran, novel Harry Potter and the Sorcerer's Stone (buku 1) diestimasikan berisi sekitar 77.000 kata. Artinya, GPT-5.2 mampu membaca, mengingat, dan memahami dokumen setebal 2,5 buku Harry Potter pertama dalam satu kali prompt.
Secara praktis, ini memungkinkan GPT-5.2 mengolah dokumen super panjang, seperti laporan riset, kontrak, transkrip rapat, hingga proyek multi-file, sambil tetap menjaga koherensi dan konsistensi informasi.
OpenAI menilai kemampuan ini akan sangat berguna untuk analisis mendalam, sintesis informasi, dan workflow profesional yang bersumber dari banyak dokumen sekaligus.
Di sisi lain, GPT-5.2 tidak membawa update image generation, padahal memo “code red” Altman sebelumnya menyoroti kebutuhan OpenAI untuk mengejar Google, yang viral lewat Gemini 2.5 Flash Image “Nano Banana” dan kini Banana Pro (alias Gemini 3 Pro Image).
Bocoran menyebut OpenAI baru akan merilis model dengan image generator lebih canggih, lebih cepat, dan lebih ekspresif pada Januari 2026, sebagaimana dihimpun KompasTekno dari TechCrunch.
Tag: #openai #rilis #model #paling #serius #buat #kerjaan #kantoran