
Foto: OpenAI
Teknologi.id - Beberapa hari setelah "kode merah" internal diumumkan oleh CEO OpenAI, Sam Altman, akibat adanya ancaman kompetitif dari model canggih milik Google, OpenAI mengumumkan kreasi terbarunya: GPT-5.2. Ia menjelaskannya sebagai model paling canggih mereka sejauh ini. GPT-5.2 dirancang secara spesifik untuk menguasai lingkungan profesional dan tugas jangka panjang.
OpenAI menempatkannya sebagai model generasi baru yang leboh cepat dan lebih cakap dibandingkan pendahulunya, menjadikan AI mendekati kemampuan manusia di lingkungan kerja.
Baca juga: OpenAI: ChatGPT Enterprise Bantu Karyawan Hemat Hingga 1 Jam Kerja per Hari
Produktivitas Cepat di Lingkungan Kerja
GPT-5.2 dikatakan dapat mempercepat produktivitas secara cepat. Mengacu dari data pengguna sebelumnya, OpenAI mengatakan perusahaan yang menggunakan ChatGPT Enterprise menghemat 40-60 menit dari waktu kerjanya, sementara mengurangi sampai 10 jam dalam seminggu untuk pengguna intens. Dengan GPT-5.2, keuntungan ini diharapkan dapat meningkat lebih jauh.
Menurut Chief Product Officer, Fidji Simo, GPT-5.2 terhitung superior untuk tugas utama di kantor, termasuk:
- Memproduksi spreadsheet dan presentasi.
- Menulis dan memperbaiki kode.
- Memahami dan menganalisa gambar dan diagram teknis.
- Memecahkan tugas beberapa langkah tanpa menghilangkan konteks.
- Menggunakan alat eksternal (seperti pencarian, database, atau perangkat perusahaan).
- Tolak ukur kinerja dan standar "Pakar Manusia".
OpenAI mendemonstrasikan kekuatan GPT-5.2 melalui pengujian ketat, termasuk evaluasi besar yang disebut GDPval. Uji coba ini mengukur kinerja model AI di 44 peran profesional, dari keuangan dan penjualan sampai desain dan teknisi.
Versi paling cakap model ini, GPT-5.2 'Thinking', dikabarkan menyaingi atau mengungguli profesional di industri dalam 70,9% tugasnnya, hampir dua kali lipat dari model GPT-5 sebelumnya. OpenAI menyatakan model ini menyelesaikan tugas profesional serupa 11 kali lebih cepat dengan harga kurang dari 1% biaya ahli.
Kinerja spesifiknya termasuk:
- Coding: GPT-5.2 mendapat rekor baru di SWE-Bench Pro, benchmark untuk tugas teknis real-world. Developer mengatakan model ini lebih baik dalam memperbaiki, mengimplementasikan fitur, me-review kode, dan mengelola arus kerja end-to-end dengan kesalahan yang lebih sedikit.
- Sains dan Matematika: Model ini mencapai 92% akurasi dalam pertanyaan sains tingkat pascasarjana dan mencatat rekor baru dalam soal matematika sulit, setelah digunakan peneliti untuk mengusulkan bukti yang setelah itu divalidasi manusia.
Terobosan Konteks Panjang dan Penggunaan Alat

Foto: CometAPI
Salah satu peningkatannya adalah kemampuannya untuk mengelola teks panjang. Model ini dapat memantau informasi dari ratusan rib token, mencapai akurasi yang hampir sempurna bahkan saat detail relevan tersembunyi jauh di dalam file besar.
Pada evaluasi MRCRv2, GPT-5.2 mencetak rekor baru dalam varian "4-needle", membuktikan kalau model ini dapat memahami dan menyatukan pemahaman konteks di lebih dari 256.000 token (setara sampai 180.000-200.000 kata), kasarnya 2.5 kali rata-rata panjang novel. Hal ini ideal untuk profesional yang bekerja dengan kontrak panjang, makalah penelitian, dokumen legal, atau proyek multi-file.
Di samping itu, kemampuannya untuk mengelola tugas multi-step melibatkan alat eksternal meningkat secara signifikan. Pada benchmark Tau2, GPT-5.2 mencapai 98,7% akurasi dalam menangani skenario customer support yang kompleks, berhasil mengelola situasi sulit seperti memesan kembali perjalanan, mengatur hotel, atau mendaftarkan permintaan medis dalam satu arus pekerjaan.
Baca juga: OpenAI Umumkan Code Red, Semua Proyek Dihentikan Demi Fokus ke ChatGPT
Kesediaan dan Respon Pasar
GPT-5.2 mulanya diluncurkan di rencana ChatGPT dalam tiga versi:
- Instant: Untuk tugas harian dengan respon yang lebih cepat.
- Thinking: Untuk penalaran terstruktur dan detail di pekerjaan yang sulit.
- Pro: Memberikan jawaban dengan kualitas tertinggi dan masalah teknis yang sangat sulit.
Pada API-nya, model ini hadir dengan nama gpt-5.2, gpt-5.2-chat-latest, dan gpt-5.2-pro. Walau harganya lebih mahal dibandingkan GPT-5.1, OpenAI menentang kalau efisiensi yang lebih baik seringkali menurunkan biaya keseluruhan untuk membuat hasil yang berkualitas lebih tinggi.
Peluncuran ini merupakan respon langsung terhadapt pesaing yang bermunculan, dari model Gemini 3 milik Google dan Claude Opus 4 milik Anthropic. Meski begitu, GPT-5.2 tidak membawakan pembaruan dalam generasi gambar, sebuah kemampuan viral yang mendukung Google baru-baru ini. Beberapa bocoran mengatakan OpenAI mungkin akan merilis model generasi gambar yang lebih canggih di bulan Januari 2026.
Baca Berita dan Artikel yang lain di Google News.
(yna/sa)