Teknologi.id - OpenAI kembali menghadirkan inovasi di dunia kecerdasan buatan dengan memperkenalkan dua model baru, o3 dan o3-mini. Kedua model ini dirancang untuk memberikan kemampuan penalaran yang lebih canggih, memungkinkan pendekatan logis dan sistematis dalam pemecahan masalah, mendekati cara berpikir manusia.
Sebagai penerus dari model o1 yang dirilis pada September lalu, o3 menunjukkan kemajuan signifikan, terutama dalam bidang matematika. Hal ini terbukti dari hasil uji coba pada American Invitational Mathematics Exam (AIME) 2024, di mana model ini meraih skor 96,7 persen, hanya salah pada satu soal. Hasil ini jauh melampaui skor 83,3 persen yang dicapai oleh pendahulunya, o1.
Versi lebih ringan, o3-mini, juga mencatat pencapaian yang mengesankan. Dalam mode penalaran "High", model ini berhasil mencetak skor 83,6 persen pada AIME 2024, mengungguli o1-mini yang hanya mencapai skor 63,6 persen.
Baca juga: OpenAI Buka Akses Fitur Canvas untuk Semua Pengguna ChatGPT
Keunggulan di Berbagai Bidang
Kehebatan o3 tidak terbatas pada matematika. Dalam pengujian GPQA Diamond untuk soal sains tingkat universitas, model ini mencatat skor 87,7 persen. Selain itu, o3 juga unggul pada berbagai tolok ukur populer, seperti SWE-Bench Verified dengan skor 22,8 poin dan Codeforces dengan 2.727 poin.
Dalam pengujian Artificial General Intelligence (AGI) melalui ARC-AGI, o3 menunjukkan kemampuan luar biasa dengan skor 76 persen dalam mode "Low" dan 88 persen dalam mode "High". Hasil ini jauh lebih baik dibandingkan o1 yang hanya mencapai skor antara 20 hingga 30 persen.
Baca juga: OpenAI Perbarui Fitur Advanced Voice Mode ChatGPT
Kinerja dan Waktu Respons
Meskipun memiliki tingkat akurasi tinggi, o3 membutuhkan waktu pemrosesan yang lebih lama dibandingkan GPT-4o. Dalam mode "High", o3 membutuhkan waktu sekitar 23 detik untuk memberikan respons, sementara GPT-4o hanya memerlukan 0,5 detik. Dalam mode "Low", o3 mampu merespons dalam waktu 1 detik, namun dengan tingkat akurasi yang lebih rendah.
Karakteristik ini membuat o3 lebih ideal untuk menyelesaikan masalah kompleks di bidang matematika dan sains, sementara GPT-4o lebih cocok untuk pertanyaan umum yang memerlukan respons cepat.
Uji Coba dan Ketersediaan
Saat ini, kedua model, o3 dan o3-mini, masih dalam tahap uji coba dengan pendaftaran dibuka hingga 10 Januari 2025. OpenAI belum memberikan informasi pasti mengenai jadwal peluncuran resmi untuk penggunaan umum di platform ChatGPT.
Dengan peluncuran ini, OpenAI menandai kemajuan signifikan dalam pengembangan AI, khususnya dalam kemampuan analisis dan pemecahan masalah yang komplek.
(dwk)