OpenAI Perbarui Fitur Advanced Voice Mode ChatGPT

Muhammad Haris Aminan . December 14, 2024

Advanced Voice Mode ChatGPT
Foto : Techcrunsh

Teknologi.id - Perusahaan kecerdasan buatan (AI), OpenAI, baru saja memperbarui fitur Advanced Voice Mode (AVM) pada chatbot andalannya, ChatGPT, dengan sejumlah peningkatan. Fitur ini dirancang agar pengguna dapat berinteraksi dengan ChatGPT secara lebih alami, seperti berbicara dengan manusia. Kini, Advanced Voice Mode tidak hanya mendukung input dan output suara, tetapi juga memiliki kemampuan untuk menganalisis lingkungan sekitar pengguna melalui video dan fitur berbagi layar.

Dengan fitur ini, ChatGPT dapat "melihat" konten yang ditampilkan di layar ponsel atau kamera pengguna, tentunya setelah pengguna memberikan izin akses. Kemampuan ini memungkinkan ChatGPT untuk memahami objek yang terlihat dan memberikan tanggapan secara hampir real-time. Misalnya, melalui fitur berbagi layar, chatbot ini dapat membantu menjelaskan menu di pengaturan ponsel atau menyelesaikan masalah matematika yang muncul di layar.

Demonstrasi Kemampuan "Melihat" ChatGPT

Fitur penglihatan kamera pada AVM juga memungkinkan ChatGPT untuk memahami objek di sekitar pengguna. Dalam sebuah demo yang ditampilkan di acara "60 Minutes" CNN, Presiden OpenAI, Greg Brockman, memamerkan kemampuan ini kepada pembawa acara Anderson Cooper. Cooper diminta menggambar anatomi manusia di papan tulis, dan ChatGPT diminta memberikan tanggapan terhadap gambar tersebut.

ChatGPT memberikan respons yang cukup menarik dan humoris, "Lokasinya tepat. Otaknya ada di kepala. Soal bentuknya, ini cukup oke. (Bentuk) Otaknya cenderung oval," kata chatbot itu menilai gambar Cooper.

Namun, dalam demo lain terkait soal geometri, AVM sempat memberikan jawaban yang kurang akurat. Hal ini menunjukkan bahwa meskipun fitur ini canggih, ChatGPT masih memiliki risiko halusinasi AI atau memberikan respons yang tidak selalu tepat.

Foto : Beebom

Baca juga : OpenAI Rilis ChatGPT Pro yang Diklaim Lebih Pintar dan Bernalar

Peluncuran Bertahap untuk Pengguna Terbatas

Kemampuan "melihat" ChatGPT melalui Advanced Voice Mode mulai diluncurkan secara bertahap sejak Kamis, 12 Desember 2024, untuk beberapa pengguna tertentu di Amerika Serikat. Fitur ini tersedia lebih dulu bagi pelanggan ChatGPT Plus, Team, dan Pro. Namun, tidak semua pengguna berlangganan akan langsung mendapatkan akses ke fitur ini.

Sementara itu, pelanggan ChatGPT Enterprise dan Edu dijadwalkan akan menerima fitur serupa pada Januari 2025. OpenAI menyatakan bahwa peluncuran ini dilakukan secara bertahap untuk memastikan stabilitas dan pengumpulan umpan balik dari pengguna awal. Informasi ini dihimpun dari laporan TechCrunch yang dirilis Jumat, 13 Desember 2024.

Sejarah Advanced Voice Mode

Fitur Advanced Voice Mode pertama kali diperkenalkan oleh OpenAI pada Mei 2024 sebagai peningkatan dari fitur input dan output suara yang telah tersedia sejak September 2023. Fitur ini memungkinkan ChatGPT menjadi asisten digital yang lebih interaktif, mirip dengan layanan seperti Google Assistant atau Siri.

Saat rilis perdana pada Juli 2024, fitur ini eksklusif untuk pelanggan berbayar ChatGPT Plus. OpenAI mengklaim bahwa AI yang digunakan dalam Advanced Voice Mode mampu merespons dengan cara yang lebih natural, memahami nada bicara pengguna, dan menyesuaikan balasannya dengan suasana hati atau emosi penggunanya. Selain itu, fitur ini memungkinkan pengguna untuk menginterupsi chatbot selama percakapan berlangsung.

Kemampuan dan Uji Coba

OpenAI menyatakan bahwa Advanced Voice Mode telah melalui serangkaian uji coba ekstensif sebelum diluncurkan. Dalam fase pengujian, fitur ini diujicobakan oleh lebih dari 100 orang dengan dukungan hingga 45 bahasa. Saat pertama kali dirilis, Advanced Voice Mode hanya mendukung empat jenis suara yang tersedia untuk pengguna.

Fitur ini juga dilengkapi sistem keamanan yang mampu memblokir permintaan yang tidak pantas, seperti konten kekerasan atau permintaan terkait materi berhak cipta. OpenAI terus mengumpulkan umpan balik dari pengguna untuk menyempurnakan fitur ini.
“Pengujian di tahap awal ini dilakukan untuk memastikan bahwa Advanced Voice Mode dapat memberikan respons yang aman dan sesuai dengan kebijakan yang berlaku,” ungkap OpenAI melalui akun resminya di media sosial X (sebelumnya Twitter).

Dengan peningkatan pada Advanced Voice Mode, ChatGPT kini menjadi lebih dari sekadar chatbot teks. Kemampuan untuk "melihat," menganalisis, dan memberikan respons secara real-time menjadikannya alat yang semakin canggih untuk membantu pengguna dalam berbagai situasi. Meskipun fitur ini masih dalam tahap pengembangan dan belum sempurna, langkah ini menunjukkan upaya OpenAI untuk terus menghadirkan teknologi AI yang lebih interaktif, aman, dan bermanfaat bagi penggunanya.

Baca berita dan artikel lain di Google News


(mha)

Share :