Foto: Google
Teknologi.id - Sekitar 10 bulan setelah peluncuran Gemini 1.5, Google kembali membuat gebrakan di dunia teknologi dengan meluncurkan Gemini 2.0.
Model kecerdasan buatan (AI) terbarunya ini diklaim mampu melakukan hampir segala hal. Mulai dari menghasilkan teks, gambar, video, hingga audio, Gemini 2.0 dirancang untuk membawa AI ke era baru yang lebih otonom dan serbaguna.
Peluncuran model AI Gemini 2.0 diumumkan langsung melalui laman resmi Google The Keyword, Rabu (11/12).
"Hari ini kami dengan bangga meluncurkan era baru model AI yang dirancang khusus untuk zaman agentik, Gemini 2.0, model paling canggih yang pernah kami buat," demikian pernyataan yang ditulis Google.
Google menyebutkan bahwa Gemini 2.0 hadir dengan kemampuan luar biasa, seperti menghasilkan gambar dan audio secara langsung, serta penggunaan alat yang lebih canggih.
Teknologi ini diyakini mampu membawa AI selangkah lebih dekat untuk mewujudkan visi besar mereka, yaitu menciptakan asisten universal yang bisa membantu hampir semua kebutuhan manusia.
Baca juga: Google Rilis GenCast, Model AI yang Bisa Ramal Cuaca Secara Akurat
Gemini 2.0 Flash
Google memperkenalkan Gemini 2.0 Flash, versi awal dari keluarga Gemini 2.0. Model ini dirancang untuk bekerja cepat dengan latensi rendah dan performa tinggi dua kali lipat dari versi sebelumnya.
Gemini Flash generasi pertama, 1.5, hanya bisa menghasilkan teks dan tidak dirancang untuk beban kerja yang berat.
Namun, model baru ini disebut lebih serbaguna, dengan berbagai kemampuan baru untuk menciptakan pengalaman AI yang lebih canggih dan otonom.
Google mengungkapkan bahwa Gemini 2.0 Flash tidak hanya mampu menghasilkan teks, tetapi juga dapat secara langsung membuat gambar, video, dan audio.
Gemini 2.0 Flash dapat menghasilkan output multimodal, seperti gambar yang digabungkan dengan teks dan suara multibahasa.
Selain itu, model ini juga dapat memanfaatkan berbagai tools, misalnya Google Search, serta menjalankan kode dan menggunakan fungsi dari aplikasi pihak ketiga.
Beberapa fitur unggulannya Gemini 2.0, meliputi kemampuan berpikir dengan berbagai jenis input (multimodal), memahami konteks yang lebih panjang, mengikuti instruksi yang rumit, merencanakan langkah-langkah, serta memanggil fungsi secara lebih fleksibel.
Tiga Agen AI Prototipe Inovatif
Google memperkenalkan tiga agen AI prototipe yang dibangun dengan menggunakan arsitektur Gemini 2.0. Agen-agen ini dapat membantu pengguna dalam menyelesaikan tugas dan mencapai tujuan mereka.
Project Astra semakin canggih dalam berbagai aspek. Kemampuan dialognya telah diperbarui, memungkinkan percakapan dalam berbagai bahasa, termasuk campuran bahasa, dengan pemahaman yang lebih baik terhadap aksen dan kata-kata yang jarang digunakan.
Project Astra kini dapat memanfaatkan tools, seperti Google Search, Lens, dan Maps, menjadikannya asisten serbaguna dalam kehidupan sehari-hari.
Kemampuan memorinya juga telah ditingkatkan hingga 10 menit dalam sesi yang sama, serta lebih banyak mengingat percakapan sebelumnya.
Selain itu, terdapat pula Project Mariner yang bertujuan untuk mempelajari bagaimana interaksi antara manusia dan agen AI akan berkembang, dimulai dengan web browser.
Baca juga: Tips Optimalkan Gemini AI di Android Anda, Makin Produktif
Sebagai prototipe penelitian, Project Mariner dapat memahami dan menganalisis informasi yang ada di layar browser pengguna, termasuk elemen-elemen seperti teks, kode, gambar, dan formulir.
Dengan informasi tersebut, Project Mariner dapat membantu pengguna menyelesaikan tugas-tugas kompleks secara otomatis.
Terakhir adalah Jules, agen AI eksperimen yang dirancang untuk membantu pengembang (developers). Dengan integrasi langsung ke GitHub, Jules dapat mengatasi masalah, membuat rencana, dan melaksanakan tugas sesuai petunjuk pengembang.
Gemini 2.0 Flash akan tersedia melalui Gemini API dan platform pengembangan AI milik Google, yaitu AI Studio dan Vertex AI.
Saat ini, pengguna Gemini di seluruh dunia sudah dapat mencoba versi percakapan dari Gemini 2.0 Flash. Pengguna hanya cukup memilih model ini pada menu model di versi desktop dan mobile web.
Namun, kemampuan menghasilkan audio dan gambar baru akan bisa diakses oleh "early access partners" sebelum diluncurkan secara luas pada Januari mendatang.
Google juga menjanjikan model ini untuk tersedia di aplikasi mobile Gemini dalam waktu dekat.
Baca berita dan artikel yang lain di Google News.
(aia)