
Foto: Google Blog
Teknologi.id - Raksasa teknologi Google kembali memperkuat dominasinya di kancah kecerdasan buatan dengan merilis model text-to-speech (TTS) terbaru, Gemini 3.1 Flash TTS, pada Rabu (15/4/2026). Model ini dirancang untuk menghadirkan sintesis suara yang jauh lebih natural, ekspresif, dan memiliki kontrol presisi yang belum pernah ada sebelumnya.
Sebagai bagian dari keluarga besar Gemini 3.1, model ini tidak hanya mengunggulkan kualitas audio yang menyerupai manusia, tetapi juga dukungan luas terhadap lebih dari 70 bahasa, termasuk Bahasa Indonesia. Dengan kemampuan menangani percakapan multi-pembicara (multi-speaker), Gemini 3.1 Flash TTS diprediksi akan menjadi standar baru dalam interface suara berbasis AI.
Baca juga: Google Hadirkan Fitur “Skills” di Gemini Chrome, Simpan Prompt Sekali Klik
Kendali Kreatif Lewat Fitur Audio Tags
Salah satu inovasi paling menonjol dalam pembaruan ini adalah kehadiran Audio Tags. Fitur ini memberikan fleksibilitas tinggi bagi pengguna untuk mengatur gaya bicara AI melalui instruksi teks sederhana. Pengguna kini dapat menentukan emosi spesifik seperti "antusias", "senang", hingga nada yang lebih "serius dan informatif".

Selain emosi, Audio Tags memungkinkan pengaturan kecepatan bicara dan aksen secara mendetail. Google menyediakan beragam pilihan gaya, mulai dari narasi santai untuk podcast dan audiobook hingga gaya formal layaknya pembawa berita. Berdasarkan pengujian dari Artificial Analysis, model ini mencatat skor Elo sebesar 1.211, yang menempatkannya sebagai salah satu solusi paling atraktif berkat rasio kualitas dan biaya yang sangat kompetitif.
Ekspansi ke Dunia Fisik: Gemini Robotics-ER 1.6
Bersamaan dengan peluncuran model suara, Google juga memperkenalkan Gemini Robotics-ER 1.6. Model AI ini dikembangkan khusus untuk memungkinkan robot melakukan tugas-tugas kompleks di dunia nyata melalui pemikiran "terwujud" (embodied thinking) dan fungsi kognitif yang ditingkatkan.
Spesialisasi model ini terletak pada persepsi spasial, perencanaan tindakan, hingga evaluasi keberhasilan tugas secara mandiri. Google DeepMind bekerja sama dengan Boston Dynamics untuk mengintegrasikan model ini ke dalam robot industri. Hasilnya, robot kini mampu menginterpretasikan data dari instrumen pengukuran kompleks dan merespons tantangan fisik secara otonom. Dalam uji deteksi ancaman keamanan, model ini mengungguli pendahulunya dengan peningkatan akurasi hingga 10% dalam analisis video.
Baca juga: Tap to Share dari Google: Berbagi Data di Android Kini Cuma Tinggal Tap
Ekosistem Baru di macOS dan Inovasi Video
Google juga memperluas jangkauan layanan asisten pintarnya dengan merilis aplikasi Gemini asli untuk sistem operasi macOS. Pengguna kini dapat mengakses Gemini secara instan melalui pintasan tombol Option + Space. Aplikasi ini dilengkapi dengan fitur berbagi jendela untuk transfer konteks yang cepat, serta dukungan pembuatan gambar via Nano Banana dan pembuatan video melalui Veo.
Terkait transparansi dan keamanan konten, Google menyertakan teknologi SynthID. Setiap audio yang dihasilkan oleh Gemini 3.1 Flash TTS akan dibekali watermark digital yang tidak terdengar oleh telinga manusia, namun tetap bisa dikenali oleh sistem komputer. Langkah ini diambil untuk memastikan bahwa publik dapat membedakan antara suara asli manusia dan konten hasil rekayasa AI.
Baca juga: Google Naikkan Harga YouTube Premium, Ini Rincian Harga Barunya
Aksesibilitas dan Detail Harga
Google menawarkan skema penggunaan yang beragam. Versi gratis tersedia melalui Google AI Studio, meskipun data penggunaan akan digunakan untuk pengembangan produk. Untuk segmen profesional dan perusahaan, tarif yang dikenakan adalah 1 dollar AS per juta token input teks dan 20 dollar AS per juta token output audio. Tersedia juga mode batch dengan harga 50% lebih murah bagi pengguna dengan volume besar.
Saat ini, Gemini 3.1 Flash TTS sudah dapat diakses melalui API Gemini, Vertex AI bagi pengguna korporat, serta Google Vids untuk pelanggan Workspace. Dengan peluncuran ini, Google semakin mempertegas posisinya dalam mengintegrasikan AI ke berbagai lini, mulai dari suara digital hingga perangkat fisik di sektor industri.
Baca Berita dan Artikel lainnya di Google News.
(yna/sa)