Google Rilis Gemini 3.1 Flash TTS, Bisa Atur Emosi dan Gaya Bicara AI Sesukamu

Yasmin Najla Alfarisi . April 17, 2026

Foto: Google Blog

Teknologi.id - Raksasa teknologi Google kembali memperkuat dominasinya di kancah kecerdasan buatan dengan merilis model text-to-speech (TTS) terbaru, Gemini 3.1 Flash TTS, pada Rabu (15/4/2026). Model ini dirancang untuk menghadirkan sintesis suara yang jauh lebih natural, ekspresif, dan memiliki kontrol presisi yang belum pernah ada sebelumnya.

Sebagai bagian dari keluarga besar Gemini 3.1, model ini tidak hanya mengunggulkan kualitas audio yang menyerupai manusia, tetapi juga dukungan luas terhadap lebih dari 70 bahasa, termasuk Bahasa Indonesia. Dengan kemampuan menangani percakapan multi-pembicara (multi-speaker), Gemini 3.1 Flash TTS diprediksi akan menjadi standar baru dalam interface suara berbasis AI.

Baca juga: Google Hadirkan Fitur “Skills” di Gemini Chrome, Simpan Prompt Sekali Klik

Kendali Kreatif Lewat Fitur Audio Tags

Salah satu inovasi paling menonjol dalam pembaruan ini adalah kehadiran Audio Tags. Fitur ini memberikan fleksibilitas tinggi bagi pengguna untuk mengatur gaya bicara AI melalui instruksi teks sederhana. Pengguna kini dapat menentukan emosi spesifik seperti "antusias", "senang", hingga nada yang lebih "serius dan informatif".

Foto: Google Blog

Selain emosi, Audio Tags memungkinkan pengaturan kecepatan bicara dan aksen secara mendetail. Google menyediakan beragam pilihan gaya, mulai dari narasi santai untuk podcast dan audiobook hingga gaya formal layaknya pembawa berita. Berdasarkan pengujian dari Artificial Analysis, model ini mencatat skor Elo sebesar 1.211, yang menempatkannya sebagai salah satu solusi paling atraktif berkat rasio kualitas dan biaya yang sangat kompetitif.

Ekspansi ke Dunia Fisik: Gemini Robotics-ER 1.6

Bersamaan dengan peluncuran model suara, Google juga memperkenalkan Gemini Robotics-ER 1.6. Model AI ini dikembangkan khusus untuk memungkinkan robot melakukan tugas-tugas kompleks di dunia nyata melalui pemikiran "terwujud" (embodied thinking) dan fungsi kognitif yang ditingkatkan.

Spesialisasi model ini terletak pada persepsi spasial, perencanaan tindakan, hingga evaluasi keberhasilan tugas secara mandiri. Google DeepMind bekerja sama dengan Boston Dynamics untuk mengintegrasikan model ini ke dalam robot industri. Hasilnya, robot kini mampu menginterpretasikan data dari instrumen pengukuran kompleks dan merespons tantangan fisik secara otonom. Dalam uji deteksi ancaman keamanan, model ini mengungguli pendahulunya dengan peningkatan akurasi hingga 10% dalam analisis video.

Baca juga: Tap to Share dari Google: Berbagi Data di Android Kini Cuma Tinggal Tap

Ekosistem Baru di macOS dan Inovasi Video

Google juga memperluas jangkauan layanan asisten pintarnya dengan merilis aplikasi Gemini asli untuk sistem operasi macOS. Pengguna kini dapat mengakses Gemini secara instan melalui pintasan tombol Option + Space. Aplikasi ini dilengkapi dengan fitur berbagi jendela untuk transfer konteks yang cepat, serta dukungan pembuatan gambar via Nano Banana dan pembuatan video melalui Veo.

Terkait transparansi dan keamanan konten, Google menyertakan teknologi SynthID. Setiap audio yang dihasilkan oleh Gemini 3.1 Flash TTS akan dibekali watermark digital yang tidak terdengar oleh telinga manusia, namun tetap bisa dikenali oleh sistem komputer. Langkah ini diambil untuk memastikan bahwa publik dapat membedakan antara suara asli manusia dan konten hasil rekayasa AI.

Baca juga: Google Naikkan Harga YouTube Premium, Ini Rincian Harga Barunya

Aksesibilitas dan Detail Harga

Google menawarkan skema penggunaan yang beragam. Versi gratis tersedia melalui Google AI Studio, meskipun data penggunaan akan digunakan untuk pengembangan produk. Untuk segmen profesional dan perusahaan, tarif yang dikenakan adalah 1 dollar AS per juta token input teks dan 20 dollar AS per juta token output audio. Tersedia juga mode batch dengan harga 50% lebih murah bagi pengguna dengan volume besar.

Saat ini, Gemini 3.1 Flash TTS sudah dapat diakses melalui API Gemini, Vertex AI bagi pengguna korporat, serta Google Vids untuk pelanggan Workspace. Dengan peluncuran ini, Google semakin mempertegas posisinya dalam mengintegrasikan AI ke berbagai lini, mulai dari suara digital hingga perangkat fisik di sektor industri.

Baca Berita dan Artikel lainnya di Google News.

(yna/sa)

Share :

Yasmin Najla Alfarisi

Tinggalkan Komentar

Berita Menarik Lainnya

Gadget

Google Rilis Gemini 3.1 Flash TTS, Bisa Atur Emosi dan Gaya Bicara AI Sesukamu

Baca juga: Google Hadirkan Fitur “Skills” di Gemini Chrome, Simpan Prompt Sekali Klik

Kendali Kreatif Lewat Fitur Audio Tags

Ekspansi ke Dunia Fisik: Gemini Robotics-ER 1.6

Baca juga: Tap to Share dari Google: Berbagi Data di Android Kini Cuma Tinggal Tap

Ekosistem Baru di macOS dan Inovasi Video

Baca juga: Google Naikkan Harga YouTube Premium, Ini Rincian Harga Barunya

Aksesibilitas dan Detail Harga

Yasmin Najla Alfarisi

Berita Menarik Lainnya

Bocoran iPhone Ultra Terungkap, HP Lipat Pertama Apple Dibanderol Rp 50 Juta

Cloudflare Temukan AI yang Bisa Meretas Sistem Lewat Gabungan Bug Kecil

Viral di China! AI Profesor Ini Dipakai Anak Muda untuk Hadapi Tekanan Orangtua

WhatsApp Kembangkan 'Burn After Reading': Pesan Terhapus Setelah Dibaca Penerima

Google Kenalkan Gemini Spark, AI yang Siap Jadi Asisten Pribadi 24 Jam

Google Kenalkan Gemini Omni, Edit Video AI Kini Tinggal Ketik Prompt