Meta Kenalkan Voicebox, Teknologi Speech Generation berbasis Kecerdasan Buatan (AI)

Rizaldi Agustiansyah Ahmad . July 28, 2023

Voicebox. Foto: Meta

Teknologi.id - Meta, perusahaan teknologi terkemuka dan induk dari aplikasi seperti Instagram, Facebook, Whatsapp, dan lainnya, telah mengumumkan proyek terbaru mereka yang diberi nama Voicebox, teknologi generasi suara berbasis kecerdasan buatan (AI) yang inovatif. Proyek ini merupakan langkah dalam memajukan penelitian dalam bidang kecerdasan (AI) buatan generatif.

Dikutip dari sumber resmi Meta, Voicebox hadir dengan kemampuan untuk mengubah teks menjadi suara dengan beragam variasi. Pengguna memiliki opsi untuk memilih di antara lima jenis suara yang sesuai dengan kebutuhan mereka. Selain itu, Meta tidak hanya berfokus pada aplikasi text-to-speech semata.

Voicebox dirancang untuk melayani berbagai keperluan, termasuk pengeditan suara, pengambilan sampel, dan penyesuaian gaya audio. Dengan fitur-fitur canggih ini, Voicebox bertujuan untuk membantu para kreator dalam mengedit trek audio dengan lebih mudah dan efisien. Selain itu, teknologi ini juga menargetkan untuk memberikan manfaat bagi orang dengan kebutuhan khusus, terutama tunanetra, dengan memungkinkan mereka mendengarkan pesan tertulis dari teman-teman mereka melalui suara yang dibacakan oleh model kecerdasan buatan yang disediakan oleh Voicebox.

Voicebox, Speech Generation Berbasis Kecerdasan Buatan (AI) dari Meta

Meta Kenalkan Voicebox, Teknologi Speech Generation berbasis Kecerdasan Buatan (AI) Tangkapan layar contoh cara kerja aplikasi Voicebox dari Meta. Foto: Meta

Voicebox, teknologi generasi suara berbasis kecerdasan buatan (AI), memiliki beberapa tujuan yang sangat bermanfaat. Salah satunya adalah memungkinkan pengguna untuk berbicara dalam bahasa asing apapun dengan menggunakan sampel suara mereka sendiri.

Cara kerja dari Voicebox masih didasarkan pada kecerdasan buatan yang tidak perlu dilatih secara khusus, sehingga teknologi generatif ini dapat belajar secara otomatis sesuai dengan konteks. Keunggulan lain dari Voicebox adalah kemampuannya dalam menghasilkan klip audio berkualitas tinggi dan memungkinkan pengeditan audio dari rekaman sebelumnya. Pengguna dapat mempertahankan konten dan gaya audio sesuai kebutuhan dengan bantuan model multibahasa.

Melansir dari situs Meta telah disebutkan bahwa Voicebox telah melatih alatnya khusus bahasa Inggris pada 60 ribu jam data dan versi multibahasa pada 50 ribu jam data yang mencakup enam bahasa–Inggris, Prancis, Jerman, Spanyol, Polandia, dan Portugis–, menghilangkan suara sementara, mengedit konten, mentransfer gaya audio di dalam dan di seluruh bahasa, dan menghasilkan sampel ucapan yang beragam. Selain itu, Voicbox menghasilkan ucapan hingga 20x lebih cepat daripada model auto-regresif yang canggih.

Meta Kenalkan Voicebox, Teknologi Speech Generation berbasis Kecerdasan Buatan (AI)

Foto: Meta

Fitur menarik lainnya dari Voicebox adalah kemampuannya untuk menyeberangi batas gaya bahasa ini, dengan memberikan sedikit sampel ucapan atau teks dalam bahasa tertentu, Voicebox dapat langsung menghasilkan pembacaan teks dalam salah satu bahasa tersebut. Ini menjadi nilai tambah bagi pengguna yang ingin berkomunikasi dengan bahasa asing tanpa kesulitan.

Voicebox, menggunakan data yang beragam untuk menghasilkan ucapan yang sangat mirip dengan cara bicara orang-orang dalam kehidupan sehari-hari, sehingga memberikan pengalaman yang autentik. Misalnya saat mengetikan sebuah kalimat dalam salah satu bahasa yang dipilih, maka aplikasi ini akan membuat bacaan teks dalam bahasa tersebut dengan mudah.

Dalam penggunaan sampel audio, Voicebox dapat dengan mudah mengolah sampel suara singkat, bahkan hanya dalam dua detik. Pengguna dapat mengatur gaya audio sesuai dengan selera dan kebutuhan mereka.

Meta Kenalkan Voicebox, Teknologi Speech Generation berbasis Kecerdasan Buatan (AI)

Tangkapan layar fitur dari Voicebox yang dapat mengedit pada bagian tertentu saja. Foto: Meta

Voicebox juga menawarkan kemampuan pengeditan ucapan dan pengurangan noise. Teknologi ini dapat membuat ulang bagian-bagian ucapan yang terganggu oleh noise, sehingga menghasilkan suara yang jernih. Selain itu, pengguna dapat mengganti kata yang salah diucapkan hanya pada bagian tertentu tanpa perlu merekam ulang keseluruhan audio, memberikan kenyamanan dan efisiensi dalam proses pengeditan.

Meta menegaskan bahwa suara yang dihasilkan oleh Voicebox terdengar sangat alami dan autentik, yang membantu mendorong komunikasi berbasis AI dengan cara yang alami. Meskipun menggunakan asisten virtual dan teknologi generatif berbasis kecerdasan buatan, suara yang dihasilkan tetap mulus dan tidak terdengar timpang tindih. Teknologi ini memberikan pengalaman berkomunikasi yang lebih menyenangkan dan mendekati pengalaman berbicara dengan orang sungguhan.

Cek Berita dan Artikel yang lain di Google News.

(raa)

Rizaldi Agustiansyah Ahmad

Tinggalkan Komentar

0 Komentar

Berita Menarik Lainnya

Media dan Platform berita teknologi Indonesia dan dunia terbaru hari ini. Tips dan berita seputar gadget, internet, entertainment, bisnis, fintech, teknologi dan informasi.

Indonesia

Version

Meta Kenalkan Voicebox, Teknologi Speech Generation berbasis Kecerdasan Buatan (AI)

Rizaldi Agustiansyah Ahmad

Tinggalkan Komentar

0 Komentar

Berita Menarik Lainnya

Upskilling 100.000 Talenta Digital: Sertifikasi AI & Japan Tech Diakui Negara

AI & Data Sagara: Naik Level Tanpa Kompleksitas Berlebihan

WhatsApp Plus Resmi Hadir! Ini Fitur Baru yang Ditawarkan

Solusi Outsourcing AI UMKM Indonesia: Fitur Pintar Biaya Terjangkau Sagara Technology

Outsourcing AI Tim Internal, Perbandingan Biaya & Kecepatan di Indonesia 2026

Implementasi AI Sesuai Regulasi PDN & BSSN di Indonesia 2026