Voicebox. Foto: Meta
Teknologi.id - Meta, perusahaan teknologi terkemuka dan induk dari aplikasi seperti Instagram, Facebook, Whatsapp, dan lainnya, telah mengumumkan proyek terbaru mereka yang diberi nama Voicebox, teknologi generasi suara berbasis kecerdasan buatan (AI) yang inovatif. Proyek ini merupakan langkah dalam memajukan penelitian dalam bidang kecerdasan (AI) buatan generatif.
Dikutip dari sumber resmi Meta, Voicebox hadir dengan kemampuan untuk mengubah teks menjadi suara dengan beragam variasi. Pengguna memiliki opsi untuk memilih di antara lima jenis suara yang sesuai dengan kebutuhan mereka. Selain itu, Meta tidak hanya berfokus pada aplikasi text-to-speech semata.
Voicebox dirancang untuk melayani berbagai keperluan, termasuk pengeditan suara, pengambilan sampel, dan penyesuaian gaya audio. Dengan fitur-fitur canggih ini, Voicebox bertujuan untuk membantu para kreator dalam mengedit trek audio dengan lebih mudah dan efisien. Selain itu, teknologi ini juga menargetkan untuk memberikan manfaat bagi orang dengan kebutuhan khusus, terutama tunanetra, dengan memungkinkan mereka mendengarkan pesan tertulis dari teman-teman mereka melalui suara yang dibacakan oleh model kecerdasan buatan yang disediakan oleh Voicebox.
Baca juga: Cara Mengembalikan Foto yang Terhapus di Instagram, Ampuh! - Teknologi
Voicebox, Speech Generation Berbasis Kecerdasan Buatan (AI) dari Meta
Tangkapan layar contoh cara kerja aplikasi Voicebox dari Meta. Foto: Meta
Voicebox, teknologi generasi suara berbasis kecerdasan buatan (AI), memiliki beberapa tujuan yang sangat bermanfaat. Salah satunya adalah memungkinkan pengguna untuk berbicara dalam bahasa asing apapun dengan menggunakan sampel suara mereka sendiri.
Cara kerja dari Voicebox masih didasarkan pada kecerdasan buatan yang tidak perlu dilatih secara khusus, sehingga teknologi generatif ini dapat belajar secara otomatis sesuai dengan konteks. Keunggulan lain dari Voicebox adalah kemampuannya dalam menghasilkan klip audio berkualitas tinggi dan memungkinkan pengeditan audio dari rekaman sebelumnya. Pengguna dapat mempertahankan konten dan gaya audio sesuai kebutuhan dengan bantuan model multibahasa.
Baca juga: Artifact: Aplikasi Sosial Baru untuk Baca Berita Buatan Pendiri Instagram - Teknologi
Melansir dari situs Meta telah disebutkan bahwa Voicebox telah melatih alatnya khusus bahasa Inggris pada 60 ribu jam data dan versi multibahasa pada 50 ribu jam data yang mencakup enam bahasa–Inggris, Prancis, Jerman, Spanyol, Polandia, dan Portugis–, menghilangkan suara sementara, mengedit konten, mentransfer gaya audio di dalam dan di seluruh bahasa, dan menghasilkan sampel ucapan yang beragam. Selain itu, Voicbox menghasilkan ucapan hingga 20x lebih cepat daripada model auto-regresif yang canggih.
Foto: Meta
Fitur menarik lainnya dari Voicebox adalah kemampuannya untuk menyeberangi batas gaya bahasa ini, dengan memberikan sedikit sampel ucapan atau teks dalam bahasa tertentu, Voicebox dapat langsung menghasilkan pembacaan teks dalam salah satu bahasa tersebut. Ini menjadi nilai tambah bagi pengguna yang ingin berkomunikasi dengan bahasa asing tanpa kesulitan.
Voicebox, menggunakan data yang beragam untuk menghasilkan ucapan yang sangat mirip dengan cara bicara orang-orang dalam kehidupan sehari-hari, sehingga memberikan pengalaman yang autentik. Misalnya saat mengetikan sebuah kalimat dalam salah satu bahasa yang dipilih, maka aplikasi ini akan membuat bacaan teks dalam bahasa tersebut dengan mudah.
Dalam penggunaan sampel audio, Voicebox dapat dengan mudah mengolah sampel suara singkat, bahkan hanya dalam dua detik. Pengguna dapat mengatur gaya audio sesuai dengan selera dan kebutuhan mereka.
Baca juga: Temuan Menarik, Peneliti AI Temukan Cara untuk "Jailbreak" Aplikasi ChatGPT dan Bard - Teknologi
Tangkapan layar fitur dari Voicebox yang dapat mengedit pada bagian tertentu saja. Foto: Meta
Voicebox juga menawarkan kemampuan pengeditan ucapan dan pengurangan noise. Teknologi ini dapat membuat ulang bagian-bagian ucapan yang terganggu oleh noise, sehingga menghasilkan suara yang jernih. Selain itu, pengguna dapat mengganti kata yang salah diucapkan hanya pada bagian tertentu tanpa perlu merekam ulang keseluruhan audio, memberikan kenyamanan dan efisiensi dalam proses pengeditan.
Meta menegaskan bahwa suara yang dihasilkan oleh Voicebox terdengar sangat alami dan autentik, yang membantu mendorong komunikasi berbasis AI dengan cara yang alami. Meskipun menggunakan asisten virtual dan teknologi generatif berbasis kecerdasan buatan, suara yang dihasilkan tetap mulus dan tidak terdengar timpang tindih. Teknologi ini memberikan pengalaman berkomunikasi yang lebih menyenangkan dan mendekati pengalaman berbicara dengan orang sungguhan.
Cek Berita dan Artikel yang lain di Google News.
(raa)
Tinggalkan Komentar