VALL-E : AI Text-to-speech yang Bisa Menirukan Suara Orang

Cahyaning Tyas Agpri . January 13, 2023

VALL-E . Foto: Tech Crunch

Teknologi. id - Setelah maraknya kemunculan berbagai alat artificial intelligence (AI) yang bisa menghasilkan atau memproduksi gambar, karya seni, video, hingga tulisan, dunia teknologi semakin maju dengan tetap meneruskan inovasi yang ada.

Salah satu program AI yang sedang marak dibicarakan adalah ChatGPT. Merupakan program yang bisa membantu menghasilkan berbagai jawaban dan menyelesaikan pekerjaan sehari-hari, ChatGPT membuat banyak orang terpukau dan ketakutan secara bersamaan.

Namun, pada tahun 2023 ini, AI semakin maju lagi dengan hadirnya VALL-E setelah kita mempunyai ChatGPT dan DALL-E. Merupakan program yang dikembangkan oleh Microsoft, VALL-E merupakan alat yang bisa mereplika suara individu dan mengubah tulisan menjadi sebuah 'speech' realistis menggunakan intonasi dan emosi yang sesuai dengan konteks dari tulisan yang tesedia.

Baca juga: Pengguna Indonesia Kini Bisa Meeting Zoom dengan Fitur Baru Avatar 3D

Menurut euronews.next, Microsoft mengembangkan VALL-E dengan lebih dari 7.000 pembicara pada data rekamannya, dan rekamanan 'speech' dalam bahasa inggris setara 60.000 jam. Penggunaan data yang jauh lebih banyak jika dibandingkan sistem text-to-speech lainnya membuat VALL-E lebih bisa mengatasi kemungkinan masalah zero-shot.

Foto: Publikasi Paper oleh Cornell University

Walaupun belum tersedia untuk publik, tim yang mengembangkan VALL-E menyediakan rekaman suara untuk menunjukkan dan mendemonstrasikan cara kerja dari text-to-specch dengan mereplika suara individu tertentu. Yang kemudian bisa dibandingkan dengan hasil text-to-speech dari sistem selain VALL-E.

Baca juga: Google Meet Hadirkan Fitur Emoji Reaction, Bagusan Mana Daripada Zoom?

Microsoft menginvestasikan $1 miliar untuk mengembangkan VALL-E. Hal ini karena belakangan ini Microsoft sedang gencar-gencarnya mengembangkan teknologi AI seperti ChatGPT dan DALL-E. Selain itu, VALL-E juga memiliki potensi yang besar untuk menjadi solusi bagi individu yang memiliki kesulitan bicara.

Dari majunya teknologi, akan selalu ada peluang terjadinya penipuan dan peniruan identitas. Mulai dari penipuan lewat panggilan hingga potensi phising. Hal ini tentunya akan menjadi hambatan, dan kita harus siap dan awas terhadap segala kemungkinan yang ada. 

(cta)

Share :