Microsoft Perkenalkan MAI-Voice-1: AI Suara Pertama dengan Suara Natural

Farrah Nur Fadhilah . August 29, 2025
Microsoft MAI-Voice-1
Foto: Cong luan


Teknologi.id – Microsoft kembali membuat gebrakan besar di dunia kecerdasan buatan dengan meluncurkan MAI-Voice-1, model AI suara pertama mereka, bersamaan dengan MAI-1-preview, model generatif berbasis Mixture of Experts (MoE). Kehadiran dua teknologi ini menandai langkah penting divisi Microsoft AI (MAI) dalam membangun ekosistem kecerdasan buatan yang lebih luas, khususnya pada ranah interaksi suara dan bahasa.

Jika biasanya Microsoft identik dengan Windows, Office, atau Copilot, kini perusahaan tersebut mulai serius menempatkan AI sebagai pilar utama inovasi masa depan.

Baca juga: Samsung TV & Monitor 2025 Kini Dibekali AI Copilot, Bukan Cuma di Galaxy

MAI-Voice-1: Suara AI Lebih Hidup dan Natural

MAI-Voice-1 diperkenalkan sebagai model speech generation pertama dari Microsoft. Teknologi ini mampu menghasilkan suara manusia yang sangat natural, ekspresif, dan jauh dari kesan monoton seperti kebanyakan AI voice sebelumnya.

Keunggulan utama MAI-Voice-1:

  • Super cepat: mampu menghasilkan audio 1 menit dalam waktu <1 detik hanya dengan 1 GPU.

  • Ekspresif: bisa menirukan gaya bercerita, termasuk suara binatang dalam dongeng.

  • Variatif: mampu menciptakan percakapan dengan nada, logat, dan karakter berbeda layaknya diskusi sungguhan.

👉 Potensi pemanfaatannya luas: narasi podcast, audiobook, layanan pelanggan berbasis suara, hingga asisten digital dengan kualitas suara yang lebih manusiawi.

Sudah Terintegrasi ke Copilot

Microsoft langsung menguji coba teknologinya. MAI-Voice-1 kini sudah dipakai di Copilot Daily, Podcasts, dan Copilot Labs.

Contoh pemakaian: ketika menulis catatan, pengguna bisa meminta Copilot membacakannya dengan suara natural sesuai gaya dan nada yang diinginkan.

MAI-1-preview: Fondasi Generatif AI Masa Depan

Selain teknologi suara, Microsoft juga memperkenalkan MAI-1-preview, foundation model generatif berbasis Mixture of Experts (MoE).

🔑 Fitur utama MAI-1-preview:

  • Dijalankan dengan 15.000 GPU Nvidia H100, menjadikannya salah satu model AI terbesar saat ini.

  • Dirancang untuk berbagai kebutuhan: menjawab pertanyaan, memberi instruksi sehari-hari, percakapan natural, hingga mendukung pengembangan aplikasi berbasis AI.

  • Sudah diuji di LMArena dan tersedia terbatas untuk pengembang lewat API.

  • Dalam waktu dekat akan diintegrasikan ke Copilot untuk mendukung skenario berbasis teks.

Infrastruktur AI Microsoft

Keseriusan Microsoft di bidang AI diperkuat dengan investasi masif pada infrastruktur. Mereka mengandalkan chip Nvidia Grace Blackwell (GB200) untuk pelatihan model, inferensi berskala besar, serta mendukung kebutuhan High Performance Computing (HPC).

Hal ini memungkinkan Microsoft menghadirkan AI yang efisien, cepat, aman, dan scalable.

Dampak Bagi Pengguna dan Industri

Kehadiran MAI-Voice-1 dan MAI-1-preview membawa dampak signifikan bagi berbagai sektor:

  • 🎙️ Industri Kreatif: konten kreator bisa membuat narasi, dubbing, atau podcast tanpa studio rekaman.

  • 📚 Pendidikan: guru/dosen dapat menyajikan materi audio interaktif.

  • ☎️ Layanan Publik: call center lebih efisien dengan suara AI yang natural.

  • 🧘 Kesehatan Mental: aplikasi meditasi dan terapi digital bisa menggunakan suara AI yang menenangkan.

Meski begitu, Microsoft tetap menekankan pentingnya AI yang etis, aman, dan bertanggung jawab, termasuk pencegahan penyalahgunaan seperti deepfake suara.

Baca juga: Microsoft Excel Punya Copilot AI, Bikin Analisis Data 10x Lebih Cepat!

Menuju Ekosistem AI yang Lebih Luas

Visi Microsoft dengan MAI adalah membangun ekosistem AI terintegrasi yang mencakup teks, suara, hingga aplikasi berbasis AI. Kolaborasi dengan komunitas AI dan open-source juga menjadi fokus agar pengembangan tetap terbuka dan inklusif.

Dengan MAI-Voice-1 yang menghadirkan suara ekspresif dan MAI-1-preview sebagai fondasi AI generatif, Microsoft menegaskan bahwa kecerdasan buatan bukan sekadar tren, melainkan fondasi penting transformasi digital masa depan.

Masa depan interaksi digital kini akan terasa semakin manusiawi—bukan lagi sekadar suara robotik, tetapi komunikasi AI yang lebih personal, relevan, dan hidup.

Baca Berita dan Artikel yang lain di Google News.

(fnf)

Share :