Daftar beritaxAI Musk meluncurkan fitur "kloning suara secepat kilat": cukup bicara alami selama 1 menit untuk membuat pengisi suara Grok pribadi Anda sendiri
動區 BlockTempo2026-05-02 05:09:27

xAI Musk meluncurkan fitur "kloning suara secepat kilat": cukup bicara alami selama 1 menit untuk membuat pengisi suara Grok pribadi Anda sendiri

ORIGINAL馬斯克 xAI 推出「極速聲音克隆」功能:自然說話 1 分鐘即可打造個人專屬 Grok 聲優
Analisis Dampak AIGrok sedang menganalisis...
📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯1453 kata
xAI milik Elon Musk kembali berevolusi! Secara resmi pada 30 April, mereka meluncurkan fitur "Custom Voices" dan "Voice Library". Pengguna hanya perlu berbicara ke mikrofon kurang dari 1 menit, dan sistem dapat dengan cepat mengkloning suara eksklusif yang sangat realistis dalam waktu 2 menit, lalu langsung menerapkannya pada asisten AI Grok. Untuk mencegah penipuan Deepfake, xAI melarang keras pengunggahan file rekaman yang sudah ada, serta mewajibkan "rekaman langsung oleh pengguna" dan verifikasi suara ganda. (Konteks sebelumnya: Grok diam-diam meluncurkan Imagine Agent Mode: kanvas tak terbatas menggantikan kotak obrolan, menghasilkan rangkaian gambar dan video hanya dengan satu kalimat) (Latar belakang: Elon Musk diam-diam menutup pusat layanan pelanggan Starlink: Grok Voice mengambil alih telepon, 20% panggilan langsung berhasil) Di jalur suara AI generatif, xAI yang dipimpin oleh Elon Musk secara resmi melancarkan serangan kuat terhadap pesaing seperti OpenAI. xAI merilis pengumuman resmi pada 30 April 2026, mengumumkan pembaruan besar pada platform AI mereka — peluncuran penuh fitur "Custom Voices" dan "Voice Library" yang baru, memungkinkan individu dan perusahaan untuk mengintegrasikan "suara mereka sendiri" ke dalam berbagai skenario aplikasi AI dengan ambang batas yang sangat rendah. Menurut penjelasan xAI, membuat model suara AI pribadi kini menjadi sangat mudah. Pengguna hanya perlu merekam suara bicara alami selama "beberapa detik hingga satu menit" di xAI console, dan seluruh proses pembuatan model dapat diselesaikan dalam waktu kurang dari 2 menit. Setelah selesai dibuat, suara eksklusif ini dapat langsung digunakan dalam layanan Text-to-Speech (TTS) Grok dan Voice Agent API. xAI secara resmi menyoroti lima skenario aplikasi inti dari teknologi ini: - Agen Layanan Pelanggan Merek: Perusahaan dapat membuat layanan pelanggan AI menggunakan suara yang konsisten dan eksklusif bagi merek untuk meningkatkan citra perusahaan. - Kreator Konten dan Podcast: Kreator dapat menggunakan suara mereka sendiri untuk menarasikan video atau membuat buku audio dalam skala besar tanpa harus masuk ke studio rekaman setiap saat. - Pidato Lintas Bahasa: Memungkinkan CEO perusahaan multinasional untuk menyampaikan pidato penting menggunakan "suara mereka sendiri" dengan peralihan bahasa yang mulus (seperti Mandarin, Inggris, Jepang, Prancis, dll.). - Game dan Hiburan: Pengisian suara cepat untuk karakter NPC di metaverse atau game. - Bantuan Aksesibilitas: Melestarikan karakteristik suara asli secara permanen bagi pasien penyakit langka seperti ALS yang akan kehilangan kemampuan berbicara. Seiring dengan populernya teknologi kloning suara, pemalsuan suara selebriti dan penipuan telekomunikasi menggunakan Deepfake semakin marak. Untuk mencegah penyalahgunaan teknologi ini, xAI menerapkan perlindungan yang sangat ketat pada mekanisme keamanannya. xAI menekankan bahwa sistem "sama sekali tidak dapat menggunakan file rekaman yang sudah ada untuk kloning suara". Pengguna harus melakukan rekaman langsung secara pribadi, dan sistem akan meminta pengguna untuk membacakan "Passphrase" yang dihasilkan secara acak. Selanjutnya, AI akan mengonfirmasi konten melalui speech-to-text dan membandingkan vektor embedding suara (Speaker Similarity) untuk memastikan bahwa orang yang merekam passphrase adalah orang yang sama dengan rekaman asli. Mekanisme verifikasi ganda ini secara mendasar memutus kemungkinan peretas "mencuri suara" menggunakan file audio orang lain. Selain fitur kustomisasi yang kuat, xAI juga meluncurkan "Voice Library" secara bersamaan, yang memungkinkan tim pengembang untuk mengelola semua suara kustom dan suara bawaan secara terpadu. Saat ini, Voice Library telah menyertakan lebih dari 80 suara berkualitas tinggi dan mendukung hingga 28 bahasa untuk pratinjau bebas bagi pengguna. Hal yang paling menggembirakan bagi pengembang dan perusahaan adalah xAI mengumumkan bahwa penggunaan fitur Custom Voices "sama sekali tidak dikenakan biaya tambahan", dan sepenuhnya mendukung semua fitur canggih dari sistem TTS asli (seperti tag suara, streaming real-time, dll.). Pengguna hanya perlu menentukan voice_id eksklusif di API untuk dapat memanggilnya dengan mudah, yang tidak diragukan lagi akan sangat menurunkan ambang batas biaya bagi perusahaan untuk mengadopsi AI suara eksklusif.
Status data✓ Teks lengkap telah diambilBaca artikel asli (動區 BlockTempo)
🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset5 berita
💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang
Informasi mentah
ID:5ba9ba11fc
Sumber:動區 BlockTempo
Diterbitkan:2026-05-02 05:09:27
Kategori:zh_news · Kategori ekspor zh
Aset:Tidak ditentukan
Voting komunitas:+0 /0 · ⭐ 0 Penting · 💬 0 Komentar
xAI Musk meluncurkan fitur "kloning suara secepat kilat": cukup bicara alami selama 1 menit untuk membuat pengisi suara Grok pribadi Anda sendiri | Feel.Trading