要闻列表Musk 的 xAI 推出「極速聲音克隆」功能:自然說話 1 分鐘即可打造個人專屬 Grok 聲優
動區 BlockTempo2026-05-02 05:09:27

Musk 的 xAI 推出「極速聲音克隆」功能:自然說話 1 分鐘即可打造個人專屬 Grok 聲優

ORIGINAL馬斯克 xAI 推出「極速聲音克隆」功能:自然說話 1 分鐘即可打造個人專屬 Grok 聲優
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取1453 字
馬斯克的 xAI 再度進化!官方於 4 月 30 日重磅發布「自訂語音(Custom Voices)」與「語音庫(Voice Library)」功能。用戶只需對麥克風說話不到 1 分鐘,系統就能在 2 分鐘內極速複製出高度擬真的專屬語音,並直接應用於 Grok 的 AI 助理中。為了徹底杜絕 Deepfake 詐騙,xAI 嚴格禁止上傳現成錄音檔,強制要求「本人即時錄音」與雙重聲紋驗證。 (前情提要:Grok 悄悄上線 Imagine Agent Mode:無限畫布取代聊天框,一句話生出整套圖片影片) (背景補充:馬斯克悄悄幹掉 Starlink 客服中心:Grok Voice 接管電話、20% 來電直接成交) 生成式 AI 的語音賽道上,馬斯克(Elon Musk)領軍的 xAI 正式向 OpenAI 等競爭對手發起強烈攻勢。 xAI 於 2026 年 4 月 30 日發布官方公告,宣布旗下 AI 平台迎來重大更新 —— 全面推出「自訂語音(Custom Voices)」與全新的「語音庫(Voice Library)」功能,讓個人與企業能夠以極低的門檻,將「自己的聲音」無縫融入各種 AI 應用場景中。 根據 xAI 的說明,建立個人專屬的 AI 語音模型現在變得前所未有地簡單。用戶只需在 xAI console(控制台)中,錄製一段長度僅需「幾秒到一分鐘」的自然說話語音,整個模型建立過程不到 2 分鐘即可完成。 一旦生成完畢,這套專屬語音就能立即在 Grok 的文字轉語音(Text-to-Speech, TTS)服務以及 Voice Agent API 中調用。xAI 官方點出了該技術的五大核心應用場景: - 品牌客服代理:企業可讓 AI 客服使用品牌專屬、具一致性的聲音,提升企業形象。 - 內容創作者與 Podcast:創作者能用自己的聲音大規模旁白影片或生成有聲書,無需每次親自進錄音室錄製。 - 跨語言演講:讓跨國企業 CEO 能夠用「自己的聲音」,無縫切換多種語言(如中、英、日、法文等)發表關鍵演講。 - 遊戲與娛樂:為元宇宙或遊戲中的 NPC 角色快速配音。 - 無障礙輔助:為即將失去說話能力的漸凍症等罕病患者,永久保留他們原本的聲音特徵。 隨著語音複製技術的普及,利用 Deepfake(深偽技術)進行的名人聲音造假與電信詐騙層出不窮。為了防止該技術被惡意濫用,xAI 在安全機制上祭出了極為嚴格的防護網。 xAI 強調,系統「絕對無法使用現有的錄音檔進行聲音複製」。用戶必須親自進行即時錄音,且系統會要求用戶朗讀一段隨機生成的「驗證短語(Passphrase)」。接著,AI 會透過語音轉文字確認內容無誤,並比對語音嵌入向量(Speaker Similarity),確保錄製驗證短語的人與原始錄音是同一人。這套雙重驗證機制,從根本上阻斷了駭客拿別人的音檔來「偷聲音」的可能。 除了強大的自訂功能,xAI 此次也同步推出了「語音庫(Voice Library)」,讓開發團隊能統一管理所有的自訂語音與內建語音。目前語音庫已內建超過 80 種高品質語音、支援高達 28 種語言供用戶自由預覽。 最令開發者與企業振奮的是,xAI 宣布使用自訂語音功能將「完全不收取額外費用」,並且完全支援原本 TTS 系統的所有進階功能(如語音標籤、即時串流等)。用戶只需在 API 中指定專屬的 voice_id 即可輕鬆調用,這無疑將大幅降低企業導入專屬語音 AI 的成本門檻。
数据状态✓ 已抓取全文阅读原文(動區 BlockTempo)
🔍历史类似事件· 关键词 + 标的比对5 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:5ba9ba11fc
来源:動區 BlockTempo
发布:2026-05-02 05:09:27
分类:zh_news · 导出分类 zh
标的:未指定
社群投票:+0 /0 · ⭐ 0 重要 · 💬 0 留言
Musk 的 xAI 推出「極速聲音克隆」功能:自然說話 1 分鐘即可打造個人專屬 Grok 聲優 | Feel.Trading