Danh sách tinxAI của Musk ra mắt tính năng "giọng nói siêu tốc": Chỉ cần 1 phút nói chuyện tự nhiên để tạo giọng nói Grok cá nhân hóa
動區 BlockTempo2026-05-02 05:09:27

xAI của Musk ra mắt tính năng "giọng nói siêu tốc": Chỉ cần 1 phút nói chuyện tự nhiên để tạo giọng nói Grok cá nhân hóa

ORIGINAL馬斯克 xAI 推出「極速聲音克隆」功能:自然說話 1 分鐘即可打造個人專屬 Grok 聲優
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1453 từ
xAI của Elon Musk lại tiếp tục tiến hóa! Vào ngày 30 tháng 4, công ty đã chính thức công bố các tính năng "Custom Voices" và "Voice Library". Người dùng chỉ cần nói vào micro chưa đầy 1 phút, hệ thống có thể sao chép giọng nói độc quyền với độ chân thực cao trong vòng 2 phút và áp dụng trực tiếp vào trợ lý AI Grok. Để ngăn chặn triệt để các vụ lừa đảo Deepfake, xAI nghiêm cấm việc tải lên các tệp ghi âm có sẵn, đồng thời bắt buộc "ghi âm trực tiếp bởi chính chủ" và xác thực giọng nói kép. (Thông tin trước đó: Grok âm thầm ra mắt Imagine Agent Mode: Canvas vô hạn thay thế khung chat, tạo ra cả bộ ảnh và video chỉ bằng một câu lệnh) (Bối cảnh bổ sung: Elon Musk âm thầm loại bỏ trung tâm dịch vụ khách hàng Starlink: Grok Voice tiếp quản các cuộc gọi, 20% cuộc gọi được chốt đơn trực tiếp) Trên đường đua giọng nói của AI tạo sinh, xAI do Elon Musk dẫn dắt đang chính thức phát động cuộc tấn công mạnh mẽ vào các đối thủ cạnh tranh như OpenAI. Vào ngày 30 tháng 4 năm 2026, xAI đã đưa ra thông báo chính thức, tuyên bố nền tảng AI của họ đón nhận bản cập nhật lớn —— ra mắt toàn diện các tính năng "Custom Voices" và "Voice Library" hoàn toàn mới, cho phép cá nhân và doanh nghiệp tích hợp "giọng nói của chính mình" vào các kịch bản ứng dụng AI khác nhau với ngưỡng rào cản cực thấp. Theo giải thích của xAI, việc tạo ra mô hình giọng nói AI độc quyền hiện nay đã trở nên đơn giản chưa từng có. Người dùng chỉ cần ghi âm một đoạn giọng nói tự nhiên dài "vài giây đến một phút" trong xAI console, toàn bộ quá trình tạo mô hình có thể hoàn tất trong chưa đầy 2 phút. Sau khi tạo xong, bộ giọng nói độc quyền này có thể được gọi ngay lập tức trong dịch vụ chuyển văn bản thành giọng nói (Text-to-Speech, TTS) của Grok và Voice Agent API. xAI đã chỉ ra năm kịch bản ứng dụng cốt lõi của công nghệ này: - Đại lý dịch vụ khách hàng thương hiệu: Doanh nghiệp có thể để AI chăm sóc khách hàng sử dụng giọng nói độc quyền, nhất quán của thương hiệu để nâng cao hình ảnh doanh nghiệp. - Người sáng tạo nội dung và Podcast: Người sáng tạo có thể sử dụng giọng nói của chính mình để thuyết minh video quy mô lớn hoặc tạo sách nói mà không cần phải tự mình vào phòng thu mỗi lần. - Diễn thuyết đa ngôn ngữ: Cho phép CEO của các tập đoàn đa quốc gia sử dụng "giọng nói của chính mình" để phát biểu các bài diễn văn quan trọng bằng nhiều ngôn ngữ (như tiếng Trung, Anh, Nhật, Pháp, v.v.) một cách liền mạch. - Trò chơi và giải trí: Lồng tiếng nhanh cho các nhân vật NPC trong Metaverse hoặc trò chơi. - Hỗ trợ người khuyết tật: Lưu giữ vĩnh viễn đặc điểm giọng nói gốc cho những bệnh nhân mắc các bệnh hiếm gặp như xơ cứng cột bên teo cơ (ALS) sắp mất khả năng nói. Với sự phổ biến của công nghệ sao chép giọng nói, việc giả mạo giọng nói của người nổi tiếng và lừa đảo viễn thông bằng Deepfake đang xuất hiện ngày càng nhiều. Để ngăn chặn công nghệ này bị lạm dụng với mục đích xấu, xAI đã thiết lập một mạng lưới bảo vệ cực kỳ nghiêm ngặt về cơ chế an toàn. xAI nhấn mạnh rằng hệ thống "tuyệt đối không thể sử dụng các tệp ghi âm hiện có để sao chép giọng nói". Người dùng phải tự mình thực hiện ghi âm trực tiếp và hệ thống sẽ yêu cầu người dùng đọc một "Passphrase" được tạo ngẫu nhiên. Sau đó, AI sẽ xác nhận nội dung thông qua chuyển đổi giọng nói thành văn bản và so sánh vectơ nhúng giọng nói (Speaker Similarity) để đảm bảo người đọc Passphrase và bản ghi âm gốc là cùng một người. Cơ chế xác thực kép này ngăn chặn từ gốc khả năng hacker lấy tệp âm thanh của người khác để "đánh cắp giọng nói". Ngoài các tính năng tùy chỉnh mạnh mẽ, xAI lần này cũng đồng thời ra mắt "Voice Library", cho phép đội ngũ phát triển quản lý thống nhất tất cả các giọng nói tùy chỉnh và giọng nói tích hợp sẵn. Hiện tại, Voice Library đã tích hợp sẵn hơn 80 giọng nói chất lượng cao, hỗ trợ lên đến 28 ngôn ngữ để người dùng tự do xem trước. Điều khiến các nhà
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản5 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:5ba9ba11fc
Nguồn:動區 BlockTempo
Đăng:2026-05-02 05:09:27
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận
xAI của Musk ra mắt tính năng "giọng nói siêu tốc": Chỉ cần 1 phút nói chuyện tự nhiên để tạo giọng nói Grok cá nhân hóa | Feel.Trading