Danh sách tinNVIDIA ra mắt mô hình đa phương thức mã nguồn mở mới "Nemotron 3 Nano Omni"! Xử lý toàn diện từ video, âm thanh đến văn bản, chuyên dụng cho các ứng dụng Agent
動區 BlockTempo2026-04-28 16:49:33

NVIDIA ra mắt mô hình đa phương thức mã nguồn mở mới "Nemotron 3 Nano Omni"! Xử lý toàn diện từ video, âm thanh đến văn bản, chuyên dụng cho các ứng dụng Agent

ORIGINALNVIDIA 推出全新開源多模態大模型「Nemotron 3 Nano Omni」!影音圖文通吃,專攻 Agent 應用
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯1639 từ
NVIDIA lại tung chiêu mới! Hôm nay (28), hãng tuyên bố ra mắt mô hình đa phương thức mã nguồn mở hoàn toàn mới "Nemotron 3 Nano Omni". Mô hình này phá vỡ điểm đau của AI truyền thống vốn phụ thuộc vào việc kết nối nhiều mô hình rời rạc, có khả năng xử lý video, âm thanh, hình ảnh và văn bản một cách hiệu quả và thống nhất trong "một mô hình duy nhất". NVIDIA còn mạnh mẽ tuyên bố "mở hoàn toàn", không chỉ phát hành trọng số trên Hugging Face mà còn công khai toàn bộ tập dữ liệu huấn luyện và công thức, tấn công toàn diện vào thị trường cơ sở hạ tầng nền tảng cho Agentic AI. (Thông tin trước đó: Tin nhanh: Cổ phiếu NVIDIA lập đỉnh lịch sử trong phiên "vượt mốc 212,6 USD"! Vốn hóa thị trường đạt 5,17 nghìn tỷ USD, giành lại vị trí số 1 thế giới) (Bổ sung bối cảnh: Jensen Huang gửi thư cho toàn thể nhân viên ủng hộ OpenAI Codex: Hơn 10.000 nhân viên NVIDIA đã bắt đầu sử dụng, GPT-5.5 đang chạy trên GB200) Sự phát triển của AI Agents đang đón nhận một cuộc thay máu về kiến trúc, và người thúc đẩy cuộc cách mạng này chính là bá chủ sức mạnh tính toán NVIDIA. NVIDIA chính thức công bố thành viên mới nhất của gia đình Nemotron 3 vào ngày 28 —— "Nemotron 3 Nano Omni". Đúng như tên gọi "Omni (toàn năng/đa phương thức)", đây là một vũ khí cực kỳ hiệu quả, cởi mở và mạnh mẽ, có khả năng xử lý thống nhất video, âm thanh, hình ảnh và văn bản trong một mô hình duy nhất, được thiết kế riêng cho thế hệ Agentic AI tiếp theo. Trong quá khứ, khi các doanh nghiệp muốn phát triển một AI Agent có thể hiểu tài liệu, nghe hiểu giọng nói và xem video, họ thường phải dựa vào một "chuỗi mô hình rời rạc" —— tức là ghép nối các mô hình thị giác, mô hình âm thanh và mô hình văn bản độc lập lại với nhau. Cách làm này không chỉ dẫn đến độ phức tạp trong phối hợp cực cao, chi phí suy luận đắt đỏ, mà nguy hiểm hơn là "ngữ cảnh" đa phương thức rất dễ bị mất đi hoặc tạo ra ảo giác trong quá trình truyền tải. Sự ra đời của Nemotron 3 Nano Omni nhằm mục đích thu gọn các quy trình xử lý phức tạp này vào một "mô hình mở hiệu quả duy nhất". Với tư cách là một sub-agent nhận thức đa phương thức trong hệ thống, nó cho phép AI xử lý đầu vào đa phương thức một cách liền mạch trong một "vòng lặp nhận thức-hành động" duy nhất, cải thiện đáng kể khả năng hội tụ và giảm chi phí cho doanh nghiệp. Về tối ưu hóa phần cứng và kiến trúc nền tảng, NVIDIA đã thể hiện sức mạnh thống trị của mình: - Kiến trúc Hybrid MoE: Mô hình này sở hữu tổng cộng 30 tỷ (30B) tham số và áp dụng kiến trúc chuyên gia hỗn hợp (MoE), giúp "tham số kích hoạt" khi suy luận thực tế chỉ khoảng 3 tỷ (3B), vừa đảm bảo hiệu suất đỉnh cao vừa đạt hiệu quả tính toán tối ưu. Nền tảng bên dưới kết hợp khéo léo ưu điểm kép của Mamba (chuyên về hiệu suất chuỗi và bộ nhớ) và Transformer (chuyên về suy luận chính xác). - Hiệu suất áp đảo: Trong nhiều bài kiểm tra chuẩn (như MMLongbench-Doc, WorldSense, v.v.), Nano Omni đã thể hiện sức mạnh dẫn đầu. So với các mô hình đa phương thức mở khác, ở cùng ngưỡng tương tác, dung lượng hệ thống cho "suy luận video" của nó tăng tới 9,2 lần, khả năng suy luận đa tài liệu cũng tăng 7,4 lần. - Sinh ra vì Blackwell: Mô hình này hỗ trợ hoàn hảo GPU Blackwell mới nhất của NVIDIA và công nghệ lượng tử hóa NVFP4, đồng thời hỗ trợ cửa sổ ngữ cảnh siêu dài lên tới 262K, được thiết kế riêng cho việc xử lý video dài hạn và suy luận tài liệu phức tạp ở cấp độ doanh nghiệp. Điều khiến cộng đồng nhà phát triển phấn khích nhất chính là triết lý "Open by Design (thiết kế mở)" mà NVIDIA nhấn mạnh lần này. Khác với nhiều kiểu "giả mã nguồn mở" chỉ tung ra trọng số, lần này NVIDIA trực tiếp công khai toàn bộ trọng số mô hình của Nemotron 3 Nano Omni, tập dữ liệu huấn luyện khổng lồ (bao
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (動區 BlockTempo)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:688586f5e5
Nguồn:動區 BlockTempo
Đăng:2026-04-28 16:49:33
Danh mục:zh_news · Danh mục xuất zh
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận
NVIDIA ra mắt mô hình đa phương thức mã nguồn mở mới "Nemotron 3 Nano Omni"! Xử lý toàn diện từ video, âm thanh đến văn bản, chuyên dụng cho các ứng dụng Agent | Feel.Trading