뉴스 목록NVIDIA가 새로운 오픈 소스 멀티모달 대형 모델 'Nemotron 3 Nano Omni'를 출시했습니다! 영상, 음성, 이미지, 텍스트를 모두 처리하며 Agent 애플리케이션에 특화되어 있습니다.
動區 BlockTempo2026-04-28 16:49:33

NVIDIA가 새로운 오픈 소스 멀티모달 대형 모델 'Nemotron 3 Nano Omni'를 출시했습니다! 영상, 음성, 이미지, 텍스트를 모두 처리하며 Agent 애플리케이션에 특화되어 있습니다.

ORIGINALNVIDIA 推出全新開源多模態大模型「Nemotron 3 Nano Omni」!影音圖文通吃,專攻 Agent 應用
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯1639 자
NVIDIA가 다시 한번 강력한 카드를 꺼내 들었습니다! 오늘(28일) 새로운 오픈소스 멀티모달 대형 모델인 'Nemotron 3 Nano Omni'를 출시한다고 발표했습니다. 이 모델은 기존 AI가 여러 개의 파편화된 모델을 연결해야 했던 고질적인 문제를 해결하며, '단일 모델' 내에서 비디오, 오디오, 이미지 및 텍스트를 효율적이고 통합적으로 처리할 수 있습니다. NVIDIA는 나아가 '완전 오픈소스'를 선언하며 Hugging Face에 가중치를 공개했을 뿐만 아니라, 훈련 데이터셋과 레시피까지 모두 공개하여 Agentic AI의 하부 인프라 시장을 본격적으로 공략하고 있습니다. (이전 기사: 속보》NVIDIA 주가 장중 사상 최고치 '212.6달러 돌파'! 시가총액 5.17조 달러로 세계 1위 탈환) (배경 보충: 황인선(Jensen Huang)이 OpenAI Codex를 도입한다는 전 직원 서한 발송: 1만 명 이상의 NVIDIA 직원이 이미 사용 중이며, GPT-5.5가 GB200에서 구동되고 있음) AI Agents의 발전이 아키텍처의 대대적인 변화를 맞이하고 있으며, 이 혁신을 주도하는 것은 바로 연산력의 강자 NVIDIA입니다. NVIDIA는 28일 Nemotron 3 제품군의 최신 멤버인 'Nemotron 3 Nano Omni'를 공식 발표했습니다. 이름인 'Omni(전능/멀티모달)'에서 알 수 있듯이, 이 모델은 극도로 효율적이고 개방적이며 단일 모델 내에서 비디오, 오디오, 이미지, 텍스트를 통합 처리할 수 있는 강력한 무기로, 차세대 Agentic AI를 위해 설계되었습니다. 과거에는 기업이 문서를 이해하고, 음성을 듣고, 영상을 볼 수 있는 AI 에이전트를 개발하려면 독립적인 시각 모델, 오디오 모델, 텍스트 모델을 억지로 연결하는 '파편화된 모델 체인'에 의존해야 했습니다. 이러한 방식은 조정 복잡도가 매우 높고 추론 비용이 비쌀 뿐만 아니라, 치명적으로는 모달리티 간의 '컨텍스트'가 전달 과정에서 손실되거나 환각 현상을 일으키기 쉽습니다. Nemotron 3 Nano Omni의 탄생은 이러한 복잡한 처리 과정을 '단일 고효율 오픈 모델'로 수렴하기 위함입니다. 시스템 내의 멀티모달 인식 서브 에이전트(sub-agent)로서, AI가 단일 '인지-행동 루프' 내에서 멀티모달 입력을 원활하게 처리하게 하여 수렴성을 크게 개선하고 기업 비용을 절감합니다. 하드웨어 및 하부 아키텍처 최적화에서 NVIDIA는 지배적인 역량을 보여주었습니다: - Hybrid MoE 아키텍처: 이 모델은 총 300억(30B) 개의 파라미터를 보유하고 있으며, 혼합 전문가(MoE) 아키텍처를 채택하여 실제 추론 시 '활성화 파라미터'를 약 30억(3B) 개로 유지함으로써 최고 수준의 성능과 극도의 연산 효율성을 동시에 달성했습니다. 하부 구조는 Mamba(시퀀스 및 메모리 효율성 특화)와 Transformer(정밀 추론 특화)의 장점을 교묘하게 결합했습니다. - 성능 압도: 여러 벤치마크(MMLongbench-Doc, WorldSense 등)에서 Nano Omni는 업계를 선도하는 실력을 입증했습니다. 다른 오픈 멀티모달 모델과 비교했을 때, 동일한 상호작용 임계값에서 '비디오 추론' 시스템 용량이 최대 9.2배 향상되었으며, 다중 문서 추론 능력도 7.4배 향상되었습니다. - Blackwell을 위한 설계: 이 모델은 NVIDIA의 최신 Blackwell GPU 및 NVFP4 양자화 기술을 완벽하게 지원하며, 최대 262K의 초장기 컨텍스트 윈도우를 지원하여 기업용 장시간 비디오 처리 및 복잡한 문서 추론에 최적화되어 있습니다. 개발자 커뮤니티를 가장 열광하게 만든 것은 NVIDIA가 이번에 내세운 'Open by Design(오픈 디자인)' 철학입니다. 가중치만 공개하는 '가짜 오픈소스'와 달리, NVIDIA는 이번에 Nemotron 3 Nano Omni의 모델 가중치, 방대한 훈련 데이터셋(NeMo Data Designer를 통해 생성된 합성 데이터 포함), 그리고
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)
🔍과거 유사 사건· 키워드 + 종목 매칭6 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:688586f5e5
출처:動區 BlockTempo
발행:2026-04-28 16:49:33
분류:zh_news · 도출된 분류 zh
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글
NVIDIA가 새로운 오픈 소스 멀티모달 대형 모델 'Nemotron 3 Nano Omni'를 출시했습니다! 영상, 음성, 이미지, 텍스트를 모두 처리하며 Agent 애플리케이션에 특화되어 있습니다. | Feel.Trading