뉴스 목록Xiaomi의 새로운 MiMo 2.5 Pro AI는 보고, 듣고, 행동할 수 있습니다—모두 하나의 모델로 가능합니다
Decrypt2026-04-22 19:42:35

Xiaomi의 새로운 MiMo 2.5 Pro AI는 보고, 듣고, 행동할 수 있습니다—모두 하나의 모델로 가능합니다

ORIGINALXiaomi's New MiMo 2.5 Pro AI Can See, Hear, and Act—All in One Model
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯5703 자
요약 - Xiaomi가 텍스트, 이미지, 오디오, 비디오 기능을 단일 멀티모달 AI 모델로 통합한 MiMo-V2.5 및 V2.5-Pro를 공개했습니다. - Pro 버전은 코딩 및 에이전트 벤치마크에서 최상위 모델들과 경쟁하며, 토큰 효율성과 비용을 크게 개선했습니다. - 이번 신규 모델은 OpenRouter와 같은 플랫폼에서의 높은 채택률에 힘입어 오픈소스 계획과 공격적인 반복 개발을 통해 Xiaomi의 빠른 AI 추진력을 보여줍니다. Xiaomi가 또다시 새로운 AI 모델 제품군을 출시했습니다. 몇 주 전, Xiaomi는 OpenRouter에서 "Hunter Alpha"라는 가명으로 조용히 유통되던 1조 파라미터 모델인 MiMo-V2-Pro를 공개했습니다. 이 모델은 하룻밤 사이에 무명에서 최상위권으로 올라섰고, 테스트 결과 매우 인상적이었습니다. 이제 Xiaomi는 MiMo-V2.5와 MiMo-V2.5-Pro를 선보였습니다. 이 두 모델은 이전 세대에는 단일 패키지로 존재하지 않았던 눈, 귀, 그리고 비디오 처리 능력을 갖추고 있습니다. 또한 Xiaomi는 조만간 이 모델들을 오픈소스화할 계획입니다. V2-Pro는 텍스트와 코드 전용이었습니다. 멀티모달 기능은 자매 모델인 MiMo-V2-Omni에 있었지만, 이는 더 낮은 벤치마크 점수를 가진 별도의 제품이었습니다. MiMo-V2.5는 이 모든 기능을 하나의 모델로 통합하여 더 빠르고 유능하며, 이미지, 비디오, 오디오 이해 능력을 처음부터 내장했습니다. 이는 일반 사용자에게 생각보다 큰 의미가 있습니다. 예를 들어, 냉장고 사진을 업로드하여 저녁 식사 레시피를 추천받거나, 비디오 튜토리얼을 입력하여 단계별 요약을 얻고, 회의를 녹음하여 작업 항목을 추출할 수 있습니다. 이 모든 것을 별도의 도구나 서로 다른 가격 정책을 가진 모델을 번갈아 사용할 필요 없이 한곳에서 처리할 수 있습니다. Xiaomi는 MiMo-V2.5-Pro가 "일반적인 에이전트 능력, 복잡한 소프트웨어 엔지니어링 및 장기 작업에서 MiMo-V2-Pro보다 크게 도약했다"고 주장하며, 현재 대부분의 코딩 및 에이전트 벤치마크에서 Claude Opus 4.6 및 GPT-5.4와 같은 최첨단 모델과 대등하다고 밝혔습니다. 수치상으로도 대부분 이를 뒷받침하지만, 더 어려운 추론 작업에서는 여전히 격차가 보입니다. 기본 모델과 Pro 모델은 목적이 다릅니다. MiMo-V2.5-Pro는 고성능 모델입니다. Xiaomi는 이 모델이 "인간 전문가가 며칠 걸릴 1,000개 이상의 도구 호출이 포함된 전문 작업을 자율적으로 완료할 수 있다"고 말합니다. 이는 복잡하고 다단계인 자동화 워크플로우를 실행하는 개발자를 위한 것입니다. 초당 60~80 토큰의 속도로 실행되며, 백만 토큰당 입력 $1.00 / 출력 $3.00의 비용이 듭니다. MiMo-V2.5는 일상적인 버전입니다. 더 빠르고(초당 100~150 토큰), 더 저렴하며($0.40 입력 / $2.00 출력), Pro 전용 등급에서 제외된 이미지, 오디오, 비디오 등 모든 모달리티를 지원합니다. 두 모델 모두 1M 토큰 컨텍스트 윈도우를 제공하여 단일 대화에서 약 75만 단어를 처리할 수 있습니다. 실제 스타트업 코드베이스의 버그를 수정하는 코딩 벤치마크인 SWE-bench Pro에서 MiMo-V2.5-Pro는 57.2%의 작업 해결률을 기록했습니다. 이는 업계 최상위권으로, 평균적인 모델은 약 25%를 기록합니다. τ3-bench와 ClawEval에서도 비슷한 양상을 보이며 Claude Opus 4.6 및 GPT-5.4와 몇 점 차이 내외를 기록합니다. 수십 개의 학문 분야에 걸친 대학원 수준의 문제들을 다루는 Humanity's Last Exam에서는 GPT-5.4의 58.7% 대비 48.0%를 기록하며 10점 차이의 격차를 보였습니다. 이 모델이 진정으로 돋보이는 점은 토큰 효율성
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)
🔍과거 유사 사건· 키워드 + 종목 매칭2 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:ca63fe28aa
출처:Decrypt
발행:2026-04-22 19:42:35
분류:일반 · 도출된 분류 neutral
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글
Xiaomi의 새로운 MiMo 2.5 Pro AI는 보고, 듣고, 행동할 수 있습니다—모두 하나의 모델로 가능합니다 | Feel.Trading