Tencent의 새로운 Hy3 AI 모델은 아무도 언급하지 않는 가장 효율적인 중국 LLM이다

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯4978 자

요약 - Hy3 preview는 2,950억 개의 파라미터를 가진 Mixture-of-Experts 모델로, 활성 파라미터는 210억 개에 불과하여 비슷한 성능의 경쟁 모델보다 운영 비용이 저렴합니다. - 실제 GitHub 버그 수정을 테스트하는 코딩 벤치마크인 SWE-bench Verified에서 이전 세대(Hy2)의 53%에서 74.4%로 40% 향상된 성능을 기록했습니다. - 이 모델은 이미 Yuanbao, QQ, Tencent Docs 등 Tencent의 앱 생태계 전반에 적용되었으며, Tencent Cloud를 통한 API 액세스는 입력 토큰 100만 개당 약 $0.18부터 시작합니다. Tencent는 목요일에 지금까지 중 가장 뛰어난 AI 모델을 조용히 공개했으며, 벤치마크 수치는 무시하기 어려운 수준입니다. 전체 인프라 재구축 이후 Tencent의 첫 번째 모델인 Hy3 preview는 오늘 GitHub, Hugging Face, ModelScope를 통해 오픈소스로 공개되었습니다. 또한 Tencent Cloud 공식 웹사이트의 유료 플랜을 통해서도 이용할 수 있습니다. Hy3는 총 2,950억 개의 파라미터(모델의 잠재적 지식 범위를 측정하는 지표)를 보유하고 있지만, 특정 시점에 활성화되는 파라미터는 210억 개뿐입니다. 이것이 바로 Mixture-of-Experts 아키텍처의 장점입니다. 모델은 모든 것을 한꺼번에 실행하는 대신 각 쿼리를 "전문가" 하위 네트워크의 특정 하위 집합으로 라우팅합니다. 더 적은 연산량으로 더 낮은 비용을 들이면서도 비슷한 수준의 출력 품질을 제공합니다. 또한 최대 256,000 토큰의 컨텍스트를 지원하여 단일 프롬프트로 장편 소설 한 권 분량을 처리할 수 있습니다. 이 모델은 Tencent가 그동안 서로 타협해왔던 세 가지 요소인 성능 범위, 정직한 평가, 비용 효율성 사이의 균형을 맞추기 위해 구축되었습니다. 이전 플래그십 모델인 Hy2는 4,000억 개 이상의 파라미터를 가지고 있었습니다. Tencent는 이를 명시적으로 수정하며, 2,950억 개가 추론 능력이 완전히 성숙하면서도 파라미터 추가에 따른 비용 효율성이 떨어지기 시작하는 최적의 지점이라고 주장했습니다. 그렇다고 모델의 성능이 떨어지는 것은 아닙니다. 더 나은 학습을 거친 저파라미터 모델이 더 큰 범용 모델보다 더 뛰어난 성능을 보이는 경우는 매우 흔합니다. 코딩 분야에서의 개선은 극적입니다. SWE-bench Verified는 모델이 장난감 같은 문제가 아닌 실제 GitHub 저장소의 프로덕션 코드 버그를 실제로 수정할 수 있는지 테스트하는 벤치마크입니다. Hy2는 53.0%를 기록했지만, Hy3 preview는 74.4%를 기록했습니다. 이는 한 세대 만에 40% 점프한 수치로, Claude Opus 4.6(80.8%) 범위에 진입했으며 GLM-5(77.8%)와 Kimi-K2.5(76.8%)를 상회합니다. 실제 명령줄 환경에서 자율적인 작업 실행을 측정하는 Terminal-Bench 2.0에서도 23.2%에서 54.4%로 엄청난 도약을 보였습니다. 하지만 이 모델은 에이전트를 구축하는 사람들에게 매우 흥미로운 선택지가 될 수 있습니다. 에이전트는 기억, 기술, 도구 호출을 포함하는 매우 복잡한 지침 세트를 가지고 있습니다. 보통 무언가를 놓치면 워크플로우가 망가지거나 결과가 좋지 않게 나옵니다. 이 분야가 업계에서 가장 큰 화두가 되면서 AI 개발자들에게 에이전트 기능이 점점 더 중요해지는 이유이기도 합니다. 이 모델이 즉시 Openclaw에서 사용 가능하게 된 이유이기도 합니다. 인간의 안내 없이 오픈 웹에서 정보를 검색, 필터링 및 합성해야 하는 검색 및 브라우징 에이전트 성능도 크게 향상되었습니다. 복잡한 웹 조사 작업을 추적하는 벤치마크인 BrowseComp에서 Hy3 preview는 67.1%(Hy2의 28.7%에서 상승)를 기록했습니다. WideSearch에서는 70.2%를 기록하여 GLM-5와 Kimi-K2.5를 앞섰지만 Claude Opus 4.6의 77.2%에는 미치지 못

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)

🔍과거 유사 사건· 키워드 + 종목 매칭6 건

2026-04-30

Mistral AI가 새로운 오픈 소스 모델을 출시했다. 인터넷의 반응은 시큰둥하지만, 한 가지는 예외다

유사도 180%關鍵字 new/model/one

2026-04-22

Xiaomi의 새로운 MiMo 2.5 Pro AI는 보고, 듣고, 행동할 수 있습니다—모두 하나의 모델로 가능합니다

유사도 180%關鍵字 new/model/one

2026-04-30

Elon Musk는 대부분의 Crypto가 사기라고 말했지만, X는 새로운 Crypto Trading Terminal을 출시했다

유사도 130%關鍵字 new/most

2026-04-30