뉴스 목록Tencent의 새로운 Hy3 AI 모델은 아무도 언급하지 않는 가장 효율적인 중국 LLM이다
Decrypt2026-04-23 17:18:08

Tencent의 새로운 Hy3 AI 모델은 아무도 언급하지 않는 가장 효율적인 중국 LLM이다

ORIGINALTencent's New Hy3 AI Model Is the Most Efficient Chinese LLM No One's Talking About
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯4978 자
요약 - Hy3 preview는 2,950억 개의 파라미터를 가진 Mixture-of-Experts 모델로, 활성 파라미터는 210억 개에 불과하여 비슷한 성능의 경쟁 모델보다 운영 비용이 저렴합니다. - 실제 GitHub 버그 수정을 테스트하는 코딩 벤치마크인 SWE-bench Verified에서 이전 세대(Hy2)의 53%에서 74.4%로 40% 향상된 성능을 기록했습니다. - 이 모델은 이미 Yuanbao, QQ, Tencent Docs 등 Tencent의 앱 생태계 전반에 적용되었으며, Tencent Cloud를 통한 API 액세스는 입력 토큰 100만 개당 약 $0.18부터 시작합니다. Tencent는 목요일에 지금까지 중 가장 뛰어난 AI 모델을 조용히 공개했으며, 벤치마크 수치는 무시하기 어려운 수준입니다. 전체 인프라 재구축 이후 Tencent의 첫 번째 모델인 Hy3 preview는 오늘 GitHub, Hugging Face, ModelScope를 통해 오픈소스로 공개되었습니다. 또한 Tencent Cloud 공식 웹사이트의 유료 플랜을 통해서도 이용할 수 있습니다. Hy3는 총 2,950억 개의 파라미터(모델의 잠재적 지식 범위를 측정하는 지표)를 보유하고 있지만, 특정 시점에 활성화되는 파라미터는 210억 개뿐입니다. 이것이 바로 Mixture-of-Experts 아키텍처의 장점입니다. 모델은 모든 것을 한꺼번에 실행하는 대신 각 쿼리를 "전문가" 하위 네트워크의 특정 하위 집합으로 라우팅합니다. 더 적은 연산량으로 더 낮은 비용을 들이면서도 비슷한 수준의 출력 품질을 제공합니다. 또한 최대 256,000 토큰의 컨텍스트를 지원하여 단일 프롬프트로 장편 소설 한 권 분량을 처리할 수 있습니다. 이 모델은 Tencent가 그동안 서로 타협해왔던 세 가지 요소인 성능 범위, 정직한 평가, 비용 효율성 사이의 균형을 맞추기 위해 구축되었습니다. 이전 플래그십 모델인 Hy2는 4,000억 개 이상의 파라미터를 가지고 있었습니다. Tencent는 이를 명시적으로 수정하며, 2,950억 개가 추론 능력이 완전히 성숙하면서도 파라미터 추가에 따른 비용 효율성이 떨어지기 시작하는 최적의 지점이라고 주장했습니다. 그렇다고 모델의 성능이 떨어지는 것은 아닙니다. 더 나은 학습을 거친 저파라미터 모델이 더 큰 범용 모델보다 더 뛰어난 성능을 보이는 경우는 매우 흔합니다. 코딩 분야에서의 개선은 극적입니다. SWE-bench Verified는 모델이 장난감 같은 문제가 아닌 실제 GitHub 저장소의 프로덕션 코드 버그를 실제로 수정할 수 있는지 테스트하는 벤치마크입니다. Hy2는 53.0%를 기록했지만, Hy3 preview는 74.4%를 기록했습니다. 이는 한 세대 만에 40% 점프한 수치로, Claude Opus 4.6(80.8%) 범위에 진입했으며 GLM-5(77.8%)와 Kimi-K2.5(76.8%)를 상회합니다. 실제 명령줄 환경에서 자율적인 작업 실행을 측정하는 Terminal-Bench 2.0에서도 23.2%에서 54.4%로 엄청난 도약을 보였습니다. 하지만 이 모델은 에이전트를 구축하는 사람들에게 매우 흥미로운 선택지가 될 수 있습니다. 에이전트는 기억, 기술, 도구 호출을 포함하는 매우 복잡한 지침 세트를 가지고 있습니다. 보통 무언가를 놓치면 워크플로우가 망가지거나 결과가 좋지 않게 나옵니다. 이 분야가 업계에서 가장 큰 화두가 되면서 AI 개발자들에게 에이전트 기능이 점점 더 중요해지는 이유이기도 합니다. 이 모델이 즉시 Openclaw에서 사용 가능하게 된 이유이기도 합니다. 인간의 안내 없이 오픈 웹에서 정보를 검색, 필터링 및 합성해야 하는 검색 및 브라우징 에이전트 성능도 크게 향상되었습니다. 복잡한 웹 조사 작업을 추적하는 벤치마크인 BrowseComp에서 Hy3 preview는 67.1%(Hy2의 28.7%에서 상승)를 기록했습니다. WideSearch에서는 70.2%를 기록하여 GLM-5와 Kimi-K2.5를 앞섰지만 Claude Opus 4.6의 77.2%에는 미치지 못
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)
🔍과거 유사 사건· 키워드 + 종목 매칭6 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:889b3d4ce8
출처:Decrypt
발행:2026-04-23 17:18:08
분류:일반 · 도출된 분류 neutral
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글