뉴스 목록AI 모델 Wenxin 5.1 정식 출시: 파라미터는 5.0의 3분의 1로 축소, 사전 학습 비용은 6%만 소요
動區 BlockTempo2026-05-09 08:23:48

AI 모델 Wenxin 5.1 정식 출시: 파라미터는 5.0의 3분의 1로 축소, 사전 학습 비용은 6%만 소요

ORIGINALAI模型文心5.1正式上線:引數砍至5.0三分之一,預訓練成本只花6%
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯1250 자
바이두 Wenxin 대모델 5.1이 정식 출시되었습니다. 사용자는 Wenxin Yiyan 공식 웹사이트에서 체험할 수 있으며, 기업과 개발자는 Qianfan 플랫폼을 통해 API를 호출할 수 있습니다. Wenxin 5.1은 올해 1월 발표된 Wenxin 5.0을 기반으로 훈련되었으며, 총 파라미터 수는 5.0의 약 3분의 1로 압축되었고, 활성화 파라미터는 약 절반 수준이며, 사전 훈련 연산 비용은 동일 규모 모델의 6%에 불과합니다. 핵심 기술은 바이두가 제안한 Once-for-All 탄력적 훈련 프레임워크입니다. (이전 내용: DeepSeek 첫 라운드 73.5억 달러 조달로 Alibaba 제쳐: Liang Wenfeng 자비 40% 투입, '조건 가장 적은' 자금만 수용) (배경 보충: Anthropic, 5년간 Google Cloud에 2,000억 달러 투자, AI 스타트업 두 곳이 4대 클라우드 거대 기업 주문 절반 차지) - 바이두 Wenxin 5.1 정식 출시, 총 파라미터 5.0의 3분의 1로 압축, 활성화 파라미터 약 절반 - 사전 훈련 연산 비용은 동일 규모 모델의 6% 수준, 핵심 기술은 Once-for-All 탄력적 훈련 프레임워크 - Wenxin 5.0은 한 번의 사전 훈련으로 서브 모델 매트릭스를 생성하며, 5.1은 그중 최적의 구조를 추출하여 지식을 직접 계승함 바이두 Wenxin 대모델 5.1이 정식 출시되었습니다. 사용자는 Wenxin Yiyan 공식 웹사이트에서 직접 체험할 수 있으며, 기업과 개발자는 Qianfan 플랫폼을 통해 API를 호출할 수 있습니다. Wenxin 5.1은 올해 1월 발표된 Wenxin 5.0을 기반으로 훈련되었으며, 핵심 셀링 포인트는 모델 크기와 훈련 비용의 대폭적인 압축입니다. 5.1 버전은 Arena 검색 순위에서 4위에 올랐습니다. 비용 압축의 핵심은 바이두가 제안한 Once-for-All 탄력적 훈련 프레임워크에서 나옵니다. 기존 방식은 서로 다른 규모의 모델을 위해 각각 사전 훈련을 수행해야 했으며, 모델 사이즈마다 독립적인 연산 자원이 투입되어 모델 버전이 많아질수록 중복 훈련으로 인한 낭비가 커졌습니다. Wenxin 5.0의 방식은 다릅니다. 단 한 번의 사전 훈련만 수행하며, 동적 샘플링 기술을 통해 다양한 크기의 서브 모델을 동시에 최적화하여 '서브 모델 매트릭스'를 형성합니다. Wenxin 5.1은 바로 이 매트릭스에서 추출한 최적의 구조입니다. 이는 5.0이 사전 훈련 단계에서 축적한 모든 지식을 직접 계승하므로, 처음부터 훈련하는 데 필요한 연산 자원을 절약합니다. '사전 훈련 비용 6%'라는 수치에 대해 설명하자면, 바이두가 동일 규모에서 더 저렴한 훈련 방법을 찾은 것이 아니라, Wenxin 5.1은 처음부터 시작하는 사전 훈련 과정을 완전히 건너뛰었기 때문입니다. 훈련 비용은 주로 5.0의 서브 모델 매트릭스에서 최적의 구조를 선별하고, 이후 미세 조정 및 정렬 단계에 집중됩니다. 동종 업계가 모델 규모별로 독립적으로 훈련하는 방식과 비교했을 때, 이러한 '한 번 훈련하여 여러 개를 산출하는' 아키텍처는 한계 비용 측면에서 구조적인 우위를 가집니다. 이 논리는 DeepSeek가 연초에 발표한 저비용 훈련 경로와는 다릅니다. DeepSeek V3는 단일 훈련에서 더 적은 GPU와 더 효율적인 엔지니어링 구현을 통해 비용을 낮추는 것을 강조하는 반면, 바이두의 Once-for-All은 한 번의 훈련 산출물을 '하나의 모델'에서 '전체 모델 패밀리'로 확장한 것입니다. Wenxin 5.1과 Wenxin 5.0의 차이점은 무엇인가요? Wenxin 5.1은 5.0을 기반으로 훈련되었으며, 총 파라미터는 5.0의 3분의 1로 압축되었고, 활성화 파라미터는 약 절반입니다
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (動區 BlockTempo)
🔍과거 유사 사건· 키워드 + 종목 매칭0 건
유사 사건을 찾을 수 없음 (더 많은 데이터 샘플 또는 embedding 검색 필요, 현재는 MVP 키워드 매칭)
원본 정보
ID:58436348cf
출처:動區 BlockTempo
발행:2026-05-09 08:23:48
분류:zh_news · 도출된 분류 zh
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글
AI 모델 Wenxin 5.1 정식 출시: 파라미터는 5.0의 3분의 1로 축소, 사전 학습 비용은 6%만 소요 | Feel.Trading