뉴스 목록Baidu의 새로운 AI는 이미 최고 모델들을 능가하며 구축 비용은 94% 더 저렴함
Decrypt2026-05-11 20:46:16

Baidu의 새로운 AI는 이미 최고 모델들을 능가하며 구축 비용은 94% 더 저렴함

ORIGINALBaidu's New AI Is Already Beating Top Models and Cost 94% Less to Build
AI 영향 분석Grok 분석 중...
📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯4378 자
요약 - Baidu는 ERNIE 5.1의 사전 학습 비용이 유사한 AI 모델 대비 6% 수준에 불과하다고 밝혔습니다. - 그럼에도 불구하고 이 모델은 LMArena Search 리더보드에서 전 세계 4위를 차지했습니다. - Baidu는 플래그십 수준의 성능을 유지하면서도 모델을 이전 버전인 ERNIE 5.0 대비 전체 파라미터의 약 3분의 1 수준으로 압축했습니다. 중국의 Google로 불리는 Baidu는 지난주 말 ERNIE 5.1을 공식 출시했으며, 핵심 수치는 간과하기 어렵습니다. 이 모델은 동일한 규모의 유사한 AI 시스템 대비 학습 비용이 약 94% 저렴했습니다. 이를 쉽게 설명하자면, 최첨단 AI 모델을 학습시키는 데는 일반적으로 수백만 달러(수십억 달러에 달할 수도 있음)의 컴퓨팅 비용이 소요됩니다. 중국 검색 시장의 76% 이상을 점유하고 있으며 Nasdaq에서 BIDU로 거래되는 Baidu는 그 비용의 20분의 1 수준으로 동급의 성능을 구현했다고 주장합니다. 그 비결은 "다차원 탄력적 사전 학습(multi-dimensional elastic pre-training)"이라 불리는 기술입니다. Baidu는 ERNIE 5.1을 처음부터 구축하는 대신, 2026년 1월에 출시한 기존 ERNIE 5.0 아키텍처에서 최적화된 서브 네트워크를 추출하여 압축했습니다. 전체 파라미터는 원본의 약 3분의 1로 줄었고, 활성 파라미터(대화 중 실제로 작업을 수행하는 파라미터)는 절반으로 감소했습니다. 그 결과, 전체 학습 비용을 반복하지 않고도 더 큰 규모의 이전 모델이 가진 지식 기반을 그대로 물려받은 더 가벼운 모델이 탄생했습니다. 실제 사용자가 실시간 웹 검색 작업에서 AI 모델을 비교하고 인간의 선호도에 따라 점수를 매기는 리더보드인 LMArena Search Arena에서 ERNIE 5.1은 1,223점을 기록하며 전 세계 4위, 중국 모델 중 1위를 차지했습니다. 스프레드시트 작성이나 자율적인 웹 브라우징과 같은 다단계 작업을 처리하는 에이전트 능력은 이전 중국 벤치마크 기록 보유자인 DeepSeek-V4-Pro를 넘어섰습니다. ERNIE는 서구권 관찰자들에게는 생소한 이름일 수 있지만, 실제로는 중국의 주요 모델입니다. Baidu는 2023년 8월 Ernie Bot을 출시했으며, 이 챗봇은 그해 12월 중국 내 사용자 1억 명을 돌파했습니다. 이는 대부분의 중국 경쟁사보다 빠른 기록이지만, ChatGPT가 전 세계적으로 2개월 만에 같은 이정표를 세운 기록보다는 느린 속도입니다. 이러한 효율성 측면은 2025년 1월 DeepSeek가 AI 업계에 보여준 행보를 연상시킵니다. 당시 중국 스타트업인 DeepSeek가 OpenAI의 o1과 대등한 성능을 내면서도 쿼리 비용을 98% 낮춘 R1을 출시했을 때, 이는 Nvidia의 시가총액 6,000억 달러 증발을 야기했으며 모든 주요 AI 연구소들이 컴퓨팅 자원을 쏟아붓는 것만이 유일한 전략인지 재고하게 만들었습니다. ERNIE 5.1은 추론이 아닌 학습 측면에서 다른 종류의 효율성 사례를 보여주지만, 근본적인 메시지는 동일합니다. 중국 연구소들은 더 적은 자원으로 더 많은 것을 해내는 방법을 계속해서 찾아내고 있습니다. 학습 후 파이프라인도 주목할 만합니다. Baidu는 MOPD(Multi-Teacher On-Policy Distillation)라고 부르는 4단계 강화 학습 시스템을 구축했습니다. 수학 성능을 향상시키면 창의적 글쓰기 성능이 떨어지는 것과 같은 "시소 효과"를 유발할 수 있는 모든 기술을 한꺼번에 가르치려 하기보다, Baidu는 코드, 추론, 에이전트 작업을 위한 전문가 모델을 병렬로 학습시킨 후 이들을 하나의 통합 모델로 증류했습니다. 마지막 온라인 강화 학습 단계에서는 증류 과정에서 잘 포착되지 않은 부분을 보완하며 자유로운 대화와 창의적인 결과물을 처리했습니다. 이론적으로 이는 한 분야가 다른 분야보다 우선시되지 않고 모든 기술이 균일한 숙련도를 갖추게 됨을 의미합니다. GPQA(Graduate-Level Google-Proof Q&A,
데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)
🔍과거 유사 사건· 키워드 + 종목 매칭6 건
💡 현재 키워드 + 종목 매칭(MVP) 사용 중 · 추후 embedding 의미론적 검색으로 업그레이드 예정
원본 정보
ID:33e5487b0b
출처:Decrypt
발행:2026-05-11 20:46:16
분류:일반 · 도출된 분류 neutral
종목:지정되지 않음
커뮤니티 투표:+0 /0 · ⭐ 0 중요 · 💬 0 댓글
Baidu의 새로운 AI는 이미 최고 모델들을 능가하며 구축 비용은 94% 더 저렴함 | Feel.Trading