DeepSeek-R1의 환각 현상이 V3보다 4배 더 많아, Crypto AI Agent 토큰에 적신호가 켜짐

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯4126 자

중국 연구소 DeepSeek의 주력 추론 모델인 DeepSeek-R1은 Vectara의 HHEM 2.1 벤치마크에 따르면 14.3%의 환각(hallucination) 현상을 보입니다. 이는 3.9%를 기록한 비추론 모델인 이전 버전 DeepSeek-V3보다 거의 4배 높은 수치입니다. 이러한 격차는 암호화폐 분야에 어려운 질문을 던집니다. 빠르게 성장 중인 AI 에이전트 토큰 부류는 현재 자율 거래, 신호 생성 및 온체인 실행을 위해 추론형 LLM에 의존하고 있습니다. Vectara 데이터, R1이 잘못된 사실로 '과도하게 돕는다(Overhelps)'는 점을 보여주다 Vectara는 자사의 전용 환각 평가 프레임워크인 HHEM 2.1을 통해 두 DeepSeek 모델을 모두 테스트했습니다. 연구팀은 또한 Google의 FACTS 방법론을 사용하여 결과를 교차 검증했습니다. R1은 모든 테스트 구성에서 V3보다 더 많은 허위 또는 근거 없는 진술을 생성했습니다. 원인은 단순히 추론의 깊이 때문만이 아니었습니다. Vectara의 분석가들은 R1이 '과도하게 돕는(overhelp)' 경향이 있다는 것을 발견했습니다. 모델이 원문에는 나타나지 않는 정보를 추가하는 것입니다. 추가된 세부 정보는 그 자체로는 사실일 수 있지만 여전히 환각으로 간주됩니다. 이러한 행동은 조작된 맥락을 그럴듯한 답변 속에 몰래 포함시킵니다. Vectara는 X에 올린 공개 게시물을 통해 이 발견을 직접적으로 밝혔습니다. Vectara는 게시물에서 "DeepSeek-R1은 14.3%의 환각률을 보이며, 이는 DeepSeek-V3보다 거의 4배 높은 수치입니다"라고 언급했습니다. 이러한 패턴은 DeepSeek에만 국한된 것이 아닙니다. 업계 관찰자들은 다른 연구소의 추론 훈련 모델 전반에서 동일한 상충 관계(trade-off)가 나타나고 있다고 지적합니다. 사고의 연쇄(chain-of-thought)를 날카롭게 만드는 강화 학습은 더 대담하고 자신감 있는 생성 결과물에 보상을 제공하기도 합니다. 암호화폐 AI 토큰이 이러한 상충 관계에 놓인 이유 암호화폐 시장에는 현재 Virtuals Protocol(VIRTUAL), ai16z(AI16Z), aixbt(AIXBT)를 필두로 수백 개의 AI 에이전트 토큰이 존재합니다. 이 카테고리는 최근 30일 동안 약 39.4%의 성장률을 기록했습니다. Virtuals 단일 종목만 해도 시가총액 5억 7,600만 달러를 넘어섰습니다. 이러한 에이전트 대부분은 대규모 언어 모델을 도구와 결합합니다. 해당 도구를 통해 에이전트는 소셜 미디어에 게시물을 올리고, 거래를 라우팅하며, 토큰을 발행하거나 시장 논평을 생성합니다. 기반 모델이 가격 수준, 파트너십 또는 컨트랙트 주소를 조작할 경우, 그 결과는 온체인에 직접적인 영향을 미칠 수 있습니다. BeInCrypto의 AIXBT 분석에 따르면, 해당 에이전트는 416개의 토큰을 홍보(shill)했으며 평균 19%의 수익률을 기록했습니다. 그러나 동일한 표면적 메커니즘은 모델이 실패할 경우 팔로워들을 잘못된 판단에 노출시킵니다. 위험 범위는 자율성과 함께 확장됩니다. 단순히 감정을 요약하는 읽기 전용 에이전트와 트레저리 키(treasury keys)를 보유한 에이전트 간에는 위험의 차이가 큽니다. 추론 모델은 여러 단계에 걸쳐 계획을 세우는 에이전트에게 특히 매력적입니다. 이는 Vectara의 14.3% 수치가 가장 치명적으로 작용하는 사용 사례이기도 합니다. 사고의 연쇄 초기 단계에서 발생한 단 하나의 환각된 사실은 이후의 모든 하위 작업으로 전파될 수 있습니다. LeCun, 문제는 아키텍처에 있다고 주장 Meta의 수석 AI 과학자인 Yann LeCun은 오랫동안 자기회귀(autoregressive) LLM이 환각에서 완전히 벗어날 수 없다고 주장해 왔습니다. 그의 관점에서 아키텍처 자체에는 세상에 대한 근거 있는 모델이 결여

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (BeInCrypto)

🔍과거 유사 사건· 키워드 + 종목 매칭6 건

2026-05-08

Crypto Biz: 월스트리트는 BTC 그 이상을 원한다

유사도 180%關鍵字 more/than/crypto

2026-04-23

100개 이상의 암호화폐 단체가 상원의 조치를 촉구함에 따라 CLARITY Act의 시급성이 커지고 있다

유사도 150%關鍵字 more/than/crypto

2026-04-23

100개 이상의 암호화폐 기업들이 상원에 U.S. market structure bill 처리를 촉구했다

유사도 150%關鍵字 more/than/crypto

2026-05-14