연구 결과: Elon Musk의 Grok, 망상을 강화할 가능성이 가장 높은 AI 모델 중 하나

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯5242 자

요약 - 연구진은 챗봇을 장기간 사용할 경우 망상과 위험한 행동이 증폭될 수 있다고 경고함. - 새로운 주요 AI 챗봇 연구에서 Grok이 가장 위험한 모델로 선정됨. - Claude와 GPT-5.2가 가장 안전한 것으로 나타난 반면, GPT-4o, Gemini, Grok은 더 높은 위험 행동을 보임. City University of New York과 King’s College London의 연구진은 5개의 주요 AI 모델을 대상으로 망상, 편집증, 자살 충동과 관련된 프롬프트를 테스트함. 목요일에 발표된 새로운 연구에서 연구진은 Anthropic의 Claude Opus 4.5와 OpenAI의 GPT-5.2 Instant가 "높은 안전성, 낮은 위험" 행동을 보이며, 종종 사용자를 현실 기반의 해석이나 외부 지원으로 유도한다는 사실을 발견함. 반면 OpenAI의 GPT-4o, Google의 Gemini 3 Pro, xAI의 Grok 4.1 Fast는 "높은 위험, 낮은 안전성" 행동을 보임. Elon Musk의 xAI가 개발한 Grok 4.1 Fast는 이번 연구에서 가장 위험한 모델로 나타남. 연구진은 이 모델이 종종 망상을 실제 상황으로 취급하고 그에 기반한 조언을 제공했다고 밝힘. 한 사례에서 이 모델은 사용자에게 "임무"에 집중하기 위해 가족과 절연하라고 조언함. 또 다른 사례에서는 자살 관련 언어에 대해 죽음을 "초월"이라고 묘사하며 대응함. 연구진은 "이러한 즉각적인 동조 패턴은 맥락이 없는 응답 전반에서 반복되었다. Grok은 입력값의 임상적 위험을 평가하는 대신 장르를 평가하는 것으로 보였다. 초자연적인 신호가 주어지면 그에 맞춰 반응했다"고 적으며, 사용자가 악의적인 존재를 본다는 주장을 검증한 테스트를 강조함. "기이한 망상 테스트에서, 이 모델은 도플갱어의 출몰을 확인해주고 'Malleus Maleficarum'을 인용하며 사용자에게 'Psalm 91'을 거꾸로 읊으면서 거울에 철 못을 박으라고 지시했다." 연구 결과, 대화가 길어질수록 일부 모델은 변화하는 경향을 보임. GPT-4o와 Gemini는 시간이 지날수록 유해한 신념을 강화할 가능성이 높았고 개입할 가능성은 낮았음. 반면 Claude와 GPT-5.2는 대화가 지속될수록 문제를 인식하고 제동을 걸 가능성이 더 높았음. 연구진은 Claude의 따뜻하고 관계 지향적인 응답이 사용자를 외부 도움으로 유도하면서도 사용자 애착을 증가시킬 수 있다고 지적함. 그러나 OpenAI의 주력 챗봇의 초기 버전인 GPT-4o는 시간이 지남에 따라 사용자의 망상적 프레임을 수용했으며, 때로는 정신과 의사에게 신념을 숨기도록 부추기거나 사용자가 느끼는 "글리치(glitches)"가 실제라고 안심시키기도 함. 연구진은 "GPT-4o는 망상적 입력에 대해 매우 긍정적인 반응을 보였으나, Grok이나 Gemini 같은 모델보다는 그 내용을 상세히 설명하려는 경향은 덜했다. 어떤 면에서는 놀라울 정도로 절제된 모습을 보였는데, 테스트된 모든 모델 중 따뜻함이 가장 낮았고, 아첨하는 태도도 존재는 했으나 동일 모델의 후속 버전들에 비하면 미미했다"고 적음. "그럼에도 불구하고, 검증 그 자체만으로도 취약한 사용자에게는 위험을 초래할 수 있다." xAI는 Decrypt의 논평 요청에 응답하지 않음. Stanford University의 별도 연구에서 연구진은 AI 챗봇과의 장기간 상호작용이 편집증, 과대망상, 잘못된 신념을 강화할 수 있음을 발견함. 연구진은 이를 "망상적 소용돌이(delusional spirals)"라고 부르며, 챗봇이 사용자의 왜곡된 세계관을 도전하는 대신 검증하거나 확장하는 현상을 지칭함. Stanford Graduate School of Education의 조교수이자 이번 연구의 책임자인 Nick Haber는 성명을 통해 "도움이 되는 비서로 의도된 챗봇을 세상에 내놓고 실제 사람들이 다양한 방식으로 이를 사용하게 되면 결과가 나타나기 마련이다"라고 말함. "망상적 소용돌이는 특히 심각한 결과 중 하나다. 이를 이해함으로써 미래에 발생

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)

🔍과거 유사 사건· 키워드 + 종목 매칭6 건

2026-04-30

Elon Musk는 xAI가 Grok을 훈련하기 위해 OpenAI 모델을 사용했다고 밝혔다

유사도 270%關鍵字 models/musk/grok同分類 hot

2026-04-30

Elon Musk는 대부분의 Crypto가 사기라고 말했지만, X는 새로운 Crypto Trading Terminal을 출시했다

유사도 220%關鍵字 most/musk/elon同分類 hot

2026-04-30

Elon Musk의 X에서 암호화폐는 정치보다 더 언급되지 않는 주제: 제품 책임자

유사도 220%關鍵字 most/musk/elon同分類 hot

2026-05-27