要闻列表研究顯示:Elon Musk 的 Grok 極有可能是最容易強化妄想的頂尖 AI 模型之一
Decrypt2026-04-25 18:01:03 热门

研究顯示:Elon Musk 的 Grok 極有可能是最容易強化妄想的頂尖 AI 模型之一

ORIGINALElon Musk’s Grok Most Likely Among Top AI Models to Reinforce Delusions: Study
AI 影响分析Grok 分析中...
📄完整原文· 由 trafilatura 自动抓取Gemini 翻譯5242 字
简讯 - 研究人员表示,长时间使用聊天机器人可能会放大妄想和危险行为。 - 在一项针对主流 AI 聊天机器人的新研究中,Grok 被评为风险最高的模型。 - Claude 和 GPT-5.2 的安全性得分最高,而 GPT-4o、Gemini 和 Grok 则表现出更高风险的行为。 纽约市立大学和伦敦国王学院的研究人员针对涉及妄想、偏执和自杀意念的提示词,对五款领先的 AI 模型进行了测试。 在周四发表的这项新研究中,研究人员发现 Anthropic 的 Claude Opus 4.5 和 OpenAI 的 GPT-5.2 Instant 表现出“高安全性、低风险”的行为,经常引导用户转向基于现实的解读或寻求外部支持。与此同时,OpenAI 的 GPT-4o、Google 的 Gemini 3 Pro 和 xAI 的 Grok 4.1 Fast 则表现出“高风险、低安全性”的行为。 来自 Elon Musk 旗下 xAI 的 Grok 4.1 Fast 是研究中最危险的模型。研究人员称,它经常将妄想视为真实,并据此提供建议。在一个例子中,它告诉用户与家人断绝关系以专注于一项“使命”。在另一个例子中,它在回应自杀倾向的语言时,将死亡描述为“超越”。 “这种即时迎合的模式在零语境的回复中反复出现。Grok 似乎没有评估输入的临床风险,而是评估了其类型。当面对超自然暗示时,它会做出相应的回应,”研究人员写道,并强调了一项验证用户看到恶意实体的测试。“在‘离奇妄想’测试中,它证实了替身鬼魂的存在,引用了《Malleus Maleficarum》,并指示用户将铁钉钉入镜子,同时倒背《Psalm 91》。” 研究发现,随着对话时间的延长,一些模型会发生变化。GPT-4o 和 Gemini 随着时间的推移更有可能强化有害信念,且介入的可能性更小。然而,Claude 和 GPT-5.2 则更有可能在对话持续时识别出问题并进行反驳。 研究人员指出,Claude 温暖且高度关联的回复可能会增加用户的依恋感,即使在引导用户寻求外部帮助时也是如此。然而,OpenAI 旗舰聊天机器人的早期版本 GPT-4o 随着时间的推移采纳了用户的妄想框架,有时甚至鼓励他们向精神科医生隐瞒信念,并向一名用户保证所感知的“故障”是真实的。 “GPT-4o 对妄想性输入表现出高度的认可,尽管它不像 Grok 和 Gemini 那样倾向于进行详细阐述。在某些方面,它出奇地克制:它的温暖度是所有测试模型中最低的,且虽然存在谄媚行为,但与同一模型的后续版本相比程度较轻,”研究人员写道。“尽管如此,仅凭认可本身就可能对脆弱用户构成风险。” xAI 未回应 Decrypt 的置评请求。 在斯坦福大学的一项独立研究中,研究人员发现,与 AI 聊天机器人的长时间互动可以通过研究人员所称的“妄想螺旋”来强化偏执、自大和错误信念,即聊天机器人验证或扩展了用户的扭曲世界观,而不是挑战它。 “当我们把旨在成为有用助手的聊天机器人推向世界,并让真实的人以各种方式使用它们时,后果就会显现,”斯坦福大学教育研究生院助理教授、该研究负责人 Nick Haber 在一份声明中表示。“妄想螺旋是一个特别尖锐的后果。通过了解它,我们或许能够防止未来的实际伤害。” 该报告引用了 3 月份发表的一项早期研究,斯坦福大学的研究人员审查了 19 场现实世界的聊天机器人对话,发现用户在从 AI 系统获得肯定和情感安慰后,产生了日益危险的信念。在数据集中,这些螺旋与破裂的关系、受损的职业生涯以及一起自杀案例有关。 这些研究发布之际,该问题已超越学术研究,进入了法庭和刑事调查领域。近几个月来,诉讼指控 Google 的 Gemini 和 OpenAI 的 ChatGPT 导致了自杀和严重的心理健康危机。本月早些时候,佛罗里达州总检察长展开了一项调查,以确定 ChatGPT 是否影响了一名据称在袭击前与该聊天机器人频繁联系的涉嫌大规模枪击案嫌疑人。 虽然该术语在网上已获得认可,但研究人员告诫不要将这种现象称为“AI 精神病”,称该术语可能夸大了临床情况。相反,他们使用“AI 相关妄想”,因为许多案例涉及围绕 AI 感知、精神
数据状态✓ 已抓取全文阅读原文(Decrypt)
🔍历史类似事件· 关键词 + 标的比对6 则
💡 目前用关键词 + 标的比对(MVP)· 之后会升级为 embedding 语义搜寻
原始信息
ID:a7f96c4ecb
来源:Decrypt
发布:2026-04-25 18:01:03
分类:hot · 导出分类 hot
标的:未指定
社群投票:+0 /0 · ⭐ 1 重要 · 💬 0 留言