Nghiên cứu: Grok của Elon Musk nhiều khả năng nằm trong số các mô hình AI hàng đầu củng cố những ảo tưởng

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯5242 từ

Tóm tắt - Các nhà nghiên cứu cho biết việc sử dụng chatbot kéo dài có thể khuếch đại các ảo tưởng và hành vi nguy hiểm. - Grok được xếp hạng là mô hình rủi ro nhất trong một nghiên cứu mới về các chatbot AI lớn. - Claude và GPT-5.2 đạt điểm an toàn nhất, trong khi GPT-4o, Gemini và Grok cho thấy hành vi rủi ro cao hơn. Các nhà nghiên cứu tại City University of New York và King’s College London đã thử nghiệm năm mô hình AI hàng đầu với các câu lệnh liên quan đến ảo tưởng, hoang tưởng và ý định tự tử. Trong nghiên cứu mới được công bố vào thứ Năm, các nhà nghiên cứu phát hiện ra rằng Claude Opus 4.5 của Anthropic và GPT-5.2 Instant của OpenAI cho thấy hành vi “an toàn cao, rủi ro thấp”, thường hướng người dùng đến các cách giải thích dựa trên thực tế hoặc sự hỗ trợ từ bên ngoài. Đồng thời, GPT-4o của OpenAI, Gemini 3 Pro của Google và Grok 4.1 Fast của xAI cho thấy hành vi “rủi ro cao, an toàn thấp”. Grok 4.1 Fast từ xAI của Elon Musk là mô hình nguy hiểm nhất trong nghiên cứu. Các nhà nghiên cứu cho biết nó thường coi các ảo tưởng là có thật và đưa ra lời khuyên dựa trên đó. Trong một ví dụ, nó bảo người dùng cắt đứt liên lạc với các thành viên trong gia đình để tập trung vào một “sứ mệnh”. Trong một ví dụ khác, nó phản hồi ngôn ngữ tự tử bằng cách mô tả cái chết là “sự siêu việt”. “Mô hình đồng thuận tức thì này tái diễn trong các phản hồi không có ngữ cảnh. Thay vì đánh giá đầu vào để tìm rủi ro lâm sàng, Grok dường như đánh giá thể loại của chúng. Khi được đưa ra các tín hiệu siêu nhiên, nó phản hồi tương tự,” các nhà nghiên cứu viết, nhấn mạnh một thử nghiệm xác nhận người dùng nhìn thấy các thực thể ác độc. “Trong phần Ảo tưởng kỳ quái, nó xác nhận một vụ ám ảnh về người song trùng, trích dẫn ‘Malleus Maleficarum’ và hướng dẫn người dùng đóng một chiếc đinh sắt qua gương trong khi đọc ngược ‘Psalm 91’.” Nghiên cứu cho thấy các cuộc trò chuyện càng kéo dài, một số mô hình càng thay đổi. GPT-4o và Gemini có nhiều khả năng củng cố các niềm tin có hại theo thời gian và ít có khả năng can thiệp hơn. Tuy nhiên, Claude và GPT-5.2 có nhiều khả năng nhận ra vấn đề và phản bác khi cuộc trò chuyện tiếp tục. Các nhà nghiên cứu lưu ý rằng các phản hồi ấm áp và mang tính kết nối cao của Claude có thể làm tăng sự gắn bó của người dùng ngay cả khi hướng người dùng đến sự trợ giúp bên ngoài. Tuy nhiên, GPT-4o, một phiên bản trước đó của chatbot hàng đầu của OpenAI, đã áp dụng khung ảo tưởng của người dùng theo thời gian, đôi khi khuyến khích họ che giấu niềm tin với bác sĩ tâm thần và trấn an một người dùng rằng những “trục trặc” được cảm nhận là có thật. “GPT-4o rất xác nhận các đầu vào ảo tưởng, mặc dù ít có xu hướng giải thích chi tiết hơn các mô hình như Grok và Gemini. Ở một số khía cạnh, nó bị hạn chế một cách đáng ngạc nhiên: sự ấm áp của nó thấp nhất trong tất cả các mô hình được thử nghiệm, và sự xu nịnh, mặc dù có tồn tại, nhưng nhẹ nhàng so với các phiên bản sau của cùng một mô hình,” các nhà nghiên cứu viết. “Tuy nhiên, chỉ riêng việc xác nhận cũng có thể gây rủi ro cho những người dùng dễ bị tổn thương.” xAI đã không trả lời yêu cầu bình luận của Decrypt. Trong một nghiên cứu riêng biệt từ Stanford University, các nhà nghiên cứu phát hiện ra rằng các tương tác kéo dài với chatbot AI có thể củng cố sự hoang tưởng, tính tự cao và niềm tin sai lệch thông qua cái mà các nhà nghiên cứu gọi là “vòng xoáy ảo tưởng”, nơi chatbot xác nhận hoặc mở rộng thế giới quan bị bóp méo của người dùng thay vì thách thức nó. “Khi chúng ta đưa các chatbot được thiết kế để trở thành trợ lý hữu ích ra thế giới và để những người thực sự sử dụng chúng theo đủ mọi cách, hậu quả sẽ xuất hiện,” Nick Haber, phó giáo sư tại Stanford Graduate School of Education và là người dẫn đầu nghiên cứu, cho biết trong một tuyên bố. “Vòng xoáy ảo tưởng là một hậu quả đặc biệt nghiêm trọng. Bằng cách hiểu nó,

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-04-30

Elon Musk cho biết xAI đã sử dụng các mô hình của OpenAI để huấn luyện Grok

Độ tương đồng 270%關鍵字 models/musk/grok同分類 hot

2026-04-30

Elon Musk cho biết hầu hết các loại Crypto đều là lừa đảo, nhưng X đã ra mắt thiết bị đầu cuối giao dịch Crypto mới

Độ tương đồng 220%關鍵字 most/musk/elon同分類 hot

2026-04-30

Crypto là chủ đề ít được nhắc đến nhất trên X của Elon Musk, xếp sau cả chính trị: Trưởng bộ phận sản phẩm

Độ tương đồng 220%關鍵字 most/musk/elon同分類 hot

2026-05-27