OpenAI thúc đẩy các tính năng an toàn mới cho ChatGPT khi các vụ kiện gia tăng

📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯3501 từ

Tóm tắt - OpenAI cho biết ChatGPT giờ đây có thể nhận diện tốt hơn các dấu hiệu tự gây hại hoặc bạo lực trong các cuộc trò chuyện đang diễn ra. - Bản cập nhật xuất hiện khi công ty đang đối mặt với các vụ kiện và cuộc điều tra liên quan đến cáo buộc rằng ChatGPT đã xử lý sai các cuộc trò chuyện nguy hiểm. - OpenAI cho biết các biện pháp bảo vệ mới dựa vào "bản tóm tắt an toàn" tạm thời thay vì bộ nhớ vĩnh viễn hoặc cá nhân hóa. Hôm thứ Năm, OpenAI đã công bố các tính năng an toàn mới được thiết kế để giúp ChatGPT nhận diện dấu hiệu rủi ro leo thang xuyên suốt các cuộc trò chuyện, trong bối cảnh công ty đang đối mặt với sự giám sát ngày càng tăng về mặt pháp lý và chính trị liên quan đến cách chatbot của họ xử lý người dùng đang gặp khủng hoảng. Trong một bài đăng trên blog, OpenAI cho biết các bản cập nhật này cải thiện khả năng của ChatGPT trong việc nhận diện các dấu hiệu cảnh báo liên quan đến tự sát, tự gây hại và khả năng bạo lực bằng cách phân tích ngữ cảnh phát triển theo thời gian thay vì xử lý từng tin nhắn riêng lẻ. "Mỗi ngày, mọi người đến với ChatGPT để trò chuyện về những điều quan trọng đối với họ—từ những câu hỏi thường ngày đến những cuộc trò chuyện mang tính cá nhân hoặc phức tạp hơn," công ty viết. "Trong số hàng trăm triệu lượt tương tác, một số cuộc trò chuyện có sự tham gia của những người đang gặp khó khăn hoặc trải qua khủng hoảng." Theo OpenAI, ChatGPT giờ đây sử dụng "bản tóm tắt an toàn" tạm thời, được công ty mô tả là những ghi chú có phạm vi hẹp nhằm nắm bắt ngữ cảnh liên quan đến an toàn từ các cuộc trò chuyện trước đó. "Trong các cuộc trò chuyện nhạy cảm, ngữ cảnh có thể quan trọng không kém một tin nhắn đơn lẻ," công ty viết. "Một yêu cầu có vẻ bình thường hoặc mơ hồ khi đứng riêng có thể mang ý nghĩa rất khác khi được nhìn nhận cùng với các dấu hiệu trước đó về sự khủng hoảng hoặc ý định gây hại tiềm tàng." OpenAI cho biết các bản tóm tắt này là ghi chú ngắn hạn chỉ được sử dụng trong các tình huống nghiêm trọng, không phải để ghi nhớ người dùng vĩnh viễn hoặc cá nhân hóa cuộc trò chuyện, và được dùng để phát hiện dấu hiệu cuộc trò chuyện đang trở nên nguy hiểm, tránh cung cấp thông tin có hại, xoa dịu tình hình hoặc hướng dẫn người dùng tìm đến sự trợ giúp. "Chúng tôi tập trung công việc này vào các kịch bản cấp tính, bao gồm tự sát, tự gây hại và gây hại cho người khác," họ viết. "Hợp tác với các chuyên gia sức khỏe tâm thần, chúng tôi đã cập nhật các chính sách mô hình và quá trình đào tạo để cải thiện khả năng của ChatGPT trong việc nhận diện các dấu hiệu cảnh báo xuất hiện trong suốt cuộc trò chuyện và sử dụng ngữ cảnh đó để đưa ra các phản hồi thận trọng hơn." Thông báo này được đưa ra khi OpenAI đang đối mặt với nhiều vụ kiện và cuộc điều tra cáo buộc rằng ChatGPT đã không phản ứng đúng cách trước các cuộc trò chuyện nguy hiểm liên quan đến bạo lực, sự dễ tổn thương về mặt cảm xúc và hành vi rủi ro. Vào tháng Tư, Tổng chưởng lý bang Florida James Uthmeier đã mở một cuộc điều tra nhằm vào OpenAI liên quan đến những lo ngại về an toàn trẻ em, tự gây hại và vụ xả súng hàng loạt năm 2025 tại Florida State University. OpenAI cũng đang đối mặt với một vụ kiện liên bang cáo buộc rằng ChatGPT đã hỗ trợ nghi phạm gây ra vụ tấn công. Hôm thứ Ba, OpenAI và CEO Sam Altman đã bị kiện tại tòa án bang California bởi gia đình của một sinh viên 19 tuổi qua đời do dùng thuốc quá liều ngoài ý muốn, với vụ kiện cáo buộc rằng ChatGPT đã khuyến khích việc sử dụng ma túy nguy hiểm và đưa ra lời khuyên về việc pha trộn các chất. OpenAI cho biết việc giúp ChatGPT nhận diện "rủi ro chỉ trở nên rõ ràng theo thời gian" vẫn là một thách thức đang được giải quyết; các phương pháp an toàn tương tự cuối cùng có thể được mở rộng sang các lĩnh vực khác. "Hiện tại, công việc này tập trung vào các kịch bản tự gây hại và gây hại cho người khác. Trong tương lai, chúng tôi có thể khám phá liệu các phương pháp tương tự có thể giúp ích trong các lĩnh vực rủi ro cao khác như sinh học hoặc an toàn mạng hay không, với các biện pháp bảo vệ được triển khai cẩn thận," họ viết. "Đây vẫn là một ưu tiên liên tục, và chúng tôi sẽ tiếp tục củng cố các biện pháp bảo vệ khi các mô hình và sự hiểu biết của chúng tôi phát triển."

Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)

🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin

2026-04-23

OpenAI cho biết ChatGPT mới dành cho bác sĩ vượt trội hơn con người trong các tác vụ lâm sàng

Độ tương đồng 150%關鍵字 chatgpt/new/openai

2026-05-16

OpenAI hợp tác với Malta để cung cấp quyền truy cập ChatGPT Plus miễn phí cho tất cả công dân

Độ tương đồng 130%關鍵字 chatgpt/openai

2026-05-16

OpenAI hợp nhất chiến tuyến sản phẩm! Greg Brockman đồng thời tiếp quản ChatGPT, Codex và API dành cho nhà phát triển

Độ tương đồng 130%關鍵字 chatgpt/openai

2026-05-15