Danh sách tinOpenAI thúc đẩy các tính năng an toàn mới cho ChatGPT khi các vụ kiện gia tăng
Decrypt2026-05-14 20:43:50

OpenAI thúc đẩy các tính năng an toàn mới cho ChatGPT khi các vụ kiện gia tăng

ORIGINALOpenAI Pushes New ChatGPT Safety Features as Lawsuits Mount
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯3501 từ
Tóm tắt - OpenAI cho biết ChatGPT giờ đây có thể nhận diện tốt hơn các dấu hiệu tự gây hại hoặc bạo lực trong các cuộc trò chuyện đang diễn ra. - Bản cập nhật xuất hiện khi công ty đang đối mặt với các vụ kiện và cuộc điều tra liên quan đến cáo buộc rằng ChatGPT đã xử lý sai các cuộc trò chuyện nguy hiểm. - OpenAI cho biết các biện pháp bảo vệ mới dựa vào "bản tóm tắt an toàn" tạm thời thay vì bộ nhớ vĩnh viễn hoặc cá nhân hóa. Hôm thứ Năm, OpenAI đã công bố các tính năng an toàn mới được thiết kế để giúp ChatGPT nhận diện dấu hiệu rủi ro leo thang xuyên suốt các cuộc trò chuyện, trong bối cảnh công ty đang đối mặt với sự giám sát ngày càng tăng về mặt pháp lý và chính trị liên quan đến cách chatbot của họ xử lý người dùng đang gặp khủng hoảng. Trong một bài đăng trên blog, OpenAI cho biết các bản cập nhật này cải thiện khả năng của ChatGPT trong việc nhận diện các dấu hiệu cảnh báo liên quan đến tự sát, tự gây hại và khả năng bạo lực bằng cách phân tích ngữ cảnh phát triển theo thời gian thay vì xử lý từng tin nhắn riêng lẻ. "Mỗi ngày, mọi người đến với ChatGPT để trò chuyện về những điều quan trọng đối với họ—từ những câu hỏi thường ngày đến những cuộc trò chuyện mang tính cá nhân hoặc phức tạp hơn," công ty viết. "Trong số hàng trăm triệu lượt tương tác, một số cuộc trò chuyện có sự tham gia của những người đang gặp khó khăn hoặc trải qua khủng hoảng." Theo OpenAI, ChatGPT giờ đây sử dụng "bản tóm tắt an toàn" tạm thời, được công ty mô tả là những ghi chú có phạm vi hẹp nhằm nắm bắt ngữ cảnh liên quan đến an toàn từ các cuộc trò chuyện trước đó. "Trong các cuộc trò chuyện nhạy cảm, ngữ cảnh có thể quan trọng không kém một tin nhắn đơn lẻ," công ty viết. "Một yêu cầu có vẻ bình thường hoặc mơ hồ khi đứng riêng có thể mang ý nghĩa rất khác khi được nhìn nhận cùng với các dấu hiệu trước đó về sự khủng hoảng hoặc ý định gây hại tiềm tàng." OpenAI cho biết các bản tóm tắt này là ghi chú ngắn hạn chỉ được sử dụng trong các tình huống nghiêm trọng, không phải để ghi nhớ người dùng vĩnh viễn hoặc cá nhân hóa cuộc trò chuyện, và được dùng để phát hiện dấu hiệu cuộc trò chuyện đang trở nên nguy hiểm, tránh cung cấp thông tin có hại, xoa dịu tình hình hoặc hướng dẫn người dùng tìm đến sự trợ giúp. "Chúng tôi tập trung công việc này vào các kịch bản cấp tính, bao gồm tự sát, tự gây hại và gây hại cho người khác," họ viết. "Hợp tác với các chuyên gia sức khỏe tâm thần, chúng tôi đã cập nhật các chính sách mô hình và quá trình đào tạo để cải thiện khả năng của ChatGPT trong việc nhận diện các dấu hiệu cảnh báo xuất hiện trong suốt cuộc trò chuyện và sử dụng ngữ cảnh đó để đưa ra các phản hồi thận trọng hơn." Thông báo này được đưa ra khi OpenAI đang đối mặt với nhiều vụ kiện và cuộc điều tra cáo buộc rằng ChatGPT đã không phản ứng đúng cách trước các cuộc trò chuyện nguy hiểm liên quan đến bạo lực, sự dễ tổn thương về mặt cảm xúc và hành vi rủi ro. Vào tháng Tư, Tổng chưởng lý bang Florida James Uthmeier đã mở một cuộc điều tra nhằm vào OpenAI liên quan đến những lo ngại về an toàn trẻ em, tự gây hại và vụ xả súng hàng loạt năm 2025 tại Florida State University. OpenAI cũng đang đối mặt với một vụ kiện liên bang cáo buộc rằng ChatGPT đã hỗ trợ nghi phạm gây ra vụ tấn công. Hôm thứ Ba, OpenAI và CEO Sam Altman đã bị kiện tại tòa án bang California bởi gia đình của một sinh viên 19 tuổi qua đời do dùng thuốc quá liều ngoài ý muốn, với vụ kiện cáo buộc rằng ChatGPT đã khuyến khích việc sử dụng ma túy nguy hiểm và đưa ra lời khuyên về việc pha trộn các chất. OpenAI cho biết việc giúp ChatGPT nhận diện "rủi ro chỉ trở nên rõ ràng theo thời gian" vẫn là một thách thức đang được giải quyết; các phương pháp an toàn tương tự cuối cùng có thể được mở rộng sang các lĩnh vực khác. "Hiện tại, công việc này tập trung vào các kịch bản tự gây hại và gây hại cho người khác. Trong tương lai, chúng tôi có thể khám phá liệu các phương pháp tương tự có thể giúp ích trong các lĩnh vực rủi ro cao khác như sinh học hoặc an toàn mạng hay không, với các biện pháp bảo vệ được triển khai cẩn thận," họ viết. "Đây vẫn là một ưu tiên liên tục, và chúng tôi sẽ tiếp tục củng cố các biện pháp bảo vệ khi các mô hình và sự hiểu biết của chúng tôi phát triển."
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:211555976d
Nguồn:Decrypt
Đăng:2026-05-14 20:43:50
Danh mục:Chung · Danh mục xuất neutral
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 0 quan trọng · 💬 0 bình luận