Danh sách tinOpenAI vừa mở mã nguồn một công cụ giúp loại bỏ các thông tin bí mật của bạn trước khi ChatGPT kịp nhìn thấy chúng
Decrypt2026-04-22 15:56:25 Nóng

OpenAI vừa mở mã nguồn một công cụ giúp loại bỏ các thông tin bí mật của bạn trước khi ChatGPT kịp nhìn thấy chúng

ORIGINALOpenAI Just Open-Sourced a Tool That Scrubs Your Secrets Before ChatGPT Ever Sees Them
Phân tích tác động AIGrok đang phân tích...
📄Toàn văn bài viết· Được trích xuất tự động bởi trafilaturaGemini 翻譯5157 từ
Tóm tắt - OpenAI đã phát hành Privacy Filter theo giấy phép Apache 2.0 trên GitHub và Hugging Face. - Mô hình 1,5 tỷ tham số này chạy cục bộ và che các tên, địa chỉ và mật khẩu. - Nó đạt 96% F1 trên tiêu chuẩn PII-Masking-300k benchmark ngay khi vừa ra mắt. Mỗi ngày, hàng triệu người dán những nội dung vào ChatGPT mà lẽ ra họ không nên làm. Tờ khai thuế. Hồ sơ y tế. Email công việc có tên khách hàng. Vết phát ban kỳ lạ đó. Khóa API mà họ thề sẽ xoay vòng vào tuần tới. OpenAI vừa phát hành một công cụ miễn phí giúp làm sạch tất cả những thứ đó trước khi chatbot kịp nhìn thấy. Nó được gọi là Privacy Filter và đã ra mắt trong tuần này theo giấy phép Apache 2.0, nghĩa là bất kỳ ai cũng có thể tải xuống, sử dụng, sửa đổi và bán các sản phẩm được xây dựng dựa trên nó. Mô hình này nằm trên Hugging Face và GitHub, nặng 1,5 tỷ tham số (thước đo đánh giá phạm vi kiến thức tiềm năng của một mô hình) và đủ nhỏ để chạy trên một chiếc máy tính xách tay thông thường. Hãy coi nó như trình kiểm tra chính tả, nhưng dành cho quyền riêng tư. Bạn cung cấp cho nó một đoạn văn bản và nó trả lại cùng đoạn văn bản đó với tất cả các phần nhạy cảm được thay thế bằng các trình giữ chỗ chung như [PRIVATE_PERSON] hoặc [ACCOUNT_NUMBER]. Bạn còn nhớ khi mọi người có thể khôi phục các phần bị che trong hồ sơ Jeffrey Epstein vì chính quyền Donald Trump chỉ đơn giản dùng bút dạ đen để cố gắng che giấu những bí mật đó không? Nếu họ sử dụng mô hình này, đó sẽ không phải là vấn đề. Privacy Filter của OpenAI thực sự làm gì Privacy Filter quét tám danh mục thông tin cá nhân: tên, địa chỉ, email, số điện thoại, URL, ngày tháng, số tài khoản và các bí mật như mật khẩu và khóa API. Nó đọc toàn bộ văn bản trong một lần, sau đó gắn thẻ các phần nhạy cảm để chúng có thể được che hoặc xóa đi. Đây là một ví dụ thực tế từ thông báo của OpenAI. Bạn dán vào một email có nội dung: "Cảm ơn một lần nữa vì đã gặp nhau hôm nay. (...) Để tham khảo, tệp dự án được liệt kê dưới mã 4829-1037-5581. Nếu có bất kỳ thay đổi nào từ phía bạn, vui lòng trả lời tại [email protected] hoặc gọi cho tôi theo số +1 (415) 555-0124." Privacy Filter trả về: "Cảm ơn một lần nữa vì đã gặp nhau hôm nay (...) Để tham khảo, tệp dự án được liệt kê dưới mã [ACCOUNT_NUMBER]. Nếu có bất kỳ thay đổi nào từ phía bạn, vui lòng trả lời tại [PRIVATE_EMAIL] hoặc gọi cho tôi theo số [PRIVATE_PHONE]." Thay vì xử lý các hộp đen và bút đánh dấu, nó thay đổi văn bản thực tế. Rất nhiều công cụ đã cố gắng bắt số điện thoại và địa chỉ email. Chúng hoạt động bằng cách tìm kiếm các mẫu, như "ba chữ số, dấu gạch ngang, ba chữ số". Điều đó ổn với những thứ rõ ràng nhưng sẽ thất bại ngay khi mọi thứ trở nên phụ thuộc vào ngữ cảnh. "Annie" là tên riêng hay một thương hiệu? "123 Main Street" là nhà riêng của một người hay địa chỉ doanh nghiệp trên mặt tiền cửa hàng? Khớp mẫu không thể phân biệt được. Privacy Filter thì có thể, vì nó thực sự đọc câu xung quanh đó. Mô hình này có vẻ khá tốt trong việc phát hiện những sắc thái này. OpenAI báo cáo rằng mô hình của họ đạt 96% trên một tiêu chuẩn benchmark sử dụng tập dữ liệu PII-Masking-300k ngay khi ra mắt, với phiên bản sửa lỗi của cùng bài kiểm tra đó đẩy con số lên 97,43%. Nói cách khác, nó phát hiện thành công thông tin cá nhân trong 96% trường hợp. Công việc của bạn, với tư cách là một người có ý thức về quyền riêng tư, là xử lý 4% còn lại. Phần "chạy cục bộ" là điểm mấu chốt Những người đam mê quyền riêng tư có thể coi đây là một điều tốt: OpenAI đã tạo ra một mô hình đủ nhỏ và mạnh mẽ để chạy trên máy của bạn, nghĩa là văn bản của bạn không bao giờ rời khỏi máy tính để được làm sạch. Điều đó quan trọng
Trạng thái dữ liệu✓ Đã trích xuất toàn vănĐọc bài gốc (Decrypt)
🔍Sự kiện tương tự trong lịch sử· Đối chiếu từ khóa + tài sản6 tin
💡 Hiện đang sử dụng đối chiếu từ khóa + tài sản (MVP) · Sau này sẽ nâng cấp lên tìm kiếm ngữ nghĩa embedding
Thông tin gốc
ID:58aabe8edb
Nguồn:Decrypt
Đăng:2026-04-22 15:56:25
Danh mục:hot · Danh mục xuất hot
Tài sản:Chưa chỉ định
Bình chọn cộng đồng:+0 /0 · ⭐ 1 quan trọng · 💬 0 bình luận
OpenAI vừa mở mã nguồn một công cụ giúp loại bỏ các thông tin bí mật của bạn trước khi ChatGPT kịp nhìn thấy chúng | Feel.Trading