Daftar beritaOpenAI baru saja membuka sumber (open-source) alat yang membersihkan rahasia Anda sebelum ChatGPT melihatnya
Decrypt2026-04-22 15:56:25 Populer

OpenAI baru saja membuka sumber (open-source) alat yang membersihkan rahasia Anda sebelum ChatGPT melihatnya

ORIGINALOpenAI Just Open-Sourced a Tool That Scrubs Your Secrets Before ChatGPT Ever Sees Them
Analisis Dampak AIGrok sedang menganalisis...
📄Artikel lengkap· Diambil secara otomatis oleh trafilaturaGemini 翻譯5157 kata
Singkatnya - OpenAI merilis Privacy Filter di bawah lisensi Apache 2.0 di GitHub dan Hugging Face. - Model dengan 1,5 miliar parameter ini berjalan secara lokal dan menyamarkan nama, alamat, serta kata sandi. - Model ini mencapai skor 96% F1 pada benchmark standar PII-Masking-300k secara langsung (out of the box). Setiap hari, jutaan orang menempelkan berbagai hal ke dalam ChatGPT yang seharusnya tidak mereka lakukan. SPT pajak. Rekam medis. Email pekerjaan dengan nama klien. Ruam aneh itu. Kunci API yang mereka janjikan akan diganti minggu depan. OpenAI baru saja merilis alat gratis yang membersihkan semua itu sebelum chatbot melihatnya. Alat ini disebut Privacy Filter, dan diluncurkan minggu ini di bawah lisensi Apache 2.0, yang berarti siapa pun dapat mengunduh, menggunakan, memodifikasi, dan menjual produk yang dibangun di atasnya. Model ini berada di Hugging Face dan GitHub, memiliki 1,5 miliar parameter (metrik yang mengukur potensi keluasan pengetahuan model), dan cukup kecil untuk dijalankan di laptop biasa. Anggap saja ini sebagai pemeriksa ejaan, tetapi untuk privasi. Anda memasukkan blok teks, dan alat ini mengembalikan teks yang sama dengan semua bagian sensitif yang diganti dengan placeholder umum seperti [PRIVATE_PERSON] atau [ACCOUNT_NUMBER]. Ingat saat orang-orang dapat membuka bagian yang disensor dari dokumen Jeffrey Epstein karena pemerintahan Donald Trump hanya menggunakan spidol hitam untuk mencoba menyembunyikan rahasia tersebut? Seandainya mereka menggunakan model ini, itu tidak akan menjadi masalah. Apa yang sebenarnya dilakukan Privacy Filter dari OpenAI Privacy Filter memindai delapan kategori informasi pribadi: nama, alamat, email, nomor telepon, URL, tanggal, nomor akun, dan rahasia seperti kata sandi serta kunci API. Alat ini membaca seluruh teks dalam satu kali proses, lalu menandai bagian sensitif agar dapat disamarkan atau disensor. Berikut adalah contoh nyata dari pengumuman OpenAI. Anda menempelkan email yang berbunyi: "Terima kasih lagi karena sudah bertemu hari ini. (...) Sebagai referensi, file proyek tercantum di bawah 4829-1037-5581. Jika ada perubahan di pihak Anda, jangan ragu untuk membalas di sini di [email protected] atau hubungi saya di +1 (415) 555-0124.." Privacy Filter mengembalikan: "Terima kasih lagi karena sudah bertemu hari ini (...) Sebagai referensi, file proyek tercantum di bawah [ACCOUNT_NUMBER]. Jika ada perubahan di pihak Anda, jangan ragu untuk membalas di sini di [PRIVATE_EMAIL] atau hubungi saya di [PRIVATE_PHONE]." Alih-alih berurusan dengan kotak hitam dan spidol, alat ini mengubah teks yang sebenarnya. Banyak alat sudah mencoba menangkap nomor telepon dan alamat email. Mereka bekerja dengan mencari pola, seperti "tiga digit, tanda hubung, tiga digit." Itu bagus untuk hal-hal yang jelas, tetapi gagal begitu hal-hal tersebut bergantung pada konteks. Apakah "Annie" adalah nama pribadi atau merek? Apakah "123 Main Street" adalah rumah seseorang atau alamat bisnis di sebuah toko? Pencocokan pola tidak bisa membedakannya. Privacy Filter bisa, karena ia benar-benar membaca kalimat di sekitarnya. Model ini tampaknya cukup baik dalam mendeteksi nuansa tersebut. OpenAI melaporkan bahwa modelnya mencetak skor 96% pada benchmark standar menggunakan dataset PII-Masking-300k secara langsung, dengan versi perbaikan dari tes yang sama meningkatkannya menjadi 97,43%. Dengan kata lain, alat ini berhasil mendeteksi informasi pribadi 96% dari waktu. Tugas Anda, sebagai orang yang sadar privasi, adalah menangani 4% sisanya. Bagian "berjalan secara lokal" adalah poin utamanya Para penggemar privasi mungkin melihat ini sebagai hal yang baik: OpenAI membuat model yang cukup kecil dan kuat untuk dijalankan di mesin Anda, yang berarti teks Anda tidak pernah meninggalkan komputer Anda untuk dibersihkan. Itu penting karena alternatifnya, yang saat ini digunakan oleh sebagian besar perusahaan, adalah mengirim data mentah Anda ke layanan cloud yang mengklaim aman dan kemudian memercayai mereka. Pengaturan itu tidak selalu bertahan lama. Alat ini juga gratis dan sumber terbuka, sehingga peneliti dapat menyelidikinya, meningkatkannya, dan menggunakannya tanpa khawatir akan konsekuensi hukum. Data dibersihkan di laptop Anda, dan hanya versi yang sudah dibersihkan yang dikirim ke tempat lain. Jika Anda menjalankan bisnis kecil, itu berarti Anda dapat menggunakan AI untuk meringkas email pelanggan tanpa memberikan nama pelanggan kepada pihak ketiga. Pengacara lepas dapat memasukkan catatan
Status data✓ Teks lengkap telah diambilBaca artikel asli (Decrypt)
🔍Peristiwa serupa dalam sejarah· Pencocokan kata kunci + aset6 berita
💡 Saat ini menggunakan pencocokan kata kunci + aset (MVP) · Akan ditingkatkan ke pencarian semantik embedding di masa mendatang
Informasi mentah
ID:58aabe8edb
Sumber:Decrypt
Diterbitkan:2026-04-22 15:56:25
Kategori:hot · Kategori ekspor hot
Aset:Tidak ditentukan
Voting komunitas:+0 /0 · ⭐ 1 Penting · 💬 0 Komentar