OpenAI 방금 ChatGPT가 비밀을 확인하기 전에 이를 삭제하는 도구를 오픈소스로 공개했습니다

📄전체 원문· trafilatura에 의해 자동 추출됨Gemini 翻譯5157 자

요약 - OpenAI는 GitHub와 Hugging Face를 통해 Apache 2.0 라이선스로 Privacy Filter를 공개했습니다. - 15억 개의 파라미터를 가진 이 모델은 로컬에서 실행되며 이름, 주소, 비밀번호 등을 마스킹합니다. - 표준 PII-Masking-300k 벤치마크에서 즉시 사용 가능한 상태로 96%의 F1 점수를 기록했습니다. 매일 수백만 명의 사람들이 ChatGPT에 공유해서는 안 될 정보를 입력합니다. 세금 신고서, 의료 기록, 고객 이름이 포함된 업무용 이메일, 민감한 건강 정보, 다음 주에 변경하겠다고 다짐했던 API key 등이 그 예입니다. OpenAI는 챗봇이 정보를 확인하기 전에 이 모든 것을 정리해 주는 무료 도구를 출시했습니다. 이 도구의 이름은 Privacy Filter이며, 이번 주 Apache 2.0 라이선스로 출시되었습니다. 즉, 누구나 다운로드하여 사용하고 수정할 수 있으며, 이를 기반으로 제품을 만들어 판매할 수도 있습니다. 이 모델은 Hugging Face와 GitHub에 공개되어 있으며, 15억 개의 파라미터(모델의 지식 범위를 측정하는 지표)를 가지고 있어 일반 노트북에서도 실행될 만큼 가볍습니다. 이것을 개인정보 보호를 위한 맞춤법 검사기라고 생각하면 됩니다. 텍스트 블록을 입력하면, 민감한 정보가 [PRIVATE_PERSON]이나 [ACCOUNT_NUMBER]와 같은 일반적인 자리 표시자로 대체된 텍스트를 돌려줍니다. 과거 Donald Trump 행정부가 검은색 마커로 비밀을 가리려다 Jeffrey Epstein 파일의 일부가 복구되었던 사건을 기억하시나요? 만약 그들이 이 모델을 사용했다면 그런 문제는 발생하지 않았을 것입니다. OpenAI의 Privacy Filter가 실제로 하는 일 Privacy Filter는 이름, 주소, 이메일, 전화번호, URL, 날짜, 계좌 번호, 그리고 비밀번호나 API key와 같은 보안 정보 등 8가지 범주의 개인정보를 스캔합니다. 텍스트 전체를 한 번에 읽은 뒤 민감한 부분을 태그하여 마스킹하거나 삭제할 수 있도록 합니다. OpenAI의 발표에 나온 실제 예시를 보겠습니다. 다음과 같은 이메일을 입력하면: "Thanks again for meeting earlier today. (...) For reference, the project file is listed under 4829-1037-5581. If anything changes on your side, feel free to reply here at [email protected] or call me at +1 (415) 555-0124.." Privacy Filter는 다음과 같이 출력합니다: "Thanks again for meeting earlier today (...) For reference, the project file is listed under [ACCOUNT_NUMBER]. If anything changes on your side, feel free to reply here at [PRIVATE_EMAIL] or call me at [PRIVATE_PHONE]." 검은 상자나 마커로 가리는 대신, 실제 텍스트를 변경하는 방식입니다. 이미 전화번호나 이메일 주소를 찾아내는 도구는 많습니다. 이런 도구들은 "숫자 3자리, 대시, 숫자 3자리"와 같은 패턴을 찾는 방식으로 작동합니다. 명확한 정보에는 효과적이지만, 문맥에 따라 의미가 달라지는 순간 한계를 드러냅니다. "Annie"가 사람 이름일까요, 아니면 브랜드 이름일까요? "123 Main Street"는 개인의 집일까요, 아니면 상점의 사업장 주소일까요? 패턴 매칭으로는 알 수 없습니다. 하지만 Privacy Filter는 주변 문장을 읽기 때문에 이를 구분할 수 있습니다. 이 모델은 이러한 미묘한 차이를 감지하는 데 꽤 능숙한 것으로 보입니다. OpenAI는 이 모델이 PII-Masking-300k 데이터셋을 사용한 표준 벤치마크에서 즉시 사용 가능한 상태로 96%의 점수를 기록했으며, 동일한 테스트의 수정 버전을 적용했을 때는 97.43%까지 성능이 향상되었다고 보고했습니다. 즉, 96%의 확률로 개인정보를 성공적으로 감지한다는 뜻입니다. 개인정보를 중요하게 생각하는 사용자라면 나머지 4%를 직접 관리해야 합니다. "로컬 실행"이 핵심인 이유 개인정보 보호에 민감한 사람들은 이를 긍정적으로 평가할 것입니다. OpenAI는 모델을 작고 강력하게 만들어 사용자의 기기에서 직접 실행할 수 있게 했습니다. 즉, 텍스트가 정리되는 동안 컴퓨터 밖으로 나가지 않는다는 뜻입니다. 이는 매우 중요합니다. 대부분의 기업이 현재 사용하는 방식은 원본 데이터를 안전

데이터 상태✓ 전체 내용 추출 완료원문 읽기 (Decrypt)

🔍과거 유사 사건· 키워드 + 종목 매칭6 건

2026-04-30

OpenAI, ChatGPT 사용자들을 위한 고급 계정 보안 기능 출시

유사도 170%關鍵字 chatgpt/openai同分類 hot

2026-04-30

OpenAI 마침내 ChatGPT가 Goblins에 대해 멈추지 않고 이야기했던 이유를 설명하다

유사도 130%關鍵字 chatgpt/openai

2026-04-29

Google과 Microsoft는 AI 트레이드가 여전히 건재함을 입증했고, OpenAI는 긴장하고 있다

유사도 130%關鍵字 just/openai

2026-04-29