본 문서는 영어 원본을 기계 번역한 것입니다. 번역본과 영어 원본 사이에 내용이 상충할 경우 영어 원본이 우선합니다. 영어 원본 보기
가명화 도구: 민감한 데이터 보호
가명화 도구는 입력하는 내용에서 이름, 이메일, 전화번호, 주소, ID, 조직, 날짜, 연령 등 민감한 정보를 감지하고, AI 모델에 도달하기 전에 실제와 유사한 가짜 데이터로 교체하는 온디바이스 개인 데이터 필터입니다. 모델은 귀하의 실제 값을 결코 볼 수 없습니다. 도구 호출이 실행되기 전에 로컬에서 교체된 값이 다시 복원되므로 출력 결과는 정확하게 유지됩니다.
사용 방법
작성창의 전송 버튼 옆에 있는 방패 아이콘을 클릭하세요.
- 회색: 꺼짐
- 파란색: 개인 데이터 필터 (표준 개인정보 보호 모드)
- 청록색: PHI / 제한된 데이터 세트 (HIPAA 등급 필터링)
- 에메랄드색: PHI / 세이프 하버 (공유 데이터 세트를 위한 엄격한 비식별화)
또는 설정 > 개인정보 > 가명화 도구로 이동하여 기본 모드를 설정할 수 있습니다.
표시 화면
가명화 도구가 활성화되면 작성창 주위에 활성 개인정보 보호 모드와 일치하는 얇은 색상 링이 표시됩니다. 전송하는 각 메시지 아래에는 "🛡 가명화됨 — {count}개 교체"라는 칩이 표시되며, 실제 → 가짜 쌍과 해당 카테고리를 볼 수 있는 링크가 제공됩니다.
예시:
🛡 가명화됨 — 3개 교체
- "홍길동" → "김철수" (person_name)
- "[email protected]" → "[email protected]" (email)
- "010-1234-5678" → "010-9876-5432" (phone)
칩을 클릭하면 전체 목록을 확장하고 어떤 교체가 이루어졌는지 확인할 수 있습니다.
개인정보 보호 모드
개인 데이터 필터 (파란색)
일상적인 개인정보 보호를 위한 표준 온디바이스 필터링입니다. 다음 항목을 감지하고 교체합니다:
- 이름 (성, 이름, 전체 이름)
- 이메일 주소
- 전화번호
- 실제 주소 (도로명, 도시, 주/도)
- ID 번호 (주민등록번호, 운전면허, 여권 등)
- 조직 이름 및 법인
- 날짜 (특정 날짜는 연도 유지)
- 연령
용도: 일반적인 대화, 브레인스토밍, 개인 정보를 노출하지 않고 문맥 공유.
PHI 제한된 데이터 세트 (청록색)
의료 및 보건 관련 논의를 위한 HIPAA 준수 필터링입니다. 16가지 HIPAA 보호 카테고리를 교체합니다:
- 개인 이름
- 주(State)보다 작은 지리적 단위 (도시, 동네, 앞 3자리보다 구체적인 우편번호)
- 연도를 제외한 모든 날짜 (생년월일, 입원일 등)
- 전화번호, 이메일 주소, 팩스 번호
- 의료 기록 번호, 건강 보험 번호, 계좌 번호
- 차량 번호판 번호
- 차량 식별 번호
- 장치 일련번호
- URL 및 IP 주소
- 생체 식별자
- 사진 및 이미지 (마스킹 처리)
- 기타 고유 식별자 또는 코드
용도: 의료 데이터, 환자 기록, 의학 연구 작업 또는 개인정보를 유지하면서 AI와 함께 사용하려는 HIPAA 규제 콘텐츠.
PHI 세이프 하버 (에메랄드색)
HIPAA의 세이프 하버 규칙(§164.514(b)(2))에 따른 엄격한 비식별화입니다. 개인 또는 가구원을 합리적으로 식별할 수 있는 모든 식별자를 제거합니다:
- 제한된 데이터 세트의 모든 항목 및 다음 추가 사항:
- 연도를 제외한 모든 날짜 (생년월일, 입원일 등 — 연도만 남음)
- 전체 지리적 주소 (도시, 주, 우편번호 — 주/도만 남음)
- 89세 이상의 연령 ("89+"로 표시)
용도: 연구자와 공유할 데이터 준비, 분석을 위한 비식별 데이터 세트 생성, 또는 데이터 사용 계약이 필요 없는 엄격한 데이터 공유 계약 준수.
다국어 교체
가명화 도구는 문화 및 언어적으로 적절한 대체 값을 생성합니다:
- 스페인어 이름은 스페인어처럼 들리는 이름으로 유지
- 일본어 이름은 일본어처럼 들리는 이름으로 유지
- 아랍어 이름은 아랍어처럼 들리는 이름으로 유지
- 조직 이름은 현지 관례(Inc., LLC, GmbH, S.A. 등)를 따름
- 도시 이름은 지리적으로 그럴듯하게 생성
혼합 문자 이름, 중간 이름 이니셜이 있는 CJK 이름, 경칭(Dr., Mr., Ms., Prof. 등) 및 조직 법적 접미사와 같은 복잡한 사례를 처리합니다.
환각 검사기
AI는 때때로 세션의 어떤 교체와도 일치하지 않는 그럴듯한 이름을 지어내기도 합니다. 가명화 도구는 이를 감지하고 경고를 표시합니다: "어시스턴트가 원본 메시지에 없던 이름을 언급했습니다. 이는 지어낸 내용일 수 있으니 사용 전 확인하세요."
이를 통해 모델이 기존 교체 값을 재사용해야 할 때 새로운 가짜 이름을 생성하는 경우를 포착할 수 있습니다.
내부 작동 원리
- 감지: 전송을 누르면 가명화 도구가 메시지에서 민감한 패턴을 스캔합니다 (정규식 + ML 기반 감지).
- 생성: 감지된 각 값에 대해 동일한 카테고리의 문화적으로 적절한 가짜 값을 생성합니다.
- 교체: 모델로 보내기 전에 메시지가 가짜 값으로 다시 작성됩니다.
- 저장: 실제 → 가짜 매핑은 세션의 로컬에 유지됩니다. 가명화된 메시지만 전송됩니다.
- 복원: 도구(웹 검색, API 호출, 파일 작업)가 실행될 때 실제 값이 복원되어 출력 결과가 정확하고 유용하게 유지됩니다.
- 감사: 각 메시지 아래에서 교체 로그를 확인할 수 있습니다.
제한 사항
최초 사용: 가명화 도구를 처음 활성화하면 로컬 감지 모델(수 MB)을 다운로드합니다. 다운로드 중에 진행 상황이 표시됩니다.
iOS 진행 로그: iOS에서는 모델 다운로드 시 작동 중임을 알 수 있도록 하트비트 진행 로그가 표시됩니다.
Perplexity 검색: 가명화 도구는 실제 값이 Perplexity AI로 유출되는 것을 거부합니다. Perplexity 검색에 가명화된 식별자가 포함되어 교체 매핑이 드러날 수 있는 경우, 검색이 차단되며 다음과 같은 설명이 표시됩니다: "가명화 도구가 실제 값 유출을 방지하기 위해 이 검색을 차단했습니다. 민감한 세부 정보 없이 다시 질문하거나, 이 메시지에 대해 가명화 도구를 비활성화하세요."
수동 검토: 가명화 도구는 대부분의 PII 패턴을 포착하지만, 어떤 감지기도 100% 정확할 수는 없습니다. 매우 민감한 데이터의 경우 전송 전에 항상 메시지를 검토하세요.
가용성
가명화 도구는 FREE이며 브라우저 확장 프로그램, 데스크톱 앱(macOS, Windows, Linux), 모바일 앱(iOS, Android) 등 모든 플랫폼에서 작동합니다.
참고 항목
- 개인정보 및 데이터 — 데이터 저장 및 처리 방식
- 플랫폼 및 설정 — 모든 플랫폼에서의 가명화 도구
- 설정 > 개인정보 — 가명화 도구 기본값 구성
This guide is maintained by the Caiioo team using Slate, our built-in editor.