본 문서는 영어 원본을 기계 번역한 것입니다. 번역본과 영어 원본 사이에 내용이 상충할 경우 영어 원본이 우선합니다. 영어 원본 보기

가명화 도구: 민감한 데이터 보호

가명화 도구는 입력하는 내용에서 이름, 이메일, 전화번호, 주소, ID, 조직, 날짜, 연령 등 민감한 정보를 감지하고, AI 모델에 도달하기 전에 실제와 유사한 가짜 데이터로 교체하는 온디바이스 개인 데이터 필터입니다. 모델은 귀하의 실제 값을 결코 볼 수 없습니다. 도구 호출이 실행되기 전에 로컬에서 교체된 값이 다시 복원되므로 출력 결과는 정확하게 유지됩니다.

사용 방법

작성창의 전송 버튼 옆에 있는 방패 아이콘을 클릭하세요.

회색: 꺼짐
파란색: 개인 데이터 필터 (표준 개인정보 보호 모드)
청록색: PHI / 제한된 데이터 세트 (HIPAA 등급 필터링)
에메랄드색: PHI / 세이프 하버 (공유 데이터 세트를 위한 엄격한 비식별화)

또는 설정 > 개인정보 > 가명화 도구로 이동하여 기본 모드를 설정할 수 있습니다.

표시 화면

가명화 도구가 활성화되면 작성창 주위에 활성 개인정보 보호 모드와 일치하는 얇은 색상 링이 표시됩니다. 전송하는 각 메시지 아래에는 "🛡 가명화됨 — {count}개 교체"라는 칩이 표시되며, 실제 → 가짜 쌍과 해당 카테고리를 볼 수 있는 링크가 제공됩니다.

예시:

🛡 가명화됨 — 3개 교체

"홍길동" → "김철수" (person_name)

"[email protected]" → "[email protected]" (email)

"010-1234-5678" → "010-9876-5432" (phone)

칩을 클릭하면 전체 목록을 확장하고 어떤 교체가 이루어졌는지 확인할 수 있습니다.

개인정보 보호 모드

개인 데이터 필터 (파란색)

일상적인 개인정보 보호를 위한 표준 온디바이스 필터링입니다. 다음 항목을 감지하고 교체합니다:

이름 (성, 이름, 전체 이름)
이메일 주소
전화번호
실제 주소 (도로명, 도시, 주/도)
ID 번호 (주민등록번호, 운전면허, 여권 등)
조직 이름 및 법인
날짜 (특정 날짜는 연도 유지)
연령

용도: 일반적인 대화, 브레인스토밍, 개인 정보를 노출하지 않고 문맥 공유.

PHI 제한된 데이터 세트 (청록색)

의료 및 보건 관련 논의를 위한 HIPAA 준수 필터링입니다. 16가지 HIPAA 보호 카테고리를 교체합니다:

개인 이름
주(State)보다 작은 지리적 단위 (도시, 동네, 앞 3자리보다 구체적인 우편번호)
연도를 제외한 모든 날짜 (생년월일, 입원일 등)
전화번호, 이메일 주소, 팩스 번호
의료 기록 번호, 건강 보험 번호, 계좌 번호
차량 번호판 번호
차량 식별 번호
장치 일련번호
URL 및 IP 주소
생체 식별자
사진 및 이미지 (마스킹 처리)
기타 고유 식별자 또는 코드

용도: 의료 데이터, 환자 기록, 의학 연구 작업 또는 개인정보를 유지하면서 AI와 함께 사용하려는 HIPAA 규제 콘텐츠.

PHI 세이프 하버 (에메랄드색)

HIPAA의 세이프 하버 규칙(§164.514(b)(2))에 따른 엄격한 비식별화입니다. 개인 또는 가구원을 합리적으로 식별할 수 있는 모든 식별자를 제거합니다:

제한된 데이터 세트의 모든 항목 및 다음 추가 사항:
연도를 제외한 모든 날짜 (생년월일, 입원일 등 — 연도만 남음)
전체 지리적 주소 (도시, 주, 우편번호 — 주/도만 남음)
89세 이상의 연령 ("89+"로 표시)

용도: 연구자와 공유할 데이터 준비, 분석을 위한 비식별 데이터 세트 생성, 또는 데이터 사용 계약이 필요 없는 엄격한 데이터 공유 계약 준수.

다국어 교체

가명화 도구는 문화 및 언어적으로 적절한 대체 값을 생성합니다:

스페인어 이름은 스페인어처럼 들리는 이름으로 유지
일본어 이름은 일본어처럼 들리는 이름으로 유지
아랍어 이름은 아랍어처럼 들리는 이름으로 유지
조직 이름은 현지 관례(Inc., LLC, GmbH, S.A. 등)를 따름
도시 이름은 지리적으로 그럴듯하게 생성

혼합 문자 이름, 중간 이름 이니셜이 있는 CJK 이름, 경칭(Dr., Mr., Ms., Prof. 등) 및 조직 법적 접미사와 같은 복잡한 사례를 처리합니다.

환각 검사기

AI는 때때로 세션의 어떤 교체와도 일치하지 않는 그럴듯한 이름을 지어내기도 합니다. 가명화 도구는 이를 감지하고 경고를 표시합니다: "어시스턴트가 원본 메시지에 없던 이름을 언급했습니다. 이는 지어낸 내용일 수 있으니 사용 전 확인하세요."

이를 통해 모델이 기존 교체 값을 재사용해야 할 때 새로운 가짜 이름을 생성하는 경우를 포착할 수 있습니다.

내부 작동 원리

감지: 전송을 누르면 가명화 도구가 메시지에서 민감한 패턴을 스캔합니다 (정규식 + ML 기반 감지).
생성: 감지된 각 값에 대해 동일한 카테고리의 문화적으로 적절한 가짜 값을 생성합니다.
교체: 모델로 보내기 전에 메시지가 가짜 값으로 다시 작성됩니다.
저장: 실제 → 가짜 매핑은 세션의 로컬에 유지됩니다. 가명화된 메시지만 전송됩니다.
복원: 도구(웹 검색, API 호출, 파일 작업)가 실행될 때 실제 값이 복원되어 출력 결과가 정확하고 유용하게 유지됩니다.
감사: 각 메시지 아래에서 교체 로그를 확인할 수 있습니다.

제한 사항

최초 사용: 가명화 도구를 처음 활성화하면 로컬 감지 모델(수 MB)을 다운로드합니다. 다운로드 중에 진행 상황이 표시됩니다.

iOS 진행 로그: iOS에서는 모델 다운로드 시 작동 중임을 알 수 있도록 하트비트 진행 로그가 표시됩니다.

Perplexity 검색: 가명화 도구는 실제 값이 Perplexity AI로 유출되는 것을 거부합니다. Perplexity 검색에 가명화된 식별자가 포함되어 교체 매핑이 드러날 수 있는 경우, 검색이 차단되며 다음과 같은 설명이 표시됩니다: "가명화 도구가 실제 값 유출을 방지하기 위해 이 검색을 차단했습니다. 민감한 세부 정보 없이 다시 질문하거나, 이 메시지에 대해 가명화 도구를 비활성화하세요."

수동 검토: 가명화 도구는 대부분의 PII 패턴을 포착하지만, 어떤 감지기도 100% 정확할 수는 없습니다. 매우 민감한 데이터의 경우 전송 전에 항상 메시지를 검토하세요.

가용성

가명화 도구는 FREE이며 브라우저 확장 프로그램, 데스크톱 앱(macOS, Windows, Linux), 모바일 앱(iOS, Android) 등 모든 플랫폼에서 작동합니다.

참고 항목

개인정보 및 데이터 — 데이터 저장 및 처리 방식
플랫폼 및 설정 — 모든 플랫폼에서의 가명화 도구
설정 > 개인정보 — 가명화 도구 기본값 구성

This guide is maintained by the Caiioo team using Slate, our built-in editor.