본 문서는 영어 원본을 기계 번역한 것입니다. 번역본과 영어 원본 사이에 내용이 상충할 경우 영어 원본이 우선합니다. 영어 원본 보기


가명화 도구: 민감한 데이터 보호

가명화 도구는 입력하는 내용에서 이름, 이메일, 전화번호, 주소, ID, 조직, 날짜, 연령 등 민감한 정보를 감지하고, AI 모델에 도달하기 전에 실제와 유사한 가짜 데이터로 교체하는 온디바이스 개인 데이터 필터입니다. 모델은 귀하의 실제 값을 결코 볼 수 없습니다. 도구 호출이 실행되기 전에 로컬에서 교체된 값이 다시 복원되므로 출력 결과는 정확하게 유지됩니다.

사용 방법

작성창의 전송 버튼 옆에 있는 방패 아이콘을 클릭하세요.

  • 회색: 꺼짐
  • 파란색: 개인 데이터 필터 (표준 개인정보 보호 모드)
  • 청록색: PHI / 제한된 데이터 세트 (HIPAA 등급 필터링)
  • 에메랄드색: PHI / 세이프 하버 (공유 데이터 세트를 위한 엄격한 비식별화)

또는 설정 > 개인정보 > 가명화 도구로 이동하여 기본 모드를 설정할 수 있습니다.

표시 화면

가명화 도구가 활성화되면 작성창 주위에 활성 개인정보 보호 모드와 일치하는 얇은 색상 링이 표시됩니다. 전송하는 각 메시지 아래에는 "🛡 가명화됨 — {count}개 교체"라는 칩이 표시되며, 실제 → 가짜 쌍과 해당 카테고리를 볼 수 있는 링크가 제공됩니다.

예시:

🛡 가명화됨 — 3개 교체

칩을 클릭하면 전체 목록을 확장하고 어떤 교체가 이루어졌는지 확인할 수 있습니다.

개인정보 보호 모드

개인 데이터 필터 (파란색)

일상적인 개인정보 보호를 위한 표준 온디바이스 필터링입니다. 다음 항목을 감지하고 교체합니다:

  • 이름 (성, 이름, 전체 이름)
  • 이메일 주소
  • 전화번호
  • 실제 주소 (도로명, 도시, 주/도)
  • ID 번호 (주민등록번호, 운전면허, 여권 등)
  • 조직 이름 및 법인
  • 날짜 (특정 날짜는 연도 유지)
  • 연령

용도: 일반적인 대화, 브레인스토밍, 개인 정보를 노출하지 않고 문맥 공유.

PHI 제한된 데이터 세트 (청록색)

의료 및 보건 관련 논의를 위한 HIPAA 준수 필터링입니다. 16가지 HIPAA 보호 카테고리를 교체합니다:

  • 개인 이름
  • 주(State)보다 작은 지리적 단위 (도시, 동네, 앞 3자리보다 구체적인 우편번호)
  • 연도를 제외한 모든 날짜 (생년월일, 입원일 등)
  • 전화번호, 이메일 주소, 팩스 번호
  • 의료 기록 번호, 건강 보험 번호, 계좌 번호
  • 차량 번호판 번호
  • 차량 식별 번호
  • 장치 일련번호
  • URL 및 IP 주소
  • 생체 식별자
  • 사진 및 이미지 (마스킹 처리)
  • 기타 고유 식별자 또는 코드

용도: 의료 데이터, 환자 기록, 의학 연구 작업 또는 개인정보를 유지하면서 AI와 함께 사용하려는 HIPAA 규제 콘텐츠.

PHI 세이프 하버 (에메랄드색)

HIPAA의 세이프 하버 규칙(§164.514(b)(2))에 따른 엄격한 비식별화입니다. 개인 또는 가구원을 합리적으로 식별할 수 있는 모든 식별자를 제거합니다:

  • 제한된 데이터 세트의 모든 항목 및 다음 추가 사항:
  • 연도를 제외한 모든 날짜 (생년월일, 입원일 등 — 연도만 남음)
  • 전체 지리적 주소 (도시, 주, 우편번호 — 주/도만 남음)
  • 89세 이상의 연령 ("89+"로 표시)

용도: 연구자와 공유할 데이터 준비, 분석을 위한 비식별 데이터 세트 생성, 또는 데이터 사용 계약이 필요 없는 엄격한 데이터 공유 계약 준수.

다국어 교체

가명화 도구는 문화 및 언어적으로 적절한 대체 값을 생성합니다:

  • 스페인어 이름은 스페인어처럼 들리는 이름으로 유지
  • 일본어 이름은 일본어처럼 들리는 이름으로 유지
  • 아랍어 이름은 아랍어처럼 들리는 이름으로 유지
  • 조직 이름은 현지 관례(Inc., LLC, GmbH, S.A. 등)를 따름
  • 도시 이름은 지리적으로 그럴듯하게 생성

혼합 문자 이름, 중간 이름 이니셜이 있는 CJK 이름, 경칭(Dr., Mr., Ms., Prof. 등) 및 조직 법적 접미사와 같은 복잡한 사례를 처리합니다.

환각 검사기

AI는 때때로 세션의 어떤 교체와도 일치하지 않는 그럴듯한 이름을 지어내기도 합니다. 가명화 도구는 이를 감지하고 경고를 표시합니다: "어시스턴트가 원본 메시지에 없던 이름을 언급했습니다. 이는 지어낸 내용일 수 있으니 사용 전 확인하세요."

이를 통해 모델이 기존 교체 값을 재사용해야 할 때 새로운 가짜 이름을 생성하는 경우를 포착할 수 있습니다.

내부 작동 원리

  1. 감지: 전송을 누르면 가명화 도구가 메시지에서 민감한 패턴을 스캔합니다 (정규식 + ML 기반 감지).
  2. 생성: 감지된 각 값에 대해 동일한 카테고리의 문화적으로 적절한 가짜 값을 생성합니다.
  3. 교체: 모델로 보내기 전에 메시지가 가짜 값으로 다시 작성됩니다.
  4. 저장: 실제 → 가짜 매핑은 세션의 로컬에 유지됩니다. 가명화된 메시지만 전송됩니다.
  5. 복원: 도구(웹 검색, API 호출, 파일 작업)가 실행될 때 실제 값이 복원되어 출력 결과가 정확하고 유용하게 유지됩니다.
  6. 감사: 각 메시지 아래에서 교체 로그를 확인할 수 있습니다.

제한 사항

최초 사용: 가명화 도구를 처음 활성화하면 로컬 감지 모델(수 MB)을 다운로드합니다. 다운로드 중에 진행 상황이 표시됩니다.

iOS 진행 로그: iOS에서는 모델 다운로드 시 작동 중임을 알 수 있도록 하트비트 진행 로그가 표시됩니다.

Perplexity 검색: 가명화 도구는 실제 값이 Perplexity AI로 유출되는 것을 거부합니다. Perplexity 검색에 가명화된 식별자가 포함되어 교체 매핑이 드러날 수 있는 경우, 검색이 차단되며 다음과 같은 설명이 표시됩니다: "가명화 도구가 실제 값 유출을 방지하기 위해 이 검색을 차단했습니다. 민감한 세부 정보 없이 다시 질문하거나, 이 메시지에 대해 가명화 도구를 비활성화하세요."

수동 검토: 가명화 도구는 대부분의 PII 패턴을 포착하지만, 어떤 감지기도 100% 정확할 수는 없습니다. 매우 민감한 데이터의 경우 전송 전에 항상 메시지를 검토하세요.

가용성

가명화 도구는 FREE이며 브라우저 확장 프로그램, 데스크톱 앱(macOS, Windows, Linux), 모바일 앱(iOS, Android) 등 모든 플랫폼에서 작동합니다.

참고 항목


This guide is maintained by the Caiioo team using Slate, our built-in editor.