Ito ay isang machine translation ng orihinal na dokumentong Ingles. Sa kaganapan ng anumang salungatan sa pagitan ng pagsasaling ito at ng orihinal na bersyong Ingles, ang bersyong Ingles ang mangingibabaw. Basahin ang orihinal na bersyong Ingles

Pseudonymizer: Protektahan ang Iyong Sensitibong Data

Ang Pseudonymizer ay isang on-device personal data filter na nakakadetek ng sensitibong impormasyon sa iyong tina-type—mga pangalan, email, numero ng telepono, address, ID, organisasyon, petsa, edad, at marami pang iba—at pinapalitan ang mga ito ng mga makatotohanang pekeng impormasyon bago makarating ang alinman sa mga ito sa AI model. Hindi kailanman makikita ng model ang iyong mga totoong value. Ang mga pagpapalit ay ina-unmask nang lokal bago tumakbo ang mga tool call, kaya nananatiling tumpak ang iyong output.

Paano Ito Gamitin

I-click ang shield icon sa tabi ng send button sa composer.

Gray: Naka-off
Asul: Personal Data Filter (standard privacy mode)
Teal: PHI / Limited Data Set (HIPAA-grade filtering)
Emerald: PHI / Safe Harbor (mahigpit na de-identification para sa mga shared dataset)

O pumunta sa Settings > Privacy > Pseudonymizer upang i-configure ang iyong default mode.

Ang Iyong Makikita

Habang naka-on ang Pseudonymizer, may manipis na may kulay na bilog sa paligid ng composer na tumutugma sa aktibong privacy mode. Sa ilalim ng bawat mensaheng ipapadala mo, may chip na nagpapakita ng "🛡 pseudonymized — {count} substitutions" na may link para makita ang mga pares ng totoo → peke at ang kanilang mga kategorya.

Halimbawa:

🛡 pseudonymized — 3 substitutions

"John Smith" → "Michael Anderson" (person_name)

"[email protected]" → "[email protected]" (email)

"212-555-0147" → "408-555-0092" (phone)

I-click ang chip para i-expand ang buong listahan at makita kung aling mga pagpapalit ang ginawa.

Mga Privacy Mode

Personal Data Filter (Asul)

Standard on-device filtering para sa pang-araw-araw na privacy. Nakakadetek at nagpapalit ng:

Mga Pangalan (una, huli, buo)
Mga Email address
Mga Numero ng telepono
Mga Pisikal na address (kalye, lungsod, estado)
Mga Numero ng ID (SSN, driver's license, passport, atbp.)
Mga Pangalan ng organisasyon at legal entities
Mga Petsa (ang mga partikular na petsa ay pinapanatili ang taon)
Mga Edad

Pinakamahusay para sa: Pangkalahatang pag-uusap, brainstorming, pagbabahagi ng konteksto nang hindi inilalantad ang mga personal na detalye.

PHI Limited Data Set (Teal)

HIPAA-compliant filtering para sa mga talakayang pangkalusugan at medikal. Pinapalitan ang 16 na kategoryang protektado ng HIPAA:

Mga pangalan ng indibidwal
Mga geographic subdivision na mas maliit sa estado (lungsod, neighborhood, mga ZIP code na mas partikular kaysa sa unang 3 digit)
Lahat ng petsa maliban sa taon (taon ng kapanganakan, taon ng pagkaka-admit, atbp.)
Mga numero ng telepono, email address, fax number
Mga numero ng medical record, numero ng health insurance, numero ng account
Mga numero ng license plate
Mga vehicle identifier
Mga device serial number
Mga URL at IP address
Mga biometric identifier
Mga larawan at imahe (naka-mask)
Anumang natatanging identifier o code

Pinakamahusay para sa: Paggawa gamit ang data ng pangangalagang pangkalusugan, mga record ng pasyente, medikal na pananaliksik, o anumang HIPAA-regulated na nilalaman na gusto mong panatilihing pribado ngunit gagamitin pa rin sa AI.

PHI Safe Harbor (Emerald)

Mahigpit na de-identification sa ilalim ng Safe Harbor rule ng HIPAA (§164.514(b)(2)). Tinatanggal nito ang lahat ng identifier na maaaring makatwirang makakilala sa isang indibidwal o sa mga miyembro ng kanilang sambahayan:

Lahat ng nasa Limited Data Set, pati na rin ang:
Lahat ng petsa maliban sa taon (mga petsa ng kapanganakan, petsa ng pagkaka-admit, atbp. — taon lamang ang natitira)
Buong geographic address (lungsod, estado, ZIP — estado lamang ang natitira)
Mga edad na higit sa 89 (ipinapakita bilang "89+")

Pinakamahusay para sa: Paghahanda ng data para sa pagbabahagi sa mga mananaliksik, paggawa ng mga de-identified dataset para sa pagsusuri, o pagsunod sa mga mahigpit na kasunduan sa pagbabahagi ng data na hindi nangangailangan ng Data Use Agreement.

Mga Multilingual na Pagpapalit

Ang Pseudonymizer ay bumubuo ng mga kapalit na angkop sa kultura at wika:

Ang mga pangalang Espanyol ay nananatiling tunog-Espanyol
Ang mga pangalang Hapon ay nananatiling tunog-Hapon
Ang mga pangalang Arabe ay nananatiling tunog-Arabe
Ang mga pangalan ng organisasyon ay sumusunod sa mga kombensyon ng lokalidad (Inc., LLC, GmbH, S.A., atbp.)
Ang mga pangalan ng lungsod ay heograpikal na kapani-paniwala

Pinamamahalaan nito ang mga kumplikadong kaso: mga pangalang may halong script, mga pangalang CJK na may middle initials, mga honorific (Dr., Mr., Ms., Prof., atbp.), at mga legal na suffix ng organisasyon.

Hallucination Inspector

Ang AI ay minsan nag-iimbento ng mga makatotohanang tunog na pangalan na hindi tumutugma sa anumang pagpapalit sa iyong session. Nakikita ito ng Pseudonymizer at minamarkahan ang mga ito ng babala: "Ang assistant ay nagbanggit ng mga pangalan na wala sa iyong orihinal na mensahe. Ang mga ito ay maaaring gawa-gawa lamang. Suriin ang mga ito bago gamitin."

Tinutulungan ka nitong mahuli ang mga kaso kung saan ang model ay bumuo ng mga bagong pekeng pangalan sa halip na muling gamitin ang iyong mga pagpapalit.

Paano Ito Gumagana sa Likod ng mga Eksena

Detection: Kapag pinindot mo ang send, ini-scan ng Pseudonymizer ang iyong mensahe para sa mga sensitibong pattern (regex + ML-backed detection).
Generation: Para sa bawat nakitang value, bumubuo ito ng angkop sa kulturang peke sa parehong kategorya.
Substitution: Ang iyong mensahe ay muling isusulat gamit ang mga peke bago ipadala sa model.
Storage: Ang mapping na totoo → peke ay nananatiling lokal sa iyong session. Ang pseudonymized na mensahe lamang ang ipapadala.
Unmasking: Kapag tumakbo ang mga tool (web search, API calls, file operations), ang mga totoong value ay ibinabalik upang ang iyong output ay manatiling tumpak at magagamit.
Audit: Makikita mo ang substitution log sa ilalim ng bawat mensahe.

Mga Limitasyon

Unang beses na paggamit: Sa unang pagkakataon na i-enable mo ang Pseudonymizer, magda-download ito ng lokal na detector model (ilang MB). Ipinapakita ang progreso habang nagda-download ito.

iOS progress logging: Sa iOS, ang pag-download ng model ay nagpapakita ng heartbeat progress log para malaman mong gumagana ito.

Mga paghahanap sa Perplexity: Ang Pseudonymizer ay tumatangging mag-leak ng mga totoong value sa Perplexity AI. Kung ang isang paghahanap sa Perplexity ay maglalaman ng mga pseudonymized identifier (na maaaring magbunyag ng substitution mapping), ang paghahanap ay iba-block na may malinaw na paliwanag: "Bina-block ng Pseudonymizer ang paghahanap na ito upang maiwasan ang pag-leak ng mga totoong value. Subukang mag-rephrase nang walang sensitibong detalye, o i-disable ang Pseudonymizer para sa mensaheng ito."

Manual na pagsusuri: Nahuhuli ng Pseudonymizer ang karamihan sa mga PII pattern, ngunit walang detector ang 100% tumpak. Para sa napakasensitibong data, laging suriin ang mensahe bago ipadala.

Availability

Ang Pseudonymizer ay libre at gumagana sa lahat ng platform: browser extension, desktop app (macOS, Windows, Linux), at mga mobile app (iOS, Android).

Tingnan Din

Privacy at Data — Paano iniimbak at pinangangasiwaan ang data
Platform at Setup — Pseudonymizer sa bawat platform
Settings > Privacy — I-configure ang mga default ng Pseudonymizer

This guide is maintained by the Caiioo team using Slate, our built-in editor.