本文档由英文原版机器翻译而成。如果翻译版本与英文原版之间存在任何冲突,请以英文原版为准。 阅读英文原版
脱敏器:保护您的敏感数据
脱敏器是一个设备端的个人数据过滤器,它可以检测您输入内容中的敏感信息——包括姓名、电子邮件、电话号码、地址、身份证件、组织机构、日期、年龄等——并在这些信息到达 AI 模型之前将其替换为真实的虚假信息。模型永远不会看到您的真实数值。在运行工具调用之前,替换内容会在本地还原,因此您的输出仍能保持准确。
如何使用
点击输入框中发送按钮旁的盾牌图标。
- 灰色: 关闭
- 蓝色: 个人数据过滤器(标准隐私模式)
- 青色: PHI / 限定数据集(HIPAA 级过滤)
- 翡翠绿: PHI / 安全港(针对共享数据集的严格去标识化)
或者前往 设置 > 隐私 > 脱敏器 来配置您的默认模式。
您所看到的
当脱敏器开启时,输入框周围会出现一圈细色环,其颜色与激活的隐私模式相匹配。在您发送的每条消息下方,会显示一个标签“🛡 已脱敏 — {count} 处替换”,并附有查看 真实 → 虚假 对应关系及其类别的链接。
示例:
🛡 已脱敏 — 3 处替换
- "John Smith" → "Michael Anderson" (person_name)
- "[email protected]" → "[email protected]" (email)
- "212-555-0147" → "408-555-0092" (phone)
点击该标签可展开完整列表,查看具体进行了哪些替换。
隐私模式
个人数据过滤器 (蓝色)
用于日常隐私的标准设备端过滤。检测并替换:
- 姓名(名、姓、全名)
- 电子邮件地址
- 电话号码
- 物理地址(街道、城市、州/省)
- 证件号码(社会安全号码、驾照、护照等)
- 组织名称和法律实体
- 日期(特定日期保留年份)
- 年龄
最适用于: 普通对话、头脑风暴、在不暴露个人细节的情况下分享上下文。
PHI 限定数据集 (青色)
符合 HIPAA 标准的过滤,用于医疗保健和医学讨论。替换 16 类受 HIPAA 保护的信息:
- 个人姓名
- 小于州/省的地理细分(城市、社区、比前 3 位更具体的邮政编码)
- 除年份外的所有日期(出生年份、入院年份等)
- 电话号码、电子邮件地址、传真号码
- 病历号、医疗保险号、账号
- 车牌号
- 车辆识别码
- 设备序列号
- URL 和 IP 地址
- 生物识别标识符
- 照片和图像(已遮盖)
- 任何唯一的标识符或代码
最适用于: 处理医疗数据、患者记录、医学研究,或任何您希望保持私密但仍需配合 AI 使用的受 HIPAA 监管的内容。
PHI 安全港 (翡翠绿)
根据 HIPAA 安全港规则 (§164.514(b)(2)) 进行的严格去标识化。这将移除所有可能合理识别个人或其家庭成员的标识符:
- 限定数据集中的所有内容,外加:
- 除年份外的所有日期(出生日期、入院日期等——仅保留年份)
- 完整的地理地址(城市、州、邮编——仅保留州)
- 89 岁以上的年龄(显示为 "89+")
最适用于: 准备与研究人员共享的数据、创建用于分析的去标识化数据集,或遵守不需要数据使用协议的严格数据共享协议。
多语言替换
脱敏器会生成符合文化和语言习惯的替代品:
- 西班牙语姓名 保持西班牙语风格
- 日语姓名 保持日语风格
- 阿拉伯语姓名 保持阿拉伯语风格
- 组织名称遵循当地惯例(Inc.、LLC、GmbH、S.A. 等)
- 城市名称在地理上具有合理性
处理复杂情况:混合脚本姓名、带中间名首字母的 CJK 姓名、头衔(医生、先生、女士、教授等)以及组织法律后缀。
幻觉检查器
AI 有时会虚构一些听起来很真实但与您会话中任何替换项都不匹配的名字。脱敏器会检测到这些并发出警告:“助手提到了您原始消息中没有的名字。这些可能是虚构的。请在使用前检查。”
这可以帮助您发现模型在应该重用您的替换项时却生成了新的虚假名字的情况。
幕后工作原理
- 检测: 当您点击发送时,脱敏器会扫描您的消息以查找敏感模式(正则表达式 + 机器学习支持的检测)。
- 生成: 对于每个检测到的数值,它会生成一个相同类别的、符合文化习惯的虚假值。
- 替换: 您的消息在发送给模型之前会被虚假值重写。
- 存储: 真实 → 虚假的映射保存在您本地的会话中。只有脱敏后的消息会被发送。
- 还原: 当工具运行(网页搜索、API 调用、文件操作)时,真实数值会被恢复,以确保您的输出准确可用。
- 审计: 您可以在每条消息下方看到替换日志。
局限性
首次使用: 首次启用脱敏器时,它会下载一个本地检测模型(几 MB)。下载时会显示进度。
iOS 进度日志: 在 iOS 上,模型下载会显示心跳进度日志,以便您了解其正在运行。
Perplexity 搜索: 脱敏器拒绝向 Perplexity AI 泄露真实数值。如果 Perplexity 搜索包含已脱敏的标识符(这可能会暴露替换映射),搜索将被阻止并附带清晰的解释:“脱敏器阻止了此搜索以防止泄露真实数值。请尝试在不包含敏感细节的情况下重新表述,或针对此消息禁用脱敏器。”
人工复核: 脱敏器能捕捉大多数 PII 模式,但没有任何检测器是 100% 准确的。对于高度敏感的数据,请务必在发送前检查消息。
可用性
脱敏器是免费的,且适用于所有平台:浏览器扩展、桌面应用(macOS、Windows、Linux)以及移动应用(iOS、Android)。
另请参阅
This guide is maintained by the Caiioo team using Slate, our built-in editor.