本文件為英文原版的機器翻譯。若翻譯版本與英文原版之間存在任何歧義,概以英文原版為準。 閱讀英文原版


假名化工具:保護您的敏感數據

假名化工具(Pseudonymizer)是一個裝置端個人資料過濾器,可偵測您輸入內容中的敏感資訊——包括姓名、電子郵件、電話號碼、地址、身分證字號、組織、日期、年齡等——並在任何內容到達 AI 模型之前,將其更換為真實的虛構資料。模型永遠不會看到您的真實數值。在執行工具調用之前,替換內容會在本地解除遮蔽,因此您的輸出結果仍能保持準確。

如何使用

點擊編輯器中發送按鈕旁邊的盾牌圖示。

  • 灰色: 關閉
  • 藍色: 個人資料過濾器(標準隱私模式)
  • 青色: PHI / 有限數據集(HIPAA 級別過濾)
  • 翡翠綠: PHI / 安全港(針對共享數據集的嚴格去識別化)

或前往 設定 > 隱私 > 假名化工具 來配置您的預設模式。

您會看到的內容

當假名化工具開啟時,編輯器周圍會出現一圈對應當前隱私模式的細色環。在您發送的每條訊息下方,會顯示一個標籤「🛡 已假名化 — N 個替換」,並附有查看「真實 → 虛構」配對及其類別的連結。

範例:

🛡 已假名化 — 3 個替換

點擊標籤可展開完整列表,查看進行了哪些替換。

隱私模式

個人資料過濾器 (藍色)

用於日常隱私的標準裝置端過濾。偵測並替換:

  • 姓名(姓、名、全名)
  • 電子郵件地址
  • 電話號碼
  • 實體地址(街道、城市、州/省)
  • 身分證件號碼(身分證字號、駕照、護照等)
  • 組織名稱與法人實體
  • 日期(特定日期會保留年份)
  • 年齡

最適用於: 一般對話、腦力激盪、在不暴露個人細節的情況下分享上下文。

PHI 有限數據集 (青色)

符合 HIPAA 標準的過濾,用於醫療保健和醫學討論。替換 16 類受 HIPAA 保護的資訊:

  • 個人姓名
  • 小於州/省的地理分區(城市、社區、比前 3 位更具體的郵遞區號)
  • 除年份以外的所有日期(出生年份、入院年份等)
  • 電話號碼、電子郵件地址、傳真號碼
  • 病歷號碼、健康保險號碼、帳號
  • 車牌號碼
  • 車輛識別碼
  • 裝置序列號
  • URL 和 IP 地址
  • 生物特徵識別碼
  • 照片和圖像(遮蔽)
  • 任何唯一的識別碼或代碼

最適用於: 處理醫療數據、病歷、醫學研究,或任何您希望保持隱私但仍需與 AI 配合使用的 HIPAA 監管內容。

PHI 安全港 (翡翠綠)

根據 HIPAA 安全港規則 (§164.514(b)(2)) 進行的嚴格去識別化。這會移除所有可能合理識別個人或其家庭成員的識別碼:

  • 有限數據集中的所有內容,加上:
  • 除年份以外的所有日期(出生日期、入院日期等——僅保留年份)
  • 完整的地理地址(城市、州、郵遞區號——僅保留州/省)
  • 89 歲以上的年齡(顯示為 "89+")

最適用於: 準備與研究人員共享的數據、創建用於分析的去識別化數據集,或遵守不需要數據使用協議的嚴格數據共享協議。

多語言替換

假名化工具會生成符合文化和語言習慣的替代品:

  • 西班牙語姓名 聽起來仍像西班牙語
  • 日語姓名 聽起來仍像日語
  • 阿拉伯語姓名 聽起來仍像阿拉伯語
  • 組織名稱遵循當地慣例(Inc.、LLC、GmbH、S.A. 等)
  • 城市名稱在地理上是合理的

處理複雜情況:混合腳本姓名、帶有中間名首字母的 CJK 姓名、尊稱(醫生、先生、女士、教授等)以及組織法律後綴。

幻覺檢查員

AI 有時會編造聽起來很真實但與您對話中的任何替換都不匹配的姓名。假名化工具會偵測到這些並發出警告:「助手提到了您原始訊息中沒有的姓名。這些可能是編造的。請在使用前檢查。」

這能幫助您發現模型在應該重複使用您的替換內容時,卻生成了新的虛構姓名的情況。

幕後運作原理

  1. 偵測: 當您點擊發送時,假名化工具會掃描您的訊息以尋找敏感模式(正則表達式 + 機器學習偵測)。
  2. 生成: 對於每個偵測到的數值,它會在相同類別中生成一個符合文化的虛構資料。
  3. 替換: 您的訊息在發送到模型之前會被虛構資料重寫。
  4. 儲存: 「真實 → 虛構」的映射保留在您的本地對話中。僅發送假名化後的訊息。
  5. 解除遮蔽: 當執行工具(網頁搜尋、API 調用、檔案操作)時,會還原真實數值,以便您的輸出保持準確且可用。
  6. 稽核: 您可以在每條訊息下方看到替換日誌。

限制

首次使用: 第一次啟用假名化工具時,它會下載一個本地偵測模型(約幾 MB)。下載時會顯示進度。

iOS 進度日誌: 在 iOS 上,模型下載會顯示心跳進度日誌,讓您知道它正在運作。

Perplexity 搜尋: 假名化工具拒絕向 Perplexity AI 洩漏真實數值。如果 Perplexity 搜尋包含假名化的識別碼(這可能會揭露替換映射),搜尋將被攔截並給出明確解釋:「假名化工具攔截了此搜尋以防止洩漏真實數值。請嘗試在不包含敏感細節的情況下重新表述,或針對此訊息停用假名化工具。」

人工審查: 假名化工具能捕捉大多數 PII 模式,但沒有任何偵測器是 100% 準確的。對於高度敏感的數據,請務必在發送前檢查訊息。

可用性

假名化工具是免費的,且適用於所有平台:瀏覽器擴充功能、桌面應用程式(macOS、Windows、Linux)以及行動應用程式(iOS、Android)。

延伸閱讀

  • 隱私與數據 — 數據的儲存與處理方式
  • 平台與設定 — 每個平台上的假名化工具
  • 設定 > 隱私 — 配置假名化工具預設值

This guide is maintained by the Caiioo team using Slate, our built-in editor.