Данный документ является машинным переводом оригинальной английской версии. В случае любых расхождений между переводом и оригиналом на английском языке, приоритет имеет английская версия. Читать оригинал на английском языке
Псевдонимизатор: защитите свои конфиденциальные данные
Псевдонимизатор — это работающий на устройстве фильтр личных данных, который обнаруживает конфиденциальную информацию в том, что вы печатаете (имена, электронную почту, номера телефонов, адреса, идентификаторы, организации, даты, возраст и многое другое), и заменяет их реалистичными подделками до того, как данные попадут в модель ИИ. Модель никогда не видит ваши реальные данные. Подстановки раскрываются локально перед выполнением вызовов инструментов, поэтому результат остается точным.
Как им пользоваться
Нажмите на иконку щита рядом с кнопкой отправки в поле ввода.
- Серый: Выключено
- Синий: Фильтр личных данных (стандартный режим конфиденциальности)
- Бирюзовый: PHI / Ограниченный набор данных (фильтрация уровня HIPAA)
- Изумрудный: PHI / Safe Harbor (строгая деидентификация для общих наборов данных)
Или перейдите в Настройки > Конфиденциальность > Псевдонимизатор, чтобы настроить режим по умолчанию.
Что вы видите
Когда Псевдонимизатор включен, тонкое цветное кольцо вокруг поля ввода соответствует активному режиму конфиденциальности. Под каждым отправленным вами сообщением отображается плашка «🛡 псевдонимизировано — подстановок: {count}» со ссылкой для просмотра пар «реальное → поддельное» и их категорий.
Пример:
🛡 псевдонимизировано — 3 подстановки
- "Иван Иванов" → "Михаил Андреев" (person_name)
- "[email protected]" → "[email protected]" (email)
- "212-555-0147" → "408-555-0092" (phone)
Нажмите на плашку, чтобы развернуть полный список и увидеть, какие замены были произведены.
Режимы конфиденциальности
Фильтр личных данных (Синий)
Стандартная фильтрация на устройстве для повседневной конфиденциальности. Обнаруживает и заменяет:
- Имена (имя, фамилия, полное имя)
- Адреса электронной почты
- Номера телефонов
- Физические адреса (улица, город, штат/область)
- Номера удостоверений (номер соцстрахования, водительские права, паспорт и т. д.)
- Названия организаций и юридических лиц
- Даты (конкретные даты сохраняют год)
- Возраст
Лучше всего подходит для: обычных разговоров, мозгового штурма, обмена контекстом без раскрытия личных данных.
PHI Ограниченный набор данных (Бирюзовый)
Фильтрация, соответствующая требованиям HIPAA, для обсуждений в сфере здравоохранения и медицины. Заменяет 16 категорий, защищенных HIPAA:
- Имена физических лиц
- Географические подразделения меньше штата (город, район, почтовые индексы точнее первых 3 цифр)
- Все даты, кроме года (год рождения, год поступления и т. д.)
- Номера телефонов, адреса электронной почты, номера факсов
- Номера медицинских карт, номера медицинского страхования, номера счетов
- Номера автомобильных знаков
- Идентификаторы транспортных средств
- Серийные номера устройств
- URL-адреса и IP-адреса
- Биометрические идентификаторы
- Фотографии и изображения (скрываются)
- Любые уникальные идентификаторы или коды
Лучше всего подходит для: работы с данными здравоохранения, картами пациентов, медицинскими исследованиями или любым контентом, регулируемым HIPAA, который вы хотите сохранить в тайне, но использовать с ИИ.
PHI Safe Harbor (Изумрудный)
Строгая деидентификация согласно правилу HIPAA Safe Harbor (§164.514(b)(2)). Удаляет все идентификаторы, которые могут обоснованно идентифицировать человека или членов его семьи:
- Все из «Ограниченного набора данных», плюс:
- Все даты, кроме года (даты рождения, даты поступления и т. д. — остается только год)
- Полные географические адреса (город, штат, индекс — остается только штат)
- Возраст старше 89 лет (отображается как «89+»)
Лучше всего подходит для: подготовки данных для передачи исследователям, создания деидентифицированных наборов данных для анализа или соблюдения строгих соглашений об обмене данными.
Многоязычные подстановки
Псевдонимизатор генерирует культурно и лингвистически подходящие замены:
- Испанские имена остаются похожими на испанские
- Японские имена остаются похожими на японские
- Арабские имена остаются похожими на арабские
- Названия организаций следуют местным правилам (Inc., ООО, GmbH, S.A. и т. д.)
- Названия городов географически правдоподобны
Обрабатывает сложные случаи: имена со смешанным письмом, имена CJK с инициалами, обращения (док., г-н, г-жа, проф. и т. д.) и юридические суффиксы организаций.
Инспектор галлюцинаций
ИИ иногда выдумывает реалистично звучащие имена, которые не соответствуют ни одной подстановке в вашей сессии. Псевдонимизатор обнаруживает их и помечает предупреждением: «Ассистент упомянул имена, которых не было в вашем исходном сообщении. Они могут быть вымышленными. Проверьте их перед использованием».
Это помогает отловить случаи, когда модель создала новые вымышленные имена вместо того, чтобы использовать ваши подстановки.
Как это работает за кулисами
- Обнаружение: Когда вы нажимаете «отправить», Псевдонимизатор сканирует ваше сообщение на наличие конфиденциальных шаблонов (регулярные выражения + обнаружение на базе ML).
- Генерация: Для каждого обнаруженного значения он создает культурно подходящую подделку в той же категории.
- Подстановка: Ваше сообщение переписывается с использованием подделок перед отправкой модели.
- Хранение: Сопоставление «реальное → поддельное» остается локально в вашей сессии. Отправляется только псевдонимизированное сообщение.
- Раскрытие: При запуске инструментов (веб-поиск, вызовы API, операции с файлами) реальные значения восстанавливаются, чтобы результат оставался точным и полезным.
- Аудит: Вы видите журнал подстановок под каждым сообщением.
Ограничения
Первое использование: При первом включении Псевдонимизатора он загружает локальную модель детектора (несколько МБ). Во время загрузки отображается прогресс.
Логирование на iOS: На iOS при загрузке модели отображается лог активности, чтобы вы знали, что процесс идет.
Поиск Perplexity: Псевдонимизатор запрещает утечку реальных значений в Perplexity AI. Если поиск Perplexity может содержать псевдонимизированные идентификаторы (которые могут раскрыть схему подстановки), поиск блокируется с четким объяснением: «Псевдонимизатор блокирует этот поиск для предотвращения утечки реальных значений. Попробуйте перефразировать запрос без конфиденциальных деталей или отключите Псевдонимизатор для этого сообщения».
Ручная проверка: Псевдонимизатор улавливает большинство шаблонов PII, но ни один детектор не точен на 100%. Для очень конфиденциальных данных всегда проверяйте сообщение перед отправкой.
Доступность
Псевдонимизатор БЕСПЛАТЕН и работает на всех платформах: расширение для браузера, десктопное приложение (macOS, Windows, Linux) и мобильные приложения (iOS, Android).
См. также
- Конфиденциальность и данные — как данные хранятся и обрабатываются
- Платформа и настройка — Псевдонимизатор на каждой платформе
- Настройки > Конфиденциальность — настройка параметров Псевдонимизатора по умолчанию
This guide is maintained by the Caiioo team using Slate, our built-in editor.