Ceci est une traduction automatique du document original en anglais. En cas de divergence entre cette traduction et la version originale anglaise, la version anglaise fera foi. Consulter la version originale en anglais
Pseudonymiseur : Protégez vos données sensibles
Le Pseudonymiseur est un filtre de données personnelles sur l'appareil qui détecte les informations sensibles dans ce que vous tapez — noms, e-mails, numéros de téléphone, adresses, identifiants, organisations, dates, âges, et plus encore — et les remplace par des faux réalistes avant que quoi que ce soit ne parvienne au modèle d'IA. Le modèle ne voit jamais vos vraies valeurs. Les substitutions sont démasquées localement avant l'exécution des appels d'outils, afin que vos résultats restent précis.
Comment l'utiliser
Cliquez sur l'icône du bouclier à côté du bouton d'envoi dans l'éditeur.
- Gris : Désactivé
- Bleu : Filtre de données personnelles (mode de confidentialité standard)
- Sarcelle : PHI / Jeu de données limité (filtrage de niveau HIPAA)
- Émeraude : PHI / Safe Harbor (dé-identification stricte pour les jeux de données partagés)
Ou allez dans Paramètres > Confidentialité > Pseudonymiseur pour configurer votre mode par défaut.
Ce que vous voyez
Lorsque le Pseudonymiseur est activé, un fin anneau coloré autour de l'éditeur correspond au mode de confidentialité actif. Sous chaque message que vous envoyez, une puce affiche « 🛡 pseudonymisé — {count} substitutions » avec un lien pour voir les paires réel → faux et leurs catégories.
Exemple :
🛡 pseudonymisé — 3 substitutions
- "Jean Dupont" → "Michel Durand" (person_name)
- "[email protected]" → "[email protected]" (email)
- "01 23 45 67 89" → "04 55 55 00 92" (phone)
Cliquez sur la puce pour développer la liste complète et voir quels remplacements ont été effectués.
Modes de confidentialité
Filtre de données personnelles (Bleu)
Filtrage standard sur l'appareil pour la confidentialité quotidienne. Détecte et remplace :
- Noms (prénom, nom, complet)
- Adresses e-mail
- Numéros de téléphone
- Adresses physiques (rue, ville, état/région)
- Numéros d'identification (numéro de sécurité sociale, permis de conduire, passeport, etc.)
- Noms d'organisations et entités juridiques
- Dates (les dates spécifiques conservent l'année)
- Âges
Idéal pour : Conversations générales, remue-méninges, partage de contexte sans exposer de détails personnels.
PHI Jeu de données limité (Sarcelle)
Filtrage conforme à la norme HIPAA pour les discussions médicales et de santé. Remplace les 16 catégories protégées par l'HIPAA :
- Noms individuels
- Subdivisions géographiques plus petites qu'un État (ville, quartier, codes postaux plus spécifiques que les 3 premiers chiffres)
- Toutes les dates sauf l'année (année de naissance, année d'admission, etc.)
- Numéros de téléphone, adresses e-mail, numéros de fax
- Numéros de dossier médical, numéros d'assurance maladie, numéros de compte
- Numéros de plaque d'immatriculation
- Identifiants de véhicules
- Numéros de série d'appareils
- URL et adresses IP
- Identifiants biométriques
- Photos et images (masquées)
- Tout identifiant ou code unique
Idéal pour : Travailler avec des données de santé, des dossiers de patients, de la recherche médicale ou tout contenu réglementé par l'HIPAA que vous souhaitez garder privé tout en l'utilisant avec l'IA.
PHI Safe Harbor (Émeraude)
Dé-identification stricte selon la règle Safe Harbor de l'HIPAA (§164.514(b)(2)). Cela supprime tous les identifiants qui pourraient raisonnablement identifier un individu ou les membres de son foyer :
- Tout ce qui se trouve dans le jeu de données limité, plus :
- Toutes les dates sauf l'année (dates de naissance, dates d'admission, etc. — seule l'année subsiste)
- Adresses géographiques complètes (ville, état, code postal — seul l'état subsiste)
- Âges supérieurs à 89 ans (affichés comme « 89+ »)
Idéal pour : Préparer des données à partager avec des chercheurs, créer des jeux de données dé-identifiés pour analyse, ou se conformer à des accords de partage de données stricts qui ne nécessitent pas d'accord d'utilisation des données.
Substitutions multilingues
Le Pseudonymiseur génère des substituts appropriés sur le plan culturel et linguistique :
- Les noms espagnols conservent une consonance espagnole
- Les noms japonais conservent une consonance japonaise
- Les noms arabes conservent une consonance arabe
- Les noms d'organisations suivent les conventions locales (Inc., LLC, GmbH, S.A., etc.)
- Les noms de villes sont géographiquement plausibles
Gère les cas complexes : noms à scripts mixtes, noms CJK avec initiales médianes, titres honorifiques (Dr, M., Mme, Prof., etc.) et suffixes légaux d'organisation.
Inspecteur d'hallucinations
L'IA invente parfois des noms réalistes qui ne correspondent à aucune substitution de votre session. Le Pseudonymiseur les détecte et les signale par un avertissement : « L'assistant a mentionné des noms qui ne figuraient pas dans votre message d'origine. Ceux-ci pourraient être inventés. Vérifiez-les avant de les utiliser. »
Cela vous aide à repérer les cas où le modèle a généré de nouveaux faux noms alors qu'il aurait dû réutiliser vos substitutions.
Comment ça fonctionne en coulisses
- Détection : Lorsque vous appuyez sur envoyer, le Pseudonymiseur scanne votre message pour trouver des motifs sensibles (regex + détection basée sur le ML).
- Génération : Pour chaque valeur détectée, il génère un faux culturellement approprié dans la même catégorie.
- Substitution : Votre message est réécrit avec les faux avant d'être envoyé au modèle.
- Stockage : La correspondance réel → faux reste locale dans votre session. Seul le message pseudonymisé est envoyé.
- Démasquage : Lorsque les outils s'exécutent (recherche Web, appels API, opérations sur fichiers), les vraies valeurs sont restaurées pour que votre résultat reste précis et utilisable.
- Audit : Vous voyez le journal des substitutions sous chaque message.
Limitations
Première utilisation : La première fois que vous activez le Pseudonymiseur, il télécharge un modèle de détecteur local (quelques Mo). La progression est affichée pendant le téléchargement.
Journalisation de la progression sur iOS : Sur iOS, le téléchargement du modèle affiche un journal de progression « heartbeat » pour que vous sachiez qu'il fonctionne.
Recherches Perplexity : Le Pseudonymiseur refuse de divulguer des valeurs réelles à Perplexity AI. Si une recherche Perplexity devait contenir des identifiants pseudonymisés (ce qui pourrait révéler la correspondance de substitution), la recherche est bloquée avec une explication claire : « Le Pseudonymiseur bloque cette recherche pour empêcher la fuite de valeurs réelles. Essayez de reformuler sans détails sensibles, ou désactivez le Pseudonymiseur pour ce message. »
Révision manuelle : Le Pseudonymiseur capture la plupart des motifs PII, mais aucun détecteur n'est précis à 100 %. Pour les données hautement sensibles, révisez toujours le message avant de l'envoyer.
Disponibilité
Le Pseudonymiseur est GRATUIT et fonctionne sur toutes les plateformes : extension de navigateur, application de bureau (macOS, Windows, Linux) et applications mobiles (iOS, Android).
Voir aussi
- Confidentialité et données — Comment les données sont stockées et traitées
- Plateforme et configuration — Le Pseudonymiseur sur chaque plateforme
- Paramètres > Confidentialité — Configurer les options par défaut du Pseudonymiseur
This guide is maintained by the Caiioo team using Slate, our built-in editor.