Problem

You want to let the AI use tools — browse, write files, send messages — but only after you see what it intends to do and can stop or scope the action.

Ceci est une traduction automatique du document original en anglais. En cas de divergence entre cette traduction et la version originale anglaise, la version anglaise fera foi. Consulter la version originale en anglais

Contrôler ce que l'IA peut faire avant qu'elle ne le fasse

Chaque vendeur d'agents vous promet une « autonomie totale ! ». Le contrat de Caiioo est l'opposé : l'agent décrit ce qu'il s'apprête à faire, et vous décidez de l'autoriser ou non — par action, par conversation ou pour toujours. Voici à quoi cela ressemble de bout en bout.

Avant de commencer

Ouvrez Paramètres > Outils pour voir quels outils sont actuellement activés pour votre mode. Désactivez tout ce que vous ne voulez pas que l'agent utilise. L'approbation ne s'applique qu'aux outils activés — les outils désactivés ne sont jamais proposés au modèle.

Quand l'agent veut utiliser un outil

Demandez quelque chose qui sollicite un outil. « Cherche sur le web les récents changements de l'IA Act de l'UE », « liste mon calendrier pour demain », « enregistre cette note dans un fichier » — n'importe laquelle de ces requêtes amènera l'agent à proposer un appel d'outil.

L'agent ne procède pas de lui-même. Une fenêtre modale intitulée Approbation requise bloque l'exécution et affiche :

Intention — une ligne décrivant ce que l'agent essaie de faire, avec ses propres mots. C'est la première chose que vous voyez.
Nom de l'outil et action — par ex., googleCalendar.listEvents, fileSystem.writeFile.
Niveau de risque — un bouclier avec code couleur : vert pour les lectures à faible risque, orange pour les écritures, rouge pour les opérations destructrices ou de transfert d'argent. Les outils à haut risque affichent également une bannière d'avertissement : « Il s'agit d'une opération à haut risque. N'approuvez que si vous comprenez ce qu'elle va faire. »
Détails — une section extensible avec les arguments nettoyés. Les secrets (clés API, jetons, mots de passe) sont masqués avant l'affichage. Un bouton Afficher le JSON brut à l'intérieur révèle la charge utile intacte si vous voulez voir exactement ce qui est envoyé.

Choisir la portée adaptée au risque

Le pied de page propose quatre boutons. Chacun correspond à une décision de confiance différente :

Bouton	Ce qu'il fait
Refuser	Bloque cette action unique. L'agent reçoit le refus et peut essayer autre chose.
Approuver une fois	Autorise cet appel spécifique, puis redemande lors de la prochaine invocation. Idéal pour les tâches ponctuelles.
Approuver pour la conversation	Autorise toutes les utilisations de cet outil dans le fil actuel. Se réinitialise lorsque vous commencez une nouvelle conversation. Idéal pour le cas courant : « Je fais des recherches pendant l'heure qui vient, laisse l'agent chercher librement. »
Toujours approuver	Permission globale permanente pour toutes les conversations. Affiché en rouge pour les outils à haut risque afin d'éviter de cliquer par habitude. Idéal pour les outils à faible enjeu que vous utilisez constamment (comme la calculatrice).

Observer le déroulement

Une fois approuvé, l'appel d'outil s'exécute et apparaît dans le panneau latéral à côté de la conversation avec son statut en direct — en attente → exécution → réussi ou échoué — ainsi que les arguments réellement utilisés et le résultat obtenu. Rien ne s'exécute sans que vous ne le voyiez ; rien ne s'exécute silencieusement en arrière-plan.

Arrêter à tout moment

Si un outil que vous avez approuvé se comporte mal ou si la conversation prend une direction non souhaitée, appuyez sur le bouton d'arrêt du compositeur. L'agent s'arrête immédiatement, les approbations en attente sont effacées et toute session de navigateur en cours se ferme proprement. Pas d'appels d'outils orphelins, pas de boucles infinies.

Quand l'agent s'arrête pour vous poser une question

L'approbation est une demande de permission de l'agent. Parfois, l'agent a besoin d'une entrée — il n'est pas sûr de la voie à suivre, ou il veut que vous validiez un plan avant de lancer une douzaine d'appels d'outils. Pour cela, il utilise un panneau séparé « humain dans la boucle » qui suspend le tour et vous interroge directement.

Le panneau affiche un titre, une proposition au format markdown (le plan de l'agent, son brouillon, sa question) et quatre boutons de réponse :

Approuver — procéder comme proposé.
Approuver mais… — procéder avec les ajustements que vous saisissez dans le champ de notes qui apparaît. L'agent continue le même tour en tenant compte de vos directives.
Rejeter mais… — ne pas faire cela, et voici pourquoi (ou voici ce que je préférerais). Là encore, continue le même tour avec votre justification.
Rejeter — abandonner complètement cette direction.

Si la proposition de l'agent offre un ensemble d'options concrètes, elles s'affichent sous forme de jetons de sélection rapide au-dessus des boutons pour que vous puissiez cliquer sur une réponse au lieu de taper. Les propositions à haut risque reçoivent une bannière d'avertissement rouge au-dessus du corps du texte. Votre réponse se résout en ligne — l'agent ne recommence pas, il reprend simplement le fil avec votre réponse en contexte.

En faire le défaut : dire à Caiioo de créer un mode prudent

Le flux de travail ci-dessus est la version par action. Si vous souhaitez que ce soit votre posture par défaut pour toute une classe de tâches, la réponse la plus propre est un mode.

Demandez simplement. Dans le compositeur, tapez quelque chose comme :

« Crée un nouveau mode appelé Prudent qui présente toujours un plan avant d'exécuter des outils, me demande d'approuver le plan et ne continue pas tant que je n'ai pas confirmé. »

Caiioo utilisera son outil de configuration intégré pour configurer le mode pour vous — consigne système, nom, paramètres par défaut. Passez à ce mode depuis le sélecteur de mode de l'en-tête et chaque exécution d'agent commencera par un plan, s'arrêtera pour votre approbation, et touchera seulement ensuite aux outils. Modifiez le mode de la même manière plus tard : « Mets à jour le mode Prudent pour résumer également les résultats après chaque étape. » L'agent se modifie lui-même.

La création ou la mise à jour de modes personnalisés est une fonctionnalité du forfait Pro. Voir Modes et personnalités pour une vue d'ensemble de ce que les modes peuvent configurer — consigne système, outils activés, variables, et plus encore.

Voir aussi

Outils et intégrations — Ce qui se trouve dans le catalogue d'outils et comment activer ou désactiver chacun d'eux
Modes et personnalités — Ce qu'un mode peut configurer et comment basculer entre eux
Confidentialité et données — Pourquoi les identifiants utilisés par les outils restent dans le Keychain (ou équivalent) plutôt que dans un fichier de configuration partagé
Pourquoi ce design — L'article de blog qui détaille le contraste de sécurité avec les agents « autonomes »