Problem

You want to let the AI use tools — browse, write files, send messages — but only after you see what it intends to do and can stop or scope the action.

Questa è una traduzione automatica del documento originale in inglese. In caso di discrepanze tra la presente traduzione e la versione originale in inglese, prevarrà la versione inglese. Leggi la versione originale in inglese

Controlla cosa può fare l'IA prima che lo faccia

Ogni fornitore di agenti ti promette "piena autonomia!". Il contratto di Caiioo è l'opposto: l'agente descrive cosa sta per fare e tu decidi se permetterglielo — per azione, per conversazione o per sempre. Ecco come appare end-to-end.

Prima di iniziare

Apri Impostazioni > Strumenti per vedere quali strumenti sono attualmente abilitati per la tua modalità. Disabilita tutto ciò che non vuoi che l'agente utilizzi a priori. L'approvazione si applica solo agli strumenti abilitati — gli strumenti disabilitati non vengono mai offerti al modello.

Quando l'agente vuole usare uno strumento

Chiedi qualcosa che metta in funzione uno strumento. "Cerca sul web le recenti modifiche all'EU AI Act", "elenca il mio calendario per domani", "salva questa nota in un file" — ognuna di queste richieste farà sì che l'agente proponga una chiamata a uno strumento.

L'agente non procede da solo. Una finestra modale intitolata Approvazione Richiesta blocca l'esecuzione e mostra:

Intento — una riga che descrive cosa l'agente sta cercando di fare, con le sue parole. Questa è la prima cosa su cui cade l'occhio.
Nome dello strumento e azione — ad es. googleCalendar.listEvents, fileSystem.writeFile.
Livello di rischio — scudo codificato a colori: verde per letture a basso rischio, ambra per scritture, rosso per operazioni distruttive o di invio denaro. Gli strumenti ad alto rischio mostrano anche un banner di avviso: "Questa è un'operazione ad alto rischio. Approva solo se comprendi cosa farà."
Dettagli — una sezione espandibile con gli argomenti sanitizzati. I segreti (chiavi API, token, password) vengono rimossi prima della visualizzazione. Un interruttore Mostra JSON non elaborato all'interno rivela il payload originale se vuoi vedere esattamente cosa viene inviato.

Scegli l'ambito adatto al rischio

Il piè di pagina offre quattro pulsanti. Ognuno corrisponde a una diversa decisione di fiducia:

Pulsante	Cosa fa
Nega	Blocca questa singola azione. L'agente riceve il rifiuto e può provare qualcos'altro.
Approva una volta	Consente questa specifica chiamata, poi chiede di nuovo alla successiva invocazione. Ideale per attività una tantum.
Approva per la conversazione	Consente tutti gli utilizzi di questo strumento all'interno del thread corrente. Si resetta quando inizi una nuova conversazione. Ideale per il caso comune: "Sto facendo ricerca per la prossima ora, lascia che l'agente cerchi liberamente."
Approva sempre	Permesso globale permanente in tutte le conversazioni. Mostrato in rosso per gli strumenti ad alto rischio per evitare clic per abitudine. Ideale per strumenti a basso rischio che usi costantemente (come la calcolatrice).

Osserva cosa succede

Una volta approvata, la chiamata allo strumento viene eseguita e appare nel pannello laterale accanto alla conversazione con il suo stato in tempo reale — in attesa → in esecuzione → riuscito o fallito — insieme agli argomenti con cui è stata effettivamente eseguita e al risultato ottenuto. Nulla viene eseguito senza che tu lo veda; nulla viene eseguito silenziosamente in background.

Interrompi in qualsiasi momento

Se uno strumento che hai approvato si comporta in modo anomalo o la conversazione sta andando in una direzione non prevista, premi il pulsante di arresto nel compositore. L'agente si ferma immediatamente, le approvazioni in sospeso vengono cancellate e ogni sessione del browser in corso si chiude correttamente. Nessuna chiamata a strumenti orfana, nessun loop fuori controllo.

Quando l'agente si ferma per farti una domanda

L'approvazione è l'agente che chiede il permesso. A volte l'agente ha bisogno di un input — non è sicuro di quale tra due percorsi preferisci, o vuole che tu approvi un piano prima di spendere una dozzina di chiamate a strumenti per eseguirlo. Per questo utilizza un pannello separato "human-in-the-loop" che mette in pausa il turno e ti interroga direttamente.

Il pannello mostra un titolo, una proposta renderizzata in markdown (il piano dell'agente, la sua bozza, la sua domanda) e quattro pulsanti di risposta:

Approva — procedi come proposto.
Approva ma... — procedi con le modifiche che digiti nel campo note che appare. L'agente continua lo stesso turno con la tua guida allegata.
Rifiuta ma... — non farlo, ed ecco perché (o ecco cosa preferirei). Di nuovo, continua lo stesso turno con la tua motivazione.
Rifiuta — abbandona completamente questa direzione.

Se la proposta dell'agente offre un set di opzioni concrete, queste appaiono come chip di scelta rapida sopra i pulsanti, così puoi cliccare su una risposta invece di digitare. Le proposte ad alto rischio ricevono un banner di avviso rosso sopra il corpo. La tua risposta si risolve inline — l'agente non ricomincia da capo, riprende semplicemente il filo con la tua risposta nel contesto.

Rendilo predefinito: chiedi a Caiioo di creare una modalità cauta

Il workflow sopra è la versione per azione. Se desideri questo come atteggiamento predefinito per un'intera classe di attività, la risposta più pulita è una modalità.

Basta chiedere. Nel compositore, digita qualcosa come:

"Crea una nuova modalità chiamata Cauta che presenti sempre un piano prima di eseguire qualsiasi strumento, mi chieda di approvare il piano e non proceda finché non confermo."

Caiioo utilizzerà il suo strumento di configurazione integrato per creare la modalità per te — prompt di sistema, nome, impostazioni predefinite. Passa a quella modalità dal selettore di modalità nell'intestazione e ogni esecuzione dell'agente inizierà con un piano, si fermerà per la tua approvazione e solo allora toccherà gli strumenti. Modifica la modalità allo stesso modo in seguito: "Aggiorna la modalità Cauta per riassumere anche i risultati dopo ogni passaggio." L'agente modifica se stesso.

Creare o aggiornare modalità personalizzate è una funzionalità del livello Pro. Vedi Modalità e Personalità per il quadro completo di ciò che le modalità possono configurare — prompt di sistema, strumenti abilitati, variabili e altro ancora.

Vedi anche

Strumenti e Integrazioni — Cosa c'è nel catalogo degli strumenti e come abilitare o disabilitare ciascuno di essi
Modalità e Personalità — Cosa può configurare una modalità e come passare da una all'altra
Privacy e Dati — Perché le credenziali usate dagli strumenti rimangono nel Keychain (o equivalente) invece che in un file di configurazione condiviso
Perché questo design — Il post del blog che analizza il contrasto di sicurezza con gli agenti "autonomi"