Problem

You want to let the AI use tools — browse, write files, send messages — but only after you see what it intends to do and can stop or scope the action.

Dies ist eine maschinelle Übersetzung des englischen Originaldokuments. Im Falle von Widersprüchen zwischen dieser Übersetzung und der englischen Originalversion ist die englische Version maßgeblich. Englische Originalversion lesen

Kontrollieren, was die KI tun darf, bevor sie es tut

Jeder Agenten-Anbieter verspricht Ihnen „volle Autonomie!“. Caiioos Versprechen ist das Gegenteil: Der Agent beschreibt, was er tun wird, und Sie entscheiden, ob Sie es zulassen – pro Aktion, pro Konversation oder dauerhaft. Hier sehen Sie, wie das durchgängig aussieht.

Bevor Sie beginnen

Öffnen Sie Einstellungen > Tools, um zu sehen, welche Tools derzeit für Ihren Modus aktiviert sind. Deaktivieren Sie alles, worauf der Agent von vornherein keinen Zugriff haben soll. Die Genehmigung gilt nur für aktivierte Tools – deaktivierte Tools werden dem Modell niemals angeboten.

Wenn der Agent ein Tool verwenden möchte

Fragen Sie nach etwas, das ein Tool erfordert. „Suche im Web nach aktuellen Änderungen am EU AI Act“, „liste meinen Kalender für morgen auf“, „speichere diese Notiz in einer Datei“ – all dies veranlasst den Agenten, einen Tool-Aufruf vorzuschlagen.

Der Agent macht nicht eigenständig weiter. Ein Modal mit dem Titel Genehmigung erforderlich blockiert den Durchlauf und zeigt:

Absicht – eine Zeile, die in den Worten des Agenten beschreibt, was er tun möchte. Das ist das Erste, was ins Auge fällt.
Tool-Name und Aktion – z. B. googleCalendar.listEvents, fileSystem.writeFile.
Risikostufe – farbcodiertes Schild: Grün für risikoarme Lesezugriffe, Gelb für Schreibzugriffe, Rot für destruktive oder zahlungsrelevante Operationen. Hochrisiko-Tools zeigen zudem ein Warnbanner: „Dies ist eine Hochrisiko-Operation. Nur genehmigen, wenn Sie verstehen, was sie bewirkt.“
Details – ein ausklappbarer Bereich mit den bereinigten Argumenten. Geheimnisse (API-Keys, Token, Passwörter) werden vor der Anzeige entfernt. Ein Schalter Roh-JSON anzeigen offenbart die unveränderte Payload, falls Sie genau sehen möchten, was übertragen wird.

Wählen Sie den Umfang, der zum Risiko passt

Die Fußzeile bietet vier Schaltflächen. Jede entspricht einer anderen Vertrauensentscheidung:

Schaltfläche	Funktion
Ablehnen	Blockiert diese einzelne Aktion. Der Agent erhält die Ablehnung und kann etwas anderes versuchen.
Einmalig genehmigen	Erlaubt diesen spezifischen Aufruf und fragt beim nächsten Mal erneut. Richtig für einmalige Aufgaben.
Für Konversation genehmigen	Erlaubt alle Nutzungen dieses Tools innerhalb des aktuellen Threads. Wird zurückgesetzt, wenn Sie eine neue Konversation starten. Richtig für den Regelfall: „Ich recherchiere die nächste Stunde, lass den Agenten frei suchen.“
Immer genehmigen	Permanente globale Erlaubnis über alle Konversationen hinweg. Bei Hochrisiko-Tools rot dargestellt, damit man nicht aus Gewohnheit klickt. Richtig für harmlose Tools, die Sie ständig nutzen (wie den Taschenrechner).

Beobachten Sie den Vorgang

Nach der Genehmigung wird der Tool-Aufruf ausgeführt und erscheint im Seitenpanel neben der Konversation mit seinem Live-Status – ausstehend → wird ausgeführt → erfolgreich oder fehlgeschlagen – zusammen mit den tatsächlich verwendeten Argumenten und dem erhaltenen Ergebnis. Nichts läuft, was Sie nicht gesehen haben; nichts läuft heimlich im Hintergrund.

Jederzeit stoppen

Wenn sich ein von Ihnen genehmigtes Tool falsch verhält oder die Konversation in eine unerwünschte Richtung läuft, drücken Sie die Stopp-Taste im Composer. Der Agent hält sofort an, ausstehende Genehmigungen werden gelöscht und alle aktiven Browser-Sitzungen werden sauber geschlossen. Keine verwaisten Tool-Aufrufe, keine Endlosschleifen.

Wenn der Agent innehält, um Ihnen eine Frage zu stellen

Genehmigung bedeutet, dass der Agent um Erlaubnis fragt. Manchmal benötigt der Agent jedoch Input – er ist sich unsicher, welchen von zwei Pfaden Sie bevorzugen, oder er möchte, dass Sie einen Plan absegnen, bevor er ein Dutzend Tool-Aufrufe zur Ausführung startet. Dafür nutzt er ein separates Human-in-the-Loop-Panel, das den Durchgang pausiert und Sie direkt fragt.

Das Panel zeigt einen Titel, einen in Markdown gerenderten Vorschlag (den Plan des Agenten, seinen Entwurf, seine Frage) und vier Antwort-Buttons:

Genehmigen – wie vorgeschlagen fortfahren.
Genehmigen, aber... – mit den Anpassungen fortfahren, die Sie in das erscheinende Notizfeld eingeben. Der Agent setzt denselben Durchgang mit Ihren Hinweisen fort.
Ablehnen, aber... – dies nicht tun, und hier ist der Grund (oder was ich stattdessen möchte). Setzt ebenfalls denselben Durchgang mit Ihrer Begründung fort.
Ablehnen – diese Richtung komplett abbrechen.

Wenn der Vorschlag des Agenten eine Reihe konkreter Optionen bietet, erscheinen diese als Quick-Pick-Chips über den Buttons, sodass Sie eine Antwort anklicken können, statt zu tippen. Hochrisiko-Vorschläge erhalten ein rotes Warnbanner über dem Textkörper. Ihre Antwort wird inline aufgelöst – der Agent fängt nicht von vorne an, sondern nimmt den Faden mit Ihrer Antwort im Kontext wieder auf.

Zum Standard machen: Caiioo anweisen, einen vorsichtigen Modus zu erstellen

Der obige Workflow ist die pro-Aktion-Variante. Wenn Sie dies als Standardeinstellung für eine ganze Klasse von Aufgaben wünschen, ist ein Modus die sauberste Lösung.

Fragen Sie einfach. Tippen Sie im Composer etwas wie:

„Erstelle einen neuen Modus namens Vorsichtig, der immer einen Plan präsentiert, bevor er Tools ausführt, mich um Genehmigung des Plans bittet und erst fortfährt, wenn ich bestätige.“

Caiioo nutzt sein integriertes Konfigurationstool, um den Modus für Sie einzurichten – System-Prompt, Name, Standardwerte. Wechseln Sie im Header-Modus-Wähler zu diesem Modus, und jeder Agenten-Lauf beginnt mit einem Plan, pausiert für Ihre Genehmigung und greift erst dann auf Tools zu. Bearbeiten Sie den Modus später auf die gleiche Weise: „Aktualisiere den Modus Vorsichtig so, dass er auch die Ergebnisse nach jedem Schritt zusammenfasst.“ Der Agent bearbeitet sich selbst.

Das Erstellen oder Aktualisieren benutzerdefinierter Modi ist eine Pro-Funktion. Siehe Modi & Persönlichkeiten für das vollständige Bild dessen, was Modi konfigurieren können – System-Prompt, aktivierte Tools, Variablen und mehr.

Siehe auch

Tools & Integrationen – Was im Tool-Katalog enthalten ist und wie man sie aktiviert oder deaktiviert
Modi & Persönlichkeiten – Was ein Modus konfigurieren kann und wie man zwischen ihnen wechselt
Privatsphäre & Daten – Warum Anmeldedaten für Tools im Keychain (oder Äquivalent) bleiben statt in einer geteilten Konfigurationsdatei
Warum dieses Design – Der Blog-Post, der den Sicherheitskontrast zu „autonomen“ Agenten erläutert