Dies ist eine maschinelle Übersetzung des englischen Originaldokuments. Im Falle von Widersprüchen zwischen dieser Übersetzung und der englischen Originalversion ist die englische Version maßgeblich. Englische Originalversion lesen


Tools: Was die KI tun kann

Die KI chattet nicht nur – sie kann echte Aktionen ausführen. Nutzen Sie Tools, um im Web zu surfen, Dokumente zu lesen, Bilder zu generieren, Ihren Kalender zu verwalten und mehr. Die KI entscheidet automatisch, welche Tools basierend auf Ihrer Anfrage verwendet werden.

Caiioo nutzt ein Lese-/Schreib-Zugriffsmodell: Kostenlose Nutzer erhalten Lesezugriff auf die meisten Tools, während Pro den vollen Schreibzugriff freischaltet.

Jeder erhält diese Tools (Kostenlos)

Web Browsing (Schreibgeschützt)

Die KI kann in Ihrem Browser navigieren, Seiten lesen, Screenshots erstellen, Google durchsuchen und Inhalte extrahieren. Perfekt für Recherchen und Datenerfassung.

Was Sie fragen können:

  • „Lies diese Seite und fasse sie zusammen“
  • „Erstelle einen Screenshot hiervon“
  • „Finde alle Preise auf dieser Seite“
  • „Suche bei Google nach den besten Campingzelten“

Google Workspace (Schreibgeschützt)

Durchsuchen und lesen Sie Ihre Gmail, Google Drive, Docs, Sheets und Ihren Calendar — ohne Einrichtung, außer der Verknüpfung Ihres Google-Kontos. Gmail-Suchen verstehen natürliche Filter — Absender, Betreff, Label, Kategorie, Alter, Anhänge und ungelesener Status —, sodass Sie die Suchsyntax von Gmail nicht kennen müssen.

Was Sie fragen können:

  • „Durchsuche mein Drive nach dem Q4-Bericht“
  • „Finde ungelesene E-Mails von Bob aus der letzten Woche, die Anhänge haben“
  • „Lies meine neuesten E-Mails“
  • „Was steht heute in meinem Kalender?“

Sundial Agenda (Schreibgeschützt)

Zeigen Sie Ihre Kalenderereignisse und Erinnerungen an, prüfen Sie die Verfügbarkeit und finden Sie freie Zeitfenster. Funktioniert mit Google Calendar auf allen Plattformen.

Web Search

KI-gestützte Suche mit Quellenangaben. Stellen Sie Fragen und erhalten Sie fundierte Antworten, anstatt selbst Suchergebnisse zu durchforsten.

Slate Editor

Echtzeit-KI-Zusammenarbeit für Code und Dokumente. Siehe Slate für Details.

Calculator

Schnelle Berechnungen. Die KI kann Arithmetik, Trigonometrie, Statistik und mehr durchführen, ohne externe Tools zu verwenden.

API Integration (Schreibgeschützt)

Führen Sie GET-Anfragen an externe REST APIs aus. Nützlich zum Abrufen von Daten aus Diensten, für die wir noch keine integrierte Unterstützung haben.

SQL Database

Erstellen und abfragen von lokalen SQLite-Datenbanken. Nützlich für die Analyse von CSV-Daten, den Aufbau von leichtgewichtigen Dashboards oder das Prototyping von Daten-Workflows.

Sub-Agents

Delegieren Sie Teile einer komplexen Aufgabe an parallele Agenten, damit diese unabhängig laufen und Bericht erstatten. Nützlich, wenn Recherche, Analyse und Entwurf gleichzeitig stattfinden sollen. Die Ergebnisse der Sub-Agents werden direkt im Haupt-Chat angezeigt.

Ask User

Pausieren Sie einen KI-Lauf während der Ausführung und rufen Sie einen Entscheidungsdialog auf. Die KI präsentiert bis zu 4 Optionen (Genehmigen, Genehmigen mit Anmerkungen, Ablehnen, Ablehnen mit Anmerkungen) und wartet auf Ihre Eingabe. Ihre Anmerkungen fließen als Anweisungen in natürlichem Englisch zurück, die den Plan überschreiben, und der Agent setzt seine Arbeit fort.

Self Checker

Bewerten und verifizieren Sie jeden Schritt des Assistenten. Klicken Sie auf die Schaltfläche ⚖ neben einer Antwort, um eine Bewertungskarte zu öffnen. Wählen Sie zwischen LLM-gestütztem Urteil und deterministischen Prüfungen (exakte Übereinstimmung, enthält Teilstring, Regex-Muster, Zahlenbereich, Arithmetik). Die Ergebnisse werden inline angezeigt. Die Kosten fließen in die Gesamtsumme Ihres Threads ein.

Instant Tool Chooser

Semantische Tool-Auswahl direkt auf dem Gerät. Die KI wählt das richtige Tool in ca. 10ms aus, ohne ein Modell aufzurufen. Standardmäßig in jedem Tarif aktiviert — schalten Sie zwischen „Instant Tool Chooser“ und „Quick Tasks LLM“ in Settings > Tools um.

Pro Tier Tools ($9/month)

Pro schaltet den vollständigen Schreibzugriff für Tools frei, die in der Free-Version nur lesend verfügbar sind, sowie zusätzliche Funktionen.

Wenn Sie ein lokales Chat-Modell (wie Ollama) ausführen, bitten KI-gestützte Tools, die Ihre Daten an einen Remote-KI-Anbieter senden würden, zuerst um Ihre Zustimmung. Siehe Privacy & DataRemote AI Providers.

Vollständige Web-Automatisierung

Alles aus dem Read-only-Browsing, plus: Links anklicken, Formulare ausfüllen, Text eingeben, mit Seitenelementen interagieren und JavaScript ausführen. Perfekt für das Ausfüllen von Formularen, Dateneingabe und Browser-Automatisierung.

Was Sie fragen können:

  • "Fülle dieses Formular mit meinen Informationen aus"
  • "Klicke auf den Reiter 'Bewertungen' und lies, was die Leute sagen"
  • "Logge dich auf dieser Seite ein und lade meine Rechnung herunter"

Vollständiges Google Workspace

Erstellen, bearbeiten und verwalten Sie Google Docs, Sheets, Slides, Gmail-Entwürfe, Drive-Dateien und Calendar-Ereignisse. Google Sheets hat neue Aktionen erhalten: CSV/TSV/HTML einfügen, Text in Spalten aufteilen, Leerzeichen entfernen, Duplikate entfernen, Symbolleistenfilter anwenden und löschen, Zeilen und Spalten verschieben, Zellbereiche einfügen und löschen, Bereiche schützen, benannte Bereiche definieren und aktualisieren, Entwickler-Metadaten anhängen und bedingte Formatierung anwenden. Google Docs erhielt native Kommentare (Hinzufügen, Antworten, Lösen, Löschen), Unterstützung für Dokumente mit mehreren Tabs und Smart-Chip-Erkennung (Personen, Links, Gleichungen, Seitenumbrüche, Daten).

Google Drive — Ordner erstellen, Dateien verschieben, Freigabeberechtigungen verwalten Gmail — E-Mails entwerfen und senden, Anhänge herunterladen Google Docs & Sheets — Dokumente erstellen und bearbeiten, Formeln schreiben, Zellen formatieren Google Slides — Präsentationen erstellen, Text/Bilder/Tabellen hinzufügen, Layouts bearbeiten Google Calendar — Ereignisse und Erinnerungen erstellen, Termine über jeden Kalender in Ihrem Konto planen (Team-, Familien- und persönliche Kalender)

Vollständige Sundial Agenda

Erstellen Sie Ereignisse und Erinnerungen, planen Sie Meetings und verwalten Sie Ihren Kalender über verschiedene Anbieter hinweg.

Vollständige API-Integration

POST-, PUT-, PATCH- und DELETE-Anfragen an jeden REST-Endpunkt — nicht nur GET.

Dokumenten-Ingestion

Hochladen und Analysieren von PDFs, Word-Dokumenten (DOCX), Excel-Tabellen (XLSX) und Bildern mit OCR. Eine hochwertigere Extraktion bei komplexen Dokumenten ist über OCR-Modelle möglich, auf die über Ihren OpenRouter-Key zugegriffen wird.

Bildgenerierung

Erstellen Sie Bilder aus Textbeschreibungen. Verfügbare Modelle sind FLUX.2 (Flex, Klein, Max, Pro), Gemini (2.5 Flash, 3 Pro, 3.1 Flash), GPT-5 Image, Seedream 4.5 und Riverflow v2. Perfekt für Illustrationen, Mockups oder Visualisierungen.

Was Sie erstellen können:

  • Ein Produkt-Mockup für ein neues Design
  • Eine Illustration für einen Blog-Post
  • Eine Textur für ein 3D-Projekt
  • Variationen eines bestehenden Bildes

Videogenerierung

Generieren Sie Videos aus Textbeschreibungen. Verfügbare Modelle über OpenRouter: Google Veo 3.1, OpenAI Sora 2 Pro und ByteDance Seedance. Gültige Dauern und Auflösungen variieren je nach Modell. Videos werden als Thread-Anhänge gespeichert.

Was Sie generieren können:

  • Produkt-Demo-Videos
  • Animierte Erklärvideos
  • Szenenübergänge für Edits
  • Storyboard-Sequenzen

Musikgenerierung

Generieren Sie Originalmusik aus Textbeschreibungen über Google Lyria 3 Pro Preview (Zugriff über OpenRouter). Erstellt lizenzfreie Tracks, die als Inline-Audio-Anhänge in Ihrem Thread gespeichert werden.

Was Sie generieren können:

  • Hintergrundmusik für Videos
  • Ambient-Soundscapes
  • Musikalische Themen für Projekte
  • Instrumentale Versionen von Beschreibungen

Seeing-Eye Dog

Vision-Fallback für reine Textmodelle. Wenn Ihr gewähltes Modell keine Bilder unterstützt (wie lokales Ollama, DeepSeek V4 Pro, Kimi K2.6), hängen Sie trotzdem Bilder an — sie werden über ein günstiges Vision-Modell geleitet, um Bildunterschriften zu generieren, wonach der Text an Ihr Hauptmodell gesendet wird. Standard ist Gemini 3.1 Flash Lite via OpenRouter. Die automatische Beschriftung erfolgt zum Zeitpunkt der Nachrichtenerstellung mit Caching pro Anhang. Verwenden Sie das Tool vision({action: "inspect"}) für gezielte Nachfragen. Konfigurieren Sie dies unter Settings > Tools > Vision Fallback Model.

Workspace Files

Sandboxed Lesen, Schreiben, Bearbeiten und Suchen innerhalb eines von Ihnen zugewiesenen Ordners. Kann diesen Ordner nicht verlassen oder auf das Netzwerk zugreifen. Parst automatisch .docx, .xlsx, .pptx und PDF. Perfekt für die Arbeit mit lokalen Projektdateien, ohne diese in die Cloud hochzuladen. Konfigurieren Sie dies unter Settings > Tools > Workspace Files.

Test Runner

Führen Sie eine Liste von Prompts mit Grader aus — Substring-Match, Muster (Regex), erwartete Tool-Aufrufe oder 1-10 Bewertung durch ein zweites Modell. Jeder Prompt läuft in einer eigenen, frischen Konversation. Exportieren Sie die Ergebnisse als CSV-Pass/Fail-Bericht.

XLSX Cell-Level Tracked Changes

Slate-Tabellen unterstützen jetzt Änderungen im DOCX-Stil über propose_change({editMode: 'xlsx_cell'}). Änderungen werden durch cellRef und Tabellenblattnamen verankert, inline als <del>alt</del><ins>neu</ins> dargestellt, mit einer Symbolleiste für Nächste, Vorherige, Akzeptieren und Ablehnen. KI und Benutzer führen Zelle für Zelle zusammen, wobei Benutzeränderungen bei Konflikten Vorrang haben.

Physik- & Strukturanalyse

Berechnen Sie Projektilbewegung, Kollisionen, Energie, Impuls, Kraft, Impulssatz, Geschwindigkeit zum Ziel, Balkenbelastung, Knicken von Säulen und Materialeigenschaften.

Private Sync

Synchronisieren Sie Ihre Einstellungen und Konversationen über ein verschlüsseltes Cloud-Backup auf allen Geräten. Siehe Private Sync für Details.

MCP Servers

Verbinden Sie sich mit Remote-MCP-Servern über HTTP/SSE oder führen Sie Desktop-Tools (lokales MCP über die Desktop-App) auf Ihrem eigenen Rechner aus. Erstellen Sie benutzerdefinierte Tool-Integrationen oder verbinden Sie sich mit Drittanbieter-Diensten.

Meeting Recall

Rufen Sie Details aus aktuellen Videoanrufen ab — Transkripte, Action-Items und Zusammenfassungen, damit Sie Meeting-Kontext in jede Konversation einbeziehen können.

Messaging Gateway

Beantworten und senden Sie Nachrichten über WhatsApp, Telegram und mehr, wobei der Agent für Sie antwortet. Siehe Messaging Gateway.

Weitere Pro-Funktionen

  • Unbegrenzte benutzerdefinierte Modi — Erstellen Sie Ihre eigenen KI-Persönlichkeiten mit benutzerdefinierten Prompts und Variablen
  • Benutzerdefinierte Profilvariablen — Personalisieren Sie das KI-Verhalten über alle Modi hinweg
  • Anweisungen pro Aktion — Passen Sie an, wie sich jede Tool-Aktion verhält
  • Caiioo Benchmarks — Vergleichen Sie die Leistung von Modellen mit Qualitätsbewertungen und Durchsatztests
  • Priorisierter Support — Senden Sie Support-Tickets direkt aus der App

Experimentelle Tools

Aktivieren Sie experimentelle Tools über einen Schalter auf dem Gerät. Diese wechseln, während Funktionen für die Gratis- oder Pro-Stufe ausreifen. Verfügbare Optionen umfassen GitHub-Integration, Slack, fortgeschrittenes räumliches Denken, Testautomatisierung und mehr.

Tools aktivieren oder deaktivieren

Gehen Sie zu Einstellungen > Tools, um zu sehen, was verfügbar ist, und Tools ein- oder auszuschalten. Einige Modi kommen mit spezifischen, vorkonfigurierten Tools.

Siehe auch


This guide is maintained by the Caiioo team using Slate, our built-in editor.