Dies ist eine maschinelle Übersetzung des englischen Originaldokuments. Im Falle von Widersprüchen zwischen dieser Übersetzung und der englischen Originalversion ist die englische Version maßgeblich. Englische Originalversion lesen
Version 0.9.724 (18. Juni 2026)
Ein Follow-up zu 0.9.723, das OpenAI als Bring-your-own-key-Sprachanbieter hinzufügt, optionale anonyme Nutzungsanalysen, die Sie vollständig kontrollieren, und reichhaltigere Vorschauen für Audio- und Videoanhänge, zusammen mit Korrekturen für tool-intensive Hub-Apps, Skill-Namen, Anmeldungen bei verbundenen Diensten und dem Einfrieren beim Start nach einem abgelaufenen Abonnement.
Neue Funktionen
- Allgemein: OpenAI ist jetzt ein Bring-your-own-key-Sprachanbieter: OpenAIs gpt-4o-mini-tts ergänzt die Sprachauswahl pro Modus für Text-to-Speech. Die Wiedergabe ist steuerbar — fragen Sie in natürlicher Sprache nach einem Akzent, Tonfall oder Tempo (z. B. „lies dies mit einem warmen irischen Akzent“), und die Stimme folgt der Anweisung. Fügen Sie Ihren OpenAI API-Key unter Einstellungen → Sprache hinzu.
- Allgemein: Audio- und Videoanhänge zeigen jetzt eine echte Vorschau: Ein aufgenommener oder angehängter Audioclip stellt seine tatsächliche Wellenform auf dem Anhang-Chip dar, anstatt eines generischen Dateisymbols, und ein Videoanhang zeigt ein Standbild aus dem Clip — so können Sie Clips auf einen Blick unterscheiden. Die Vorschau wird einmal generiert und wiederverwendet.
- Allgemein: Optionale anonyme Nutzungsanalysen — standardmäßig deaktiviert im EWR, UK und der Schweiz: Sie können wählen, ob Sie anonyme, inhaltsfreie Signale teilen möchten, die uns helfen, Zuverlässigkeitsprobleme zu finden und zu beheben — zum Beispiel, ob ein Durchgang erfolgreich war oder auf eine bestimmte Art von Fehler gestoßen ist, plus Ihr explizites 👍/👎 Feedback zu einer Antwort. Dies umfasst niemals Ihre Konversationen, Prompts, Identität, IP-Adresse oder irgendeinen Identifikator, der Sie zwischen Sitzungen verfolgt; es handelt sich ausschließlich um First-Party-Daten (keine Drittanbieter-Tracker); und Ereignisse werden ohne jegliche Verbindung zu Ihnen gespeichert. Im EWR, UK und der Schweiz bleibt dies deaktiviert, bis Sie es einschalten; andernorts ist es aktiviert mit einem One-Tap-Ausschalter. Ändern Sie dies jederzeit unter Einstellungen → Datenschutz & Diagnose; es gibt in keinem Fall Gebühren, Rabatte oder Funktionsunterschiede.
Verbesserungen
- Allgemein: Einstellungen → Sprache warnt, wenn ein Sprachanbieter keine niedrige Latenz bietet: Gemini und OpenAI schließen die Generierung der gesamten Antwort ab, bevor Audio abgespielt wird, sodass der erste Ton bei längeren Antworten einige Sekunden verzögert sein kann — im Gegensatz zu ElevenLabs, Cartesia und Resemble, die mit dem Sprechen beginnen, sobald die Audiodaten eintreffen. Die Auswahl eines der langsameren Anbieter zeigt nun einen kurzen Hinweis unter der Sprachauswahl an, der den Kompromiss erklärt und auf die schnelleren Optionen hinweist, damit die Verzögerung erwartet wird und nicht verwirrt.
- Allgemein: Der Umschalter für die Audio-Analyse ist jetzt ausgeblendet, außer eine App benötigt ihn: Die Wellenform-Schaltfläche neben dem Mikrofon — die Ihre tatsächliche Aufnahme anhängt, damit ein Modell, das hören kann, diese zusammen mit Ihrem Prompt überprüfen kann — ist ein Nischen-Steuerelement, das für die meisten Aufgaben nicht nützlich ist. Es ist jetzt standardmäßig ausgeblendet und erscheint nur in Modi oder Apps, die sich explizit dafür entscheiden, damit der Composer nicht länger überladen wird. Wenn zuvor eine Aufnahme zur Erfassung eingestellt war, pausiert diese Erfassung ebenfalls, während der Umschalter ausgeblendet ist, sodass nichts ohne einen sichtbaren Ausschalter aufgenommen wird.
Fehlerbehebungen
- Allgemein: Installierte Hub-Apps senden nicht mehr jedes Tool bei jedem Durchgang: In Apps, die vorkonfigurieren, auf welche Tools der Assistent zugreift (für Medizin, Recht und Ähnliches), wurde diese Konfiguration ignoriert, sodass bei jedem Durchgang stillschweigend die vollständige Tool-Liste gesendet wurde — was die Durchgänge langsamer und teurer machte. Die Konfiguration wird nun berücksichtigt, sodass jeder Durchgang nur die relevanten Tools enthält.
- Allgemein: Integrierte Skills zeigen ihre echten Namen: Ein Standard-Skill konnte mit einem Platzhalternamen wie „Skill 1781…“ anstelle seines richtigen Titels erscheinen; Skills zeigen nun lesbare Namen (zum Beispiel „Seite zusammenfassen“), und alle bereits mit einem Platzhalter erstellten Skills werden automatisch korrigiert.
- Extension: Verbundene Dienste trennen die Verbindung nicht mehr vorzeitig, wenn sie über Ihr privates Relay verwendet werden: Das Aktualisieren der Anmeldung eines verbundenen Dienstes über Ihr privates Relay konnte das Sitzungs-Token verlieren und abgelehnt werden, wodurch die Verbindung vorzeitig als abgelaufen markiert wurde. Die Anmeldung wird nun korrekt aktualisiert.
- Allgemein: Ein Einfrieren beim Start nach Ablauf eines Abonnements wurde behoben: Wenn Ihr Pro-Abonnement abgelaufen war oder gekündigt wurde, konnte die App beim Laden in einer Wiederholung des Free-Tier-Downgrades stecken bleiben — was die Benutzeroberfläche einfror, bevor sie vollständig geöffnet war. Das Downgrade wird nun sauber in einem einzigen Durchgang abgeschlossen, sodass die App normal startet und jede Free-Tier-Funktion beibehält.
Version 0.9.723 (12. Juni 2026)
Ein gezieltes Follow-up zu 0.9.722 mit einem neuen BYOK-Sprachanbieter, einer frischen App zur klinischen Entscheidungsunterstützung, In-App-Bearbeitung für persönliche Hub-Apps, der Möglichkeit, Caiioo von jedem Browser aus über Ihr eigenes privates Relay zu nutzen, einem übersichtlicheren Settings-Panel, Durable-Mode-Bearbeitung mit automatischem Forking, einem substanziellen zweiten Durchgang der Dokument-Round-Trip-Pipeline, einer Streaming-Zuverlässigkeitsprüfung über alle AI-Anbieter hinweg und einem Security-Hardening-Sweep.
Neue Funktionen
- Common: Cartesia ist jetzt ein BYOK-Sprachanbieter: Cartesia Sonic für Text-to-Speech und Cartesia Ink für Speech-to-Text sind jetzt im Sprachwähler pro Modus, in den Erstbenutzungs-TTS / STT-Dialogen und im Live-Untertitel-Pfad verfügbar. Fügen Sie Ihren Cartesia API-Key in Settings → Voice hinzu und wählen Sie Cartesia überall dort aus, wo ein Sprachanbieter gewählt werden kann.
- Common: Bearbeiten Sie jede geforkte Hub-App innerhalb von Caiioo: Settings → Tools, Modes & Apps erhält einen Editor pro Primitive für persönliche Apps (geforkte Hub-Apps und von Ihnen gespeicherte Apps). Cards, Views, Workflows, Skills, Modes und Variablen erhalten jeweils dedizierte Editoren mit sicheren Standardwerten, sodass ein fehlerhaftes Primitive in einem Fork den Editor nicht mehr zum Absturz bringen kann. Der Agent kann zudem eine nützliche Sitzung über das neue
save_session_as_app-Tool als Entwurf einer persönlichen App speichern – sagen Sie einfach "Speichere dies als App" (oder ähnlich), und sie wird in Ihrem Speicher für persönliche Apps abgelegt, damit Sie sie verfeinern können. - Common: Bearbeiten Sie den System-Prompt jedes Modus — Caiioo forkt ihn für Sie: Sie können jetzt den System-Prompt (oder die gesamte Definition) jedes Modus bearbeiten, einschließlich integrierter und über den Hub installierter Modi. Die erste Bearbeitung forkt die App des Modus automatisch in eine persönliche Kopie, sodass Ihre Änderungen über Moduswechsel hinweg bestehen bleiben und mit Ihren anderen Geräten synchronisiert werden, wie jede persönliche App. Ein Banner "Geforkt von … — Ihre Kopie" wird angezeigt, wann immer Ihre Kopie aktiv ist, mit einem One-Click-Reset, der das Original wiederherstellt. Bestehende benutzerdefinierte Modi werden automatisch in dieses System migriert.
- Common: Caiioo for Medicine (Beta): Eine neue über den Community Hub installierbare App, die dem Muster von Caiioo for Legal folgt – eine Fabrik zur klinischen Entscheidungsunterstützung, die Skills für Differenzialdiagnose, Arzneimittelwechselwirkungen und SOAP-Notizen zusammen mit entsprechenden Referenzmaterialien bündelt. Installation mit einem Klick, forkar wie jede Hub-App.
- Common: Nutzen Sie Caiioo von jedem Browser aus über Ihr eigenes privates Relay: Wenn Sie angemeldet sind und Ihr Desktop-Relay läuft, zeigt das Öffnen von caiioo.ai in einem Browser ohne die Extension nun dieselbe Sidepanel-UI über Ihr privates Relay an – so können Sie Caiioo von einem Chromebook, einem öffentlichen Computer oder einem Tablet aus nutzen, während jeder Tool-Aufruf weiterhin über Ihren eigenen Rechner geroutet wird.
- Common: Settings-Panel neu organisiert: Das Layout der erweiterten Einstellungen besteht nun aus sieben Kategorien für Benutzerabsichten – Account, Personalization & Privacy, AI Setup, Tools / Modes & Apps, Data & Sync, Connectivity und Help – statt der bisherigen fünf. User Profile und Credentials Vault ziehen in eine dedizierte Account-Kategorie um, LAN Relay / API Access / Messaging Gateway werden als Connectivity gruppiert (der gemeinsame Nenner sind ein- und ausgehende Netzwerkschnittstellen), Voice verschiebt sich nach AI Setup (es ist AI-Verhalten, kein Tool), und Backup / Private Sync / Data Management bilden ihre eigene Kategorie Data & Sync. Die Simple-Mode-Variante fasst dieselben Steuerelemente in sechs Kategorien zusammen, wobei Power-User-Optionen vollständig ausgeblendet werden.
Verbesserungen
- Common: Dokument-Round-Trip — zweiter Fidelity-Pass: Ein weiterer Durchgang durch Slate / DOCX / PDF / RTF / Google Docs hat eine lange Liste von Round-Trip-Befunden behoben. Highlights: Generierte nachverfolgte Änderungen emittieren nun Word-konforme Änderungs-IDs und flachen verschachtelte Änderungsmarkierungen ab (sodass Word beim Öffnen nicht mehr über "beschädigte" Änderungen klagt); DOCX-Kommentare werden nach ID dedupliziert statt doppelt gezählt; der DOCX → Markdown-Export maskiert literale
|-Zeichen in Tabellenzellen, damit die Tabelle nicht zerfällt; der RTF-Parser verarbeitet eingebettete Binärsegmente (\binN) korrekt, sodass fehlerhafte Bytes den Rest des Dokuments nicht mehr desynchronisieren, überspringt\ucUnicode-Fallbacks ordnungsgemäß, dekodiert\'hhHexadezimalwerte via Windows-1252, bewahrt nachverfolgte Revisionen und rendert Bild-Platzhalter; PDFToUnicodeCMaps dekodieren Surrogate-Paare und bfrange-Array / Multi-Unit-Formen (Non-BMP-Zeichen und Emojis werden sauber extrahiert); die Präfix-Erkennung für nachverfolgte Änderungen verarbeitet eingerückte und verschachtelte Listenmarkierungen sowie)-Nummerierungen; und die Fidelity-Matrix zeigt nun Kommentarverluste für docx → md/html/rtf und pdf → docx an, damit Sie vorab sehen, was nicht im Round-Trip erhalten bleibt. Der RTF-Export entfernt zudem ausstehende nachverfolgte Löschungen, anstatt sie als literalen Text einzufügen. - Common: Google Sheets-Formeln überstehen Slate-Sync: Das Bearbeiten eines synchronisierten Google Sheets aus Slate heraus überschreibt Formeln nicht mehr mit ihren berechneten Werten. Die Auflösung nachverfolgter Änderungen in Slate wurde ebenfalls korrigiert, sodass beim Akzeptieren / Ablehnen der richtige Text übernommen wird, wenn der Inhalt bereits mit dem Ziel übereinstimmt.
- Common: Google Docs-Sync ignoriert Tabellenzellen-Absätze: Der Sync-Scanner lief zuvor in Tabellenzellen hinein und erzeugte falsche Dokument-Offsets. Zellen werden nun vor dem Absatz-Scanning übersprungen, sodass Bearbeitungen in Dokumenten mit Tabellen an der korrekten Position landen.
- Common: Pseudonymizer schützt maschinengenerierte IDs End-to-End: Slate (und jedes Tool, das maschinengenerierte Identifikatoren emittiert) kann diese nun in einen
<!--no-pseudonymize-->-Marker einschließen, der die gesamte Pipeline übersteht – der Pseudonymizer überspringt sie, und die Marker werden entfernt, bevor sie den Bildschirm erreichen. Dies löst den Fall, bei dem die interne ID eines Tool-Aufrufs in einem Turn pseudonymisiert und im nächsten aus der Ersetzungstabelle entfernt wurde, was nachfolgende Tool-Aufrufe, die darauf verwiesen, unbrauchbar machte. - Common: Self Checker führt den Judge nun auf dem Server aus: Das Klicken auf die ⚖-Schaltfläche verlagert die Urteilsberechnung auf das Relay, anstatt sie im Sidepanel auszuführen. So wird das Ergebnis auch dann fertiggestellt, wenn Sie das Panel schließen, es wird schneller geliefert und bleibt über Geräte hinweg konsistent. Der Judge-Aufruf wird zudem durch denselben Pseudonymizer auf Thread-Ebene geroutet wie der ursprüngliche Turn, sodass ein Urteil über eine pseudonymisierte Nachricht niemals echte PII an das Judge-Modell weitergibt.
- Common: Skill / Mode-Badges im Settings-Inventar: Jeder installierte Skill in Settings → Tools, Modes & Apps zeigt nun an, zu welchem Modus bzw. welchen Modi er gehört, damit Sie auf einen Blick sehen, wo der Agent tatsächlich darauf zugreifen kann.
- Common: Free-Tier-Nutzer mit dem bereitgestellten Key erhalten keinen 401 mehr bei der Web-Suche: Such-Tools lösten den OpenRouter-Key über einen Codepfad auf, der den Credential-Resolver umging, weshalb Nutzer mit dem bereitgestellten Key (kein BYOK) zeitweise 401-Fehler erhielten. Der Resolver wird nun an jeder Aufrufstelle ausgeführt.
- Common: UI-Context-Provider ist spürbar flinker: Der Extension-UI-Context-Provider erhielt Ergebnis-Caching, Lazy-Mode-Loading, Alias-Auflösung und engere Ausschlüsse, sodass der Modell-Wähler und der Modus-Wähler bei großen Workspaces nicht mehr stocken.
- Common: Voice-Wiedergabegeschwindigkeit funktioniert jetzt für ElevenLabs und Cartesia: Der Geschwindigkeitsregler hatte bei ElevenLabs oder Cartesia keine Auswirkung – die Sprache wurde unabhängig von der Einstellung immer in normalem Tempo abgespielt. Beide Anbieter generieren Sprache nun in der von Ihnen gewählten Geschwindigkeit. (ElevenLabs unterstützt 0.7–1.2×, Cartesia 0.6–1.5×; der Regler wird auf den Bereich des jeweiligen Anbieters begrenzt. Resemble und Gemini bieten keine Geschwindigkeitssteuerung und bleiben unverändert.)
- Common: STT-Modell-Ladevorgang im Composer sichtbar: Wenn das On-Device-Sprachmodell heruntergeladen oder vorbereitet wird, zeigt der Composer nun den tatsächlichen Download-Prozentsatz an. Gleichzeitige Ladeanfragen werden serialisiert, sodass zwei fast zeitgleiche "Sprechen"-Aktionen keine doppelten Downloads auslösen.
- Common: Composer behält den Senden-Button bei schmalen Breiten auf dem Bildschirm: Der Senden-Button konnte zuvor aus dem Composer rutschen, wenn das Panel sehr schmal war. Er bleibt nun unabhängig von der Breite verankert.
- Common: Remote-Sidepanel verbindet sich sauber neu: Für die neue Funktion "Caiioo über einen Browser via privatem Relay" adressiert das Relay Antworten nun korrekt an den Remote-Browser zurück und bereitet ihn beim Verbinden mit einem initialen Status-Snapshot vor, sodass Reconnects im selben Zustand wie zuvor erscheinen.
- Common: UI-Asset-Handler geben Request-IDs zurück: Antworten geben nun die ursprüngliche Request-ID an den Aufrufer zurück, was eine Klasse von "Stuck-Spinner"-Bugs behebt, bei denen zwei Asset-Abrufe konkurrierten und das zweite Ergebnis verworfen wurde.
- Common: Caiioo for Legal heißt jetzt nur noch "for Legal": Das Präfix "Caiioo for" im Namen der Legal-App war redundant, nachdem "for Medicine" ohne dieses Präfix eingeführt wurde. Bestehende Installationen funktionieren weiterhin über die Legacy-ID.
- Common: Streaming-Zuverlässigkeitsprüfung über alle AI-Anbieter hinweg: Eine tiefgehende Überprüfung, wie Antworten von jedem Anbieter gestreamt werden. Antwortfragmente, die über Netzwerkpakete verteilt ankamen, konnten lautlos verworfen werden – was das mehrstufige Extended Thinking bei Anthropic-Modellen, die Reasoning-Kontinuität bei Gemini und GPT-5 unterbrach und gelegentlich Antworttexte bei lokalen MLX-Modellen komplett verlor. Zudem konnten nicht-englische Texte oder Emojis in gespeicherten Antworten als korrupte -Zeichen ankommen. Beides wurde überall behoben. Die Stop-Schaltfläche bricht nun auch eine laufende Perplexity-Suche ab, anstatt sie im Hintergrund zu Ende führen (und abrechnen) zu lassen. Das Stoppen eines Durchlaufs erreicht nun auch alle noch arbeitenden Sub-Agenten, und Bilder, die beim Chatten mit Mistral-Modellen angehängt werden, werden bei der Übertragung nicht mehr beschädigt.
- Common: Skills haben jetzt ordentliche Namen: Jeder Skill trägt einen expliziten Anzeigenamen, der in den Settings, im Skill-Wähler des Composers und dem Agenten selbst angezeigt wird – so werden Skills, deren Prompts mit ähnlichem Wortlaut beginnen, nicht mehr in ununterscheidbare Zeilen zusammengefasst. Das Tippen von "/" im Composer sucht primär nach Namen, und das Veröffentlichen im Hub erfordert nun einen Namen für jeden Skill.
- Common: Hub-App-Modi behalten ihre volle Konfiguration: Aus dem Community Hub installierte Modi (for Legal, for Medicine, …) konnten tief im Agent-Core lautlos auf den allgemeinen Modus zurückfallen, wodurch ihre Variablen und Tool-Konfigurationen mitten im Lauf verloren gingen. Sie werden nun überall korrekt aufgelöst, und ein Modus, dessen Definition nicht aufgelöst werden kann, fällt auf den Standard-Caiioo-Prompt zurück statt auf einen leeren.
- Common: Korrekturen für Accounts mit bereitgestelltem Key (von Caiioo ausgestellt): Das Neuausstellen Ihres von Caiioo bereitgestellten AI-Keys löscht nicht mehr gekaufte Credits – das verbleibende Guthaben wird auf den neuen Key übertragen. Das Widerrufen eines Keys widerruft diesen nun tatsächlich beim Anbieter, bevor der Erfolg gemeldet wird. Accounts mit unbegrenztem Guthaben zeigen nun "Unlimited" statt einer Zahl an und lösen keine automatischen Credit-Käufe mehr aus. Ein kurzer Anmeldefehler beim Wiederherstellen Ihres Keys auf einem neuen Gerät führt nun zu einem erneuten Versuch statt zu einem Fehlschlag.
- Common: Modell-Auswahl im Free-Tier bleibt aktuell: Die Modell-Liste für den Free-Tier bietet keine kostenlosen Modelle mehr an, die der Anbieter eingestellt hat, was zuvor bei Auswahl zu sofortigen Fehlern führte.
- Common: Videogenerierung prüft zuerst die tatsächlichen Fähigkeiten jedes Modells: Das Video-Tool liest nun die Live-Fähigkeiten jedes Modells – unterstützte Seitenverhältnisse, Dauern, Auflösungen und ob es Referenzframes akzeptiert – direkt vom Anbieter aus und validiert Ihre Anfrage vor dem Absenden. So schlägt eine nicht unterstützte Kombination sofort mit einer klaren Meldung fehl, statt erst nach langer Wartezeit. Das Animieren von Referenzbildern sendet diese nun in einem Format, das jedes Modell akzeptiert.
- Common: Pseudonymizer-Abdeckung — Thread-Titel und Helper-Aufrufe: Bei aktiviertem Pseudonymizer werden automatisch generierte Konversationstitel und die kleinen internen AI-Helper-Aufrufe nun durch denselben Schutz geroutet wie Ihre Nachrichten – sowohl auf dem Client als auch auf dem Relay – sodass ein Thread-Titel keinen echten Namen mehr an das Modell übertragen kann. Antworten von Sub-Agenten zeigen nun die echten Werte auf dem Bildschirm anstelle ihrer Ersatznamen.
- Common: GitHub-Sync verarbeitet nicht-englische Inhalte und gleichzeitige Bearbeitungen: Von GitHub synchronisierte Dateien mit Akzenten oder nicht-lateinischen Zeichen kommen nicht mehr verstümmelt an. Das Pushen einer Änderung an einer Datei, die seit Ihrem letzten Sync auf GitHub verschoben wurde, zeigt nun einen Konflikt an, anstatt die neuere Kopie lautlos zu überschreiben.
- Common: Vorübergehende Serverfehler melden Sie nicht mehr ab: Ein temporärer Serverfehler während des täglichen Hintergrund-Anmelde-Refreshes konnte Ihre Sitzung löschen und Sie abmelden. Nur eine echte Ablehnung der Anmeldedaten führt jetzt zur Abmeldung; alles Vorübergehende behält Ihre Sitzung innerhalb eines Kulanzfensters bei.
- Common: Remote-Browser-Client startet sauber: Das Öffnen von caiioo.ai über einen normalen Browser (durch Ihr privates Relay) zeigt während der Anmeldung keine lange Liste von Verbindungsfehlern mehr an, und nach einem Update lädt die UI immer frisch statt einer veralteten Cache-Kopie.
- macOS, iOS, Android: Cold-Start-Modell-Prewarm: On-Device-Sprach- und STT-Modelle werden nun während des App-Starts vorbereitet, anstatt sie bei der ersten Verwendung verzögert zu laden, wodurch die mehrsekündige Latenz beim ersten Aufruf entfällt. Das erste Tippen auf das Mikrofon fühlt sich nun fast verzögerungsfrei an.
- iOS: Einhaltung der App Store §3.1.1 Sales-Routing-Richtlinien: Alle externen Zahlungsschnittstellen (Stripe-Checkout-Buttons, Links zur Rechnungsverwaltung außerhalb der App) werden hinter einer iOS-Prüfung gesperrt, sodass der iOS-Client nur noch In-App-StoreKit-Käufe für digitale Abonnements anbietet, um Apples Anti-Steering-Richtlinie zu entsprechen.
- iOS, macOS: Veraltete Safari-Extension-Registrierungen blockieren den Relay-Pfad nicht mehr: Wenn Apples WebKit mehrere veraltete Safari-Extension-Registrierungen über App-Updates hinweg beibehält, entfernt Caiioo nun die ersetzten Duplikate, anstatt sie inaktiv zu blockieren, sodass die Relay-gestützte Safari-Extension ohne manuelle Neuinstallation weiter funktioniert.
- Android: Veraltete Medienberechtigungen bereinigt:
READ_MEDIA_IMAGESwurde aus dem Manifest entfernt, und die veralteten Berechtigungen, die implizit durch die LiteRT-GPU-Bibliothek hinzugefügt wurden, wurden entfernt. Die Laufzeit-Berechtigungsabfrage der App ist nun minimal – näher an dem, was die Nutzer tatsächlich zugestimmt haben.
Sicherheit
- Common: Hardening-Sweep über Importe, Rendering und Logging: Präparierte Word-Dokumente und Konversations-Importarchive können den Speicher nicht mehr durch Dekomprimierungstricks erschöpfen (strikte Größenbeschränkungen und sichereres Dokument-Parsing); ein bösartig strukturierter ChatGPT-Export kann den Importer nicht mehr aufhängen; drei Cross-Site-Scripting-Risiken auf der Dokumentenseite (Slate) wurden geschlossen; der Server verweigert nun das Abrufen von modell-vorgeschlagenen URLs, die auf interne oder private Netzwerkadressen verweisen; Filterregeln werden abgelehnt, wenn ihr Muster den Matcher blockieren könnte; und ein Zahlungs-Webhook-Debug-Log zeichnet keine Secrets mehr auf.
Fehlerbehebungen
- Common: API-Key für Sprachanbieter erscheint an der richtigen Stelle: Wenn ein Cloud-Anbieter nur für Speech-to-Text verwendet wurde (z. B. Cartesia Ink als Diktier-Engine), war das Feld für den API-Key unten im Bereich Text-to-Speech (Ausgabe) gestrandet, statt neben dem Speech-to-Text-Wähler – und blieb sichtbar, selbst wenn Sie Ihre TTS-Stimme auf einen anderen Anbieter umstellten. Das Key-Feld jedes Anbieters wird nun unter dem Selektor gerendert, der es tatsächlich verwendet (Eingabe vs. Ausgabe), gesteuert durch eine einzige Sprachanbieter-Definition.
- Common: Auto-Read funktioniert jetzt mit Cartesia- und Gemini-Stimmen: Der Schalter "Antworten laut vorlesen" wurde lautlos nie aktiviert, wenn Ihre TTS-Stimme Cartesia oder Google Gemini war – beide wurden fälschlicherweise als On-Device-Modelle klassifiziert, die auf einen Download warten. Auto-Read schaltet sich nun korrekt ein, sobald der API-Key des Anbieters (und die Stimme, falls erforderlich) festgelegt ist.
- Common: Cartesia-Diktat funktioniert überall: Cartesia Ink als Speech-to-Text-Engine wird nun korrekt als bereit erkannt, sobald der API-Key gesetzt ist (statt wie ein lokales Modell behandelt zu werden, das auf einen Download wartet) – über die Extension, native Apps und Relay-gestützte Setups (macOS oder der Web-Client über Ihr privates Relay), wo das Relay zuvor versuchte, "cartesia" als On-Device-Modell zu laden.
- Common: Gemini-Stimme beginnt früher mit der Wiedergabe: Google Gemini TTS liest Antworten nun Satz für Satz laut vor, sodass die Wiedergabe nach dem ersten Satz beginnt, anstatt darauf zu warten, dass die gesamte Antwort synthetisiert wurde – passend dazu, wie sich ElevenLabs, Cartesia, Resemble und Kokoro anfühlen. (Die API von Gemini generiert eine ganze Äußerung auf einmal, daher erfolgt das Chunking auf unserer Seite; der Geschwindigkeitsregler gilt nun auch für Gemini.)
- Common: Sprachwiedergabefehler werden jetzt angezeigt, nicht mehr verschwiegen: Wenn das Vorlesen einer Antwort fehlschlägt (fehlender/ungültiger API-Key, eine inkompatible Resemble-Stimme/Modell, eine Ablehnung durch den Anbieter usw.), erscheint der Grund nun als Meldung auf dem Bildschirm, anstatt lautlos mit nur einem Konsolen-Log fehlzuschlagen. Die Meldungen sind handlungsorientiert (z. B. "Die gewählte Resemble.ai-Stimme unterstützt das 'chatterbox-turbo'-Modell nicht — wählen Sie eine Chatterbox-kompatible Stimme…").
- Common: Klarere Resemble.ai Sprach-/Modell-Fehlermeldung: Wenn eine ausgewählte Resemble-Stimme das gewählte Modell nicht unterstützt, nennt die Fehlermeldung nun genau dies und wie es zu beheben ist, anstatt einen rohen internen Fehler-Payload anzuzeigen.
- Common: HEIC/HEIF-Fotos von modernen iPhones werden wieder konvertiert: Das Anhängen eines aktuellen iPhone-Fotos (HEIC/HEIF) schlug bei der Konvertierung fehl – es trat der Fehler "Format nicht unterstützt" auf und es wurde auf einen einfachen Dateianhang zurückgefallen, statt eines anzeigbaren Bildes. Der integrierte Bildkonverter war Jahre veraltet und konnte Fotos von aktuellen iPhones (insbesondere Aufnahmen in voller Auflösung und HDR) nicht lesen. Er wurde durch einen aktuellen Decoder ersetzt, sodass HEIC/HEIF-Anhänge wieder in JPEGs umgewandelt und inline angezeigt werden.
- Common: Video- und Musik-Tools zeigen immer die Live-Modellliste an: Die Video- und Musik-Tools zeigten dem LLM bisher nur ihre drei gebündelten Fallback-IDs an – das Hintergrund-Warm-up pro Turn, das die Live-OpenRouter-Video/Musik-Register innerhalb des Relay-Subprozesses abrief, war fehleranfällig und verpasste routinemäßig die Deadline, bevor die Tool-Beschreibung versendet wurde. Der gecachte Registerstatus bereitet nun die Video- und Musik-Modelldienste beim Start des Subprozesses vor, sodass das Tool immer die aktuelle Auswahl (Kling, Hailuo, Wan usw.) anzeigt und ein vom Benutzer ausgewähltes Modell ohne Netzwerk-Round-Trip pro Turn aufgelöst wird.
- Common: Multi-Modell-Benchmarks im Test Runner liefern nun aussagekräftige Scores: Das Ausführen eines "Vergleiche diese Modelle"-Benchmarks mit
runLLMJudge = trueerzeugte bisher lautlos Null-Scores und ein Ranking nach Eingabereihenfolge, da der Pfad auf Suite-Ebene nur dieevaluation-Einstellungen pro Test prüfte und das laufweite Flag ignorierte. Die Prüfung berücksichtigt nun beide Signale, und wenn der Judge aktiviert ist, aber keine Rubrik angegeben wurde, wird eine Standardrubrik (Faktizität + Vollständigkeit + Klarheit + Hilfsbereitschaft) angewendet. Die Aktionenget_resultundexport_transcriptdestest_runner-Tools lehnen zudem nicht mehr mitrunId and testId are requiredab, wenn nur eines davon fehlte – der Fehler nennt nun das tatsächlich fehlende Feld. - Common: Sprachwiedergabe konnte auf iOS und Safari komplett stumm sein: Das Vorlesen von Antworten erzeugte manchmal gar keinen Ton, bis die App neu gestartet wurde – die Audio-Engine startete in einem suspendierten Zustand und wurde nie aufgeweckt. Die Wiedergabe erzeugt nun zuverlässig Ton.
- Common: Tägliche Erinnerungen werden zur eingestellten Zeit ausgelöst: Eine wiederkehrende Erinnerung, die beispielsweise für 9:00 Uhr erstellt wurde, konnte driften und stattdessen jeden Tag zu dem Zeitpunkt ausgelöst werden, an dem sie erstellt wurde. Wiederholungen sind nun an die geplante Startzeit gebunden.
- macOS, Desktop: Benachrichtigungen für geplante Aufgaben kommen tatsächlich an: Wenn eine geplante Aufgabe abgeschlossen wurde und versuchte, Sie zu benachrichtigen, ließen die macOS- und Windows/Linux-Desktop-Apps die Benachrichtigung lautlos fallen. Sie erscheint nun als normale Systembenachrichtigung.
- Common: Fehler bei der Registrierung sind nicht mehr lautlos: Wenn die Bestätigungs-E-Mail während der Registrierung nicht gesendet werden kann, erhalten Sie nun sofort eine klare Fehlermeldung, anstatt einer Registrierung, die scheinbar erfolgreich ist, aber niemals die E-Mail zustellt.
- Common: Das "+"-Anhang-Menü des Composers erscheint wieder auf schmalen Panels: Die frühere Korrektur, die den Senden-Button bei sehr schmalen Breiten auf dem Bildschirm hielt, schnitt versehentlich das Anhang-Menü weg. Beide passen nun.
- Common: Claude-Modellnamen funktionieren wieder für BYOK-Anthropic-Nutzer: Die Auswahl bestimmter Claude-Modelle mit Ihrem eigenen Anthropic-Key führte aufgrund eines veralteten internen Modellnamen-Mappings zu einem "Modell nicht gefunden"-Fehler. Modellnamen werden nun unverändert an Anthropic durchgereicht.
- Common: Ein fehlgeschlagener Schritt innerhalb eines mehrstufigen App-Workflows stoppt nun den Workflow: Ein verschachtelter Workflow, der fehlschlug, wurde seinem übergeordneten Element als Erfolg gemeldet, sodass der Fehlerbehandlungszweig des Workflows nie ausgeführt wurde. Fehler werden nun korrekt weitergegeben.
Version 0.9.722 (22. Mai 2026)
Dies ist das erste Release, in dem drei lang erwartete Funktionen — der Pseudonymizer, der Community Hub und das Messaging Gateway — für alle verfügbar sind. Alle drei wurden monatelang im Tester-Programm gehärtet; die folgenden Highlights decken sowohl den öffentlichen Start als auch die neuen Funktionen und Fehlerbehebungen ab, die zeitgleich veröffentlicht wurden.
Neue Funktionen
- Allgemein: Der Pseudonymizer startet für alle: Der On-Device-Filter für personenbezogene Daten von Caiioo erkennt Namen, E-Mails, Telefonnummern, Adressen, IDs, Organisationen, Städte und andere sensible Werte während der Eingabe und tauscht sie gegen realistische Platzhalter aus, bevor sie das Modell erreichen. Auf dem Rückweg wird dieser Tausch lokal rückgängig gemacht, sodass die Konversation auf Ihrem Bildschirm weiterhin die echten Werte anzeigt. Das Modell sieht die echten Werte nie; Tool-Aufrufe werden nach der Wiederherstellung mit den echten Werten ausgeführt. Aktivieren Sie die Funktion über das neue Schild-Symbol neben dem Senden-Button — grau für Aus, blau für den Filter für personenbezogene Daten, petrol für PHI / Limited Data Set, smaragdgrün für PHI / Safe Harbor. Während der Aktivierung umschließt ein farblich passender Ring das Eingabefeld als dezente Erinnerung, und unter jeder Nachricht, in der Werte getauscht wurden, erscheint ein Chip „🛡 pseudonymisiert — N Ersetzungen“; klicken Sie darauf, um genau zu sehen, welche Echt-zu-Fake-Paare mit Kategorie-Labels verwendet wurden. Enthält einen strengen PHI / Safe Harbor-Submodus (HIPAA §164.514(b)(2): entfernt auch Daten über das Jahr hinaus, vollständige geografische Adressen und Alter über 89) für Fälle, in denen Sie einen de-identifizierten Datensatz benötigen, den Sie ohne Data Use Agreement teilen können. (Die Funktion hieß zuvor „Anonymizer“. Wir haben sie in „Pseudonymizer“ umbenannt, da dies der technisch korrekte Begriff ist: DSGVO Art. 4(5) reserviert „Anonymisierung“ für einseitige, irreversible Transformationen, während diese Funktion designbedingt reversibel ist — Ihr Bildschirm zeigt weiterhin echte Namen.)
- Allgemein: Der Community Hub startet: Ein neuer One-Click-Marktplatz für die Installation von Tools, Modi, MCP-Servern und kompletten Apps, die Caiioo erweitern. Durchsuchen Sie ihn direkt in der Extension oder unter caiioo.ai/hub. Der Startkatalog umfasst Slack (einmalige Anmeldung mit der Caiioo Slack-App — keine manuelle App-Konfiguration oder Developer-Modus nötig), Notion, Linear, GitHub, Atlassian, PandaDoc, Microsoft 365, Legal Data Hunter (über 18 Mio. Dokumente zu Rechtsprechung, Gesetzgebung und Lehre aus über 110 Ländern) sowie 18 zusätzliche selbstregistrierende MCP-Server, die sich über den Login des jeweiligen Anbieters autorisieren — kein Kopieren von Secrets oder Setup im Developer-Modus erforderlich. Jedes Paket zeigt vor dem Klick auf Installieren eine Vorschau dessen an, was genau installiert wird — Tools, Modi, Skills, MCP-Server und Variablen.
- Allgemein: Tool Network Access — ausdrückliche Zustimmung bei Netzwerkzugriff: Wenn Sie einen lokalen Chat-Provider wählen (Ollama, MLX), treffen Sie eine bewusste Entscheidung für den Datenschutz — Ihre Konversation bleibt auf dem Gerät. Tools, die über einen Remote-Provider laufen (Bildgenerierung, Musik, Video, Perplexity-Websuche), haben diese Grenze früher stillschweigend überschritten. Caiioo stoppt nun beim ersten Versuch, zeigt direkt im Chat eine Karte zum Genehmigen/Abbrechen an, die das Tool und den Provider nennt, und merkt sich Ihre Entscheidung pro Provider. Die Berechtigung kann jederzeit unter Settings → Personalization & Privacy → Tool Network Access widerrufen werden.
- Allgemein: Das Messaging Gateway startet (Pro): Caiioo kann jetzt Nachrichten auf den Plattformen beantworten, die Ihre Kunden und Kontakte tatsächlich nutzen — WhatsApp Business, Messenger, Telegram, iMessage, Signal, Viber und Beeper — über ein einziges konfigurierbares Gateway in Settings → Messaging. Jeder Kanal nutzt die Standard-Bot-/Business-Zugangsdaten des jeweiligen Anbieters, die einmal pro Dienst eingegeben werden. Für jede Konversation wählen Sie, wie der Agent auftritt: Auto (Agent antwortet jedem; alles, was Sie im selben Thread schreiben, wird als Coaching behandelt, das die nächste Antwort formt), Direct (Agent antwortet weiterhin automatisch, aber alles, was Sie schreiben, wird als Ihre Nachricht an den Anrufer weitergeleitet) oder Takeover (Agent zieht sich komplett zurück und Sie übernehmen). Bild-, Audio- und Videoanhänge werden in beide Richtungen an das Modell weitergeleitet, sodass Sie fragen können „Was ist auf diesem Foto, das der Kunde gerade geschickt hat?“ und im selben Kanal antworten können. Slack befindet sich im Community Hub als eigenes MCP-Paket — installieren Sie es von dort statt über das Messaging Gateway.
- Allgemein: My Day (Beta): Eine zweite über den Hub installierbare App: Ein morgendliches Briefing mit einem Klick, das den heutigen Kalender, ungelesene E-Mails und aktuelle Dokumente in einem einzigen Dashboard zusammenführt. Der Button im Composer startet das Briefing; der Agent rendert jedes Mal in dieselbe Dashboard-Ansicht mit Follow-up-Skills zum Erweitern von Elementen, Entwerfen von Antworten oder Planen von Deep-Work-Blöcken.
- Allgemein: Storybook Builder (Beta): Eine weitere über den Hub installierbare App: Wählen Sie Stil, Zielgruppe, Altersgruppe und ein freies Briefing; der Agent entwirft ein Ensemble, zeichnet Referenzporträts für konsistente Charaktere, generiert jede Seite mit Text und Illustration, erstellt ein Cover aus der besten Seite und rendert das fertige Buch in einem lesbaren Scroll-Layout-Viewer. Wie jede Hub-App forkbar, sodass Sie den Master-Prompt anpassen oder die Stiloptionen austauschen können.
- Allgemein: Free-Plan enthält jetzt die Desktop-Apps: Die macOS- und Windows / Linux-Desktop-Apps erforderten früher Pro. Free-Nutzer können sich jetzt auf jeder Plattform in den Desktop-Apps anmelden — die Plattform selbst ist kostenlos, und Pro differenziert sich weiterhin durch Pro-exklusive Funktionen (Bildgenerierung, Remote-MCP-Server, geplante Aufgaben etc.).
- Allgemein: Pro Mobile eingestellt — ein einheitlicher $9 Pro-Tarif für Web, Desktop und Mobile: Der In-App-Kauf „Pro Mobile“ für $2.99 (iOS und Android) wurde entfernt. Der einheitliche Pro-Tarif für $9/Monat schaltet nun jeden Caiioo-Client auf jeder Plattform frei — Chrome, Edge, macOS, Windows, Linux, iOS, Android — ohne separate mobile SKU oder komplizierte Berechtigungsprüfungen. Bestehende Pro Mobile-Abonnenten werden ohne Zusatzkosten auf Pro umgestellt und behalten alle bisherigen Funktionen. Neue mobile Installationen sehen nur noch den $9 Pro-Tarif im In-App-Paywall, passend zur Website.
- Allgemein: Caiioo for Legal (Beta): Eine neue One-Click-Installation aus dem Community Hub aktiviert fünfzehn praxisübergreifende juristische Skills — Vertragsprüfung, Entwurf von Änderungen (Redlining), transaktionale Entwürfe, Memos & Gutachten, Advocacy, Batch-Playbook-Review und mehr — unterstützt durch zwei umfassende Verhandlungs-Playbooks (Einkaufs- und Verkaufsseite) mit Preferred / Fall-back / Walk-away-Stufen für Dutzende gängiger Klauseln. Variablen bleiben auf den Thread beschränkt, an dem Sie arbeiten, sodass jeder Fall seinen eigenen Mandanten, Gegenpartei, Gerichtsbarkeit und Position behält, ohne in den nächsten überzugehen.
- Allgemein: Self Checker — bewerten Sie jede Antwort mit dem neuen ⚖-Button: Jeder Assistant-Turn verfügt nun über einen ⚖-Button in der Aktionsleiste. Klicken Sie darauf, um die Antwort im Vergleich zu Ihrer Anfrage zu bewerten — der Judge sieht den vollständigen Turn (Ihren Prompt, alle Tool-Aufrufe mit Inputs und Outputs, angehängte Bilder und die Antwort des Assistants), erstellt deterministische Prüfungen (exakte Übereinstimmung, enthält, Regex, Zahlenbereich, Arithmetik), führt diese aus und rendert eine Ergebniskarte direkt im Chat. Wählen Sie einen beliebigen Provider, für den Sie einen Key haben; die LLM-Kosten des Judge fließen in die Gesamtsumme der Konversation ein, sodass keine versteckten Gebühren entstehen.
- Allgemein: Test Runner — testen Sie Caiioo mit Ihrer eigenen Beispielliste (Pro): Übergeben Sie Caiioo eine Liste von Prompts und eine Methode zur Bewertung jeder Antwort — Teilstrings, die erscheinen sollen, ein Muster, dem die Antwort entsprechen muss, spezifische Tools, die verwendet werden sollen, oder ein zweites Modell, das die Antwort auf einer Skala von 1-10 nach von Ihnen definierten Kriterien bewertet. Caiioo führt jeden Prompt in einer neuen Konversation aus, erfasst die Antwort des Assistants, welche Tools aufgerufen wurden, wie lange es gedauert hat und wie viel es gekostet hat, und erstellt dann einen Pass/Fail-Bericht, den Sie als CSV exportieren können. Nützlich, um stichprobenartig zu prüfen, ob sich ein neuer Modus, ein Modell oder eine installierte Hub-App noch wie erwartet verhält.
- Allgemein: Hub-Apps können fertige Referenzmaterialien enthalten: Ein Community Hub-Paket kann jetzt eigene Slate-Vorlagen, PDFs und andere Referenzdateien bündeln. Die Installation von Caiioo for Legal fügt beispielsweise die beiden Verhandlungs-Playbooks direkt in Ihre Bibliothek ein, sodass der Agent Ihre Verträge bereits beim ersten Turn dagegen prüfen kann.
- Allgemein: My Apps — forken Sie jede Hub-App und bearbeiten Sie sie als Ihre eigene: Ein neues My Apps-Panel in Settings → Tools, Modes & Apps ermöglicht es Ihnen, jede Community Hub-App als persönliche Kopie zu forken und alle ihre Primitiven — Tools, Skills, Modi, Karten, Ansichten, Workflows, Vorlagenanhänge und Variablen — mit spezifischen Editoren zu bearbeiten. Der Agent kann zudem eine nützliche Konversation als Entwurf für eine persönliche App speichern, damit Sie diese verfeinern können.
- Allgemein: Hub-Apps synchronisieren sich jetzt über Geräte hinweg: Installieren Sie ein Community Hub-Paket auf Ihrem Mac, erscheint es auch auf Ihrem iPhone und umgekehrt. Persönliche Apps (Apps, die Sie geforkt oder selbst gespeichert haben) werden ebenfalls synchronisiert. Paketbezogene Vector Clocks stellen sicher, dass keine Installation eine neuere Installation von einem anderen Gerät überschreibt.
- Allgemein: Hub Settings listet nun jede App-Primitive in einem eigenen Bereich auf: Tools, Modes & Apps wurde um vier neue Bereiche erweitert — Cards, Views, Workflows und Template Attachments — neben den bestehenden Tool Configuration und Agent Modes. Jeder Bereich ist ein schreibgeschütztes Inventar dessen, was Ihre installierten Apps tatsächlich enthalten, mit Quellenangabe, damit Sie sehen können, welches Hub-Paket welchen Skill, Modus oder welche Karte mitgebracht hat.
- Allgemein: Skills sind jetzt für das Modell sichtbar: Zuvor waren Skills rein UI-basiert — das Klicken auf einen Skill-Chip fügte Text in Ihre Nachricht ein, aber das Modell selbst hatte keine Kenntnis davon. Jeder Modus injiziert nun seine verfügbaren Skills (Name, Beschreibung, Prompt-Inhalt) in den System-Prompt, sodass Sätze wie „Nutze deinen Skill zur Vertragsanalyse für dieses PDF“ tatsächlich funktionieren.
- Allgemein: Sub-Agent-Karten werden direkt im Hauptchat gerendert: Wenn ein Sub-Agent eine Karte ausgibt (ein Self Checker-Urteil, ein generiertes Diagramm, eine strukturierte Ergebnisansicht), wird die Karte der übergeordneten Konversation zugeordnet und direkt neben dem Textergebnis des Sub-Agents gerendert — genau so, wie es bereits bei Sub-Agent-Anhängen der Fall ist.
- Allgemein: Google Sheets — 14 neue Aktionen: Daten einfügen (CSV / TSV / HTML), Text in Spalten aufteilen, Leerzeichen entfernen, Duplikate entfernen, Toolbar-Filter mit Kriterien und Sortierregeln anwenden oder löschen, Zeilen oder Spalten verschieben, Zellbereiche einfügen und löschen, Bereiche mit Editor-Berechtigungen schützen, benannte Bereiche definieren und aktualisieren, Developer-Metadaten anhängen, bedingte Formatierung feinabstimmen und die moderne ColorStyle-Palette nutzen — alles, ohne den Chat zu verlassen.
- Allgemein: Google Docs erhält echte Kommentare, Multi-Tab-Unterstützung und Smart-Chip-Erkennung: Fügen Sie native Docs-Kommentare hinzu, antworten Sie darauf, lösen Sie sie auf oder löschen Sie sie, sodass sie in der Docs-UI für alle sichtbar sind. Dokumente mit mehreren Tabs funktionieren jetzt korrekt — der Agent liest und schreibt im richtigen Tab, anstatt alle Tabs in einen Positionsraum zu mischen. Smart Chips (Personen, Links, Gleichungen, Seitenumbrüche, Datums-Chips) werden jetzt erkannt, sodass Such- und Bearbeitungsvorgänge an der richtigen Stelle landen. Gleichzeitige Bearbeitungen schlagen nun mit einer klaren Fehlermeldung fehl, anstatt sich gegenseitig stillschweigend zu überschreiben.
- macOS: Sprachwiedergabe (Kokoro TTS) startet innerhalb einer Sekunde: Die On-Device-Sprachausgabe schlug auf macOS oft stillschweigend fehl, da das Modell nicht innerhalb der WebView geladen werden konnte. Die Sprachausgabe läuft nun über den Hilfsprozess der Desktop-App und wird Satz für Satz gestreamt, sodass Sie den ersten Satz innerhalb etwa einer Sekunde nach dem Klick auf Play hören, selbst auf einem ausgelasteten System.
- Web: Hub-Pakete werden über einen
caiioo://-Link installiert: Ein Klick auf Installieren auf caiioo.ai leitet nun direkt an den Client weiter, den Sie tatsächlich nutzen — Chrome-Extension oder native App — anstatt beide gleichzeitig anzusprechen. Wenn Sie beide installiert haben, erscheint eine Auswahl. Das Installations-Modal des Community Hub schlüsselt zudem den Inhalt jedes Pakets auf — Tools, Modi, Skills, MCP-Server und Variablen —, damit Sie genau sehen, was installiert wird, bevor Sie auf Installieren klicken. - Desktop: Linux AppImage registriert das
caiioo://-URL-Schema: Linux-Nutzer des AppImage-Builds können Hub-Apps von caiioo.ai nun mit einem Klick installieren — das URL-Schema registriert sich beim ersten Start ohne Systempaket-Installation.
Verbesserungen
- Allgemein: Überarbeitung der Slate-Stabilität und Round-Trip-Treue: Etwa 40 einzelne Fehler im Rich-Text-Editor, der Diff-Engine, dem Versionsverlauf und dem Word-Import/Export wurden behoben. Tracked Changes werden nicht mehr beschädigt, wenn ein KI-Vorschlag in einem Dokument landet, das Sie seitdem bearbeitet haben; Snapshots im Versionsverlauf sind nun echte eingefrorene Kopien; Revisionen werden korrekt aufgelöst, wenn der Inhalt mit dem Ziel übereinstimmt, anstatt hängen zu bleiben; KI-Vorschläge werden mit bestehenden Redlines zusammengeführt, anstatt Bearbeitungen anderer Autoren zu überschreiben; das Akzeptieren oder Ablehnen von Änderungen in einer Word-Datei bleibt dauerhaft gespeichert; Rich-Text-Exporte verarbeiten Emojis und andere Zeichen der Supplementary Plane korrekt; und die Diff-Engine verwechselt Löschungen und Änderungen nicht mehr, wenn deren Text übereinstimmt.
- Allgemein: Slate — alle Tracked Changes innerhalb einer Auswahl akzeptieren oder ablehnen: Neue Buttons ✓ Sel / ✗ Sel in der Slate-Review-Toolbar spiegeln das Verhalten von Word wider („Absatz markieren, alle Änderungen darin akzeptieren“) — markieren Sie einen Bereich, und ein Klick löst jede überlappende Änderung auf. Die Diff-Engine fasst zudem benachbarte Bearbeitungen, die nur durch Leerzeichen oder Satzzeichen getrennt sind, zu einer einzigen Akzeptieren-oder-Ablehnen-Einheit zusammen, sodass das Überprüfen eines KI-Rewrites nicht mehr aus hunderten einzelnen Klicks besteht.
- Allgemein: Treue beim Word-Dokument-Import / Export: Ein Durchlauf von etwa 110 Fehlern im .docx-Parser behob Formatierungen, die explizite „Aus“-Schalter ignorierten, fehlerhafte Stil-Vererbung, fehlende Theme-Farben-Auflösung, verlorene Absatzeinzüge, falsch behandelte hochgestellte / tiefgestellte / verborgene Texte, falsche Listennummerierung nach Überschriften, fehlende Tab- und Zeilenumbruch-Trennzeichen in extrahiertem Text, eingebettete Bilder, die gar nicht extrahiert wurden, und den Verlust von Referenzen auf eingebettete Bilder beim Export. Der Markdown-Export nutzt nun CommonMark-konforme Listeneinzüge.
- Allgemein: PDF-Round-Trip und Rendering-Audit: Ein Audit der PDF-Pipeline stellt sicher, dass Inline-Bilder, Hex-Strings und Zeichenabstände beim Round-Trip erhalten bleiben; vererbte Seitenressourcen werden korrekt aufgelöst; Transparenzmasken, Decode-, Intent- und Interpolation-Flags beim Bildaustausch bleiben erhalten; Sonderzeichen (Euro-Symbol, typografische Anführungszeichen, Trademark), die Windows-Schriftarten nativ nicht kodieren können, werden gerettet; Emojis und andere Zeichen der Supplementary Plane in PDF-eingebetteten Schriftarten werden korrekt behandelt; und OCR-Fehler werden angezeigt, statt sie zu verschlucken. Der Slate-PDF-Viewer öffnet mehrseitige PDFs spürbar schneller durch Lazy-Rendering der Seiten, und große PDFs werden beim ersten Öffnen nicht mehr wiederholt geladen.
- Allgemein: PDF-Export erhält nicht kodierbare Zeichen, statt abzubrechen: Sonderzeichen, die die gewählte Schriftart nicht kodieren kann, werden nun unverändert aus dem Quell-PDF übernommen, anstatt den gesamten Export abzubrechen.
- Allgemein: Upgrades für Genauigkeit und Abdeckung des Pseudonymizer: Das Modell zur Erkennung personenbezogener Daten wurde mit einer lokalisierungsbewussten Pipeline neu trainiert und verarbeitet Chinesisch sowie eine breitere Palette nicht-lateinischer Schriften wesentlich besser. Namensspannen erstrecken sich nun korrekt über Schriftgrenzen hinweg — Mittelinitialen, vorangestellte Ehrentitel und zusammenhängende chinesische, japanische, koreanische und arabische Zeichenfolgen —, wodurch Lecks bei Teilnamen geschlossen wurden. Ein neuer zweiter Sicherheitsdurchlauf fängt Fehler ab, bevor sie gesendet werden. Fragmentierte Spannen mit demselben Label werden vor der Ersetzung zusammengefasst. Die Erkennung von Städtenamen und Firmennamen in mehreren Sprachen ist nun produktiv. Die numerische Ausgabe des Calculator-Tools wird nicht mehr fälschlicherweise als Name klassifiziert.
- Allgemein: Pseudonymizer Hallucination Inspector: Scannt die Antwort des Assistants nach Namen, die wie Platzhalter aussehen, aber nicht in der Ersetzungs-Map Ihrer Sitzung enthalten sind — ein Treffer bedeutet, dass das Modell wahrscheinlich einen Namen erfunden hat. In Kombination mit dem bestehenden Leak Inspector ergibt sich ein vollständiges Bild davon, was das Modell über Identitäten ausgesagt hat.
- Allgemein: Pseudonymizer mehrsprachige Platzhalter: Städtenamen, Firmennamen und Personennamen generieren nun lokalspezifische Ersetzungen — ein spanischer Prompt erhält spanisch aussehende Fakes, ein japanischer Prompt japanisch aussehende Fakes und so weiter.
- Allgemein: Pseudonymizer über 30 kleinere Korrekturen: Ein mehrstufiges Audit beseitigte Dutzende von Befunden niedriger, mittlerer und hoher Priorität — Lücken in der Schriftabdeckung, Rauschen in Debug-Logs, Lecks zwischen Sitzungen, Fehler beim URL-Trimming, Policy-Grenzfälle, Datenschutz in Audit-Logs, Robustheit der Wiederherstellung, Unicode-Handhabung im Benutzerwörterbuch, strukturelle PII-Lecks im Self-Only-Modus und mehr.
- Allgemein: Telegram-Nachrichten werden mit korrekter Formatierung gerendert: Über die Telegram-Bridge gesendete Nachrichten werden nun mit dem nativen Telegram-Stil für Fett, Kursiv, Code und Links formatiert, anstatt rohe Sternchen, Backticks und fehlerhafte „Text (URL)“-Syntax anzuzeigen. Eingehende Bilder von Telegram fließen korrekt an Vision-fähige Modelle, und vorformatierte Nachrichten vom Agenten werden nicht von der Bridge umformatiert.
- Allgemein: Kalender-Sync deckt alle Kalender in Ihrem Account ab: Der Hintergrund-Sync berücksichtigte bisher nur Ihren primären Google-Kalender; Team- und Familienkalender fehlten stillschweigend. Alle sichtbaren Kalender werden nun synchronisiert. Die Paginierung von Ereignissen wird korrekt verfolgt (sodass Ereignisse nach der ersten Seite nicht mehr verschwinden), Zeitzonen von Ereignissen bleiben erhalten, statt auf UTC normalisiert zu werden, ganztägige Ereignisse werden korrekt verankert, und die Apple Calendar-Verarbeitung leitet nun auch Apple Reminders weiter.
- Allgemein: Korrektheit des Kalender- / Agenda-Tools: Ein Cluster von 19 Fehlern beim Erstellen / Aktualisieren / Löschen / Auflisten von Kalendereinträgen wurde behoben — am wichtigsten ist, dass Daten für ganztägige Ereignisse nun in Ihrer lokalen Zeitzone statt in UTC abgeleitet werden, sodass ein für Freitag geplantes Ereignis in östlichen Zeitzonen nicht mehr auf Donnerstag landet.
- Allgemein: Zuverlässigkeits-Check für das Gmail-Tool: Fünf Fehler wurden behoben, die stillschweigend Ergebnisse für falsche Accounts, fehlerhafte Antwort-Threads, verstümmelte Empfängernamen im Stil „Doe, John“ und versteckte Authentifizierungsfehler verursachten. Antworten werden nun sowohl in Gmail als auch in externen Mail-Clients (Outlook, Apple Mail, Thunderbird) korrekt in Threads gruppiert. Entwurfsaktualisierungen erhalten den ursprünglichen Konversations-Thread.
- Allgemein: Gmail-Suche nach Absender, Kategorie, Alter, Anhang und Ungelesen-Status: Die Aufforderung an den Agenten, „ungelesene E-Mails von Bob aus der letzten Woche mit Anhängen“ zu finden, hing früher davon ab, dass sich das Modell an die exakte Suchoperator-Syntax von Gmail erinnerte — und es gab dieselbe logische Abfrage oft mit unterschiedlichem Wortlaut erneut aus, bis etwas funktionierte. Das Gmail-Tool bietet nun erstklassige Filterparameter (
from,subject,label,hasAttachment,isUnread,isImportant,category,newerThan/olderThanwie7d/1m/1ysowieafter/beforeDaten), sodass der Agent beim ersten Versuch den richtigen Filter wählt. - Allgemein: Zuverlässigkeits-Check für das Google Drive-Tool: Zwölf Korrekturen, darunter die Verweigerung, Binärdateien als Text zu lesen, Unterstützung für Pfade in geteilten Ablagen, Paginierung für große Ordnerlisten, Mapping von Slides auf PPTX-Exporte, Entfernen der fehlerhaften „Owner“-Rolle aus Freigabeoptionen und Behebung der Zielordner-Filterung beim Verschieben. Der Drive-Transfer-Cache lässt öffentliche Links nun nach 24 Stunden ablaufen, anstatt sie dauerhaft öffentlich zu lassen, falls die Bereinigung fehlschlägt.
- Allgemein: Google Drive — vollständige Ordnerpfade, geteilte Ablagen, Export, Eigentumsübertragung, Link-Entdeckung: Drive-Operationen akzeptieren nun menschenlesbare Ordnerpfade (
Engineering/Specs/Q3) anstelle von kryptischen Ordner-IDs, unterstützen geteilte Ablagen als vollwertige Ziele, exportieren Docs / Sheets / Slides in spezifische MIME-Typen (PDF, DOCX, XLSX, PPTX), übertragen das Dateieigentum zwischen Nutzern und zeigen „Jeder mit dem Link“- sowie öffentliche Links an, damit der Agent die Frage „Wie lautet die teilbare URL für diese Datei?“ beantworten kann, ohne dass Sie diese manuell kopieren müssen. - Allgemein: Google Slides-Textbearbeitungen landen an der richtigen Stelle: Das Slides-Tool nutzte die magische Zahl 999999 für „Ende des Textes“, was von der API abgelehnt wurde. Es ermittelt nun die tatsächliche Textlänge und konstruiert korrekte Bereiche, sodass Teilindex-Bearbeitungen (z. B. „Stil ab Zeichen 5“) wie beabsichtigt funktionieren.
- Allgemein: Google Sheets — über 30 kleinere Korrekturen: Das Parsen von Bereichen verarbeitet nun in Anführungszeichen gesetzte Tabellennamen mit Satzzeichen, unbegrenzte Referenzen (A:A, 1:10) und Spalten jenseits von Z; Bild-Uploads schreiben eine echte
=IMAGE()-Formel, statt die Zelle zu löschen; der HTML-Import dekodiert benannte, dezimale und hexadezimale Entities einschließlich Astral-Plane-Zeichen; Diagramme bringen den Sheet-Info-Reader nicht mehr zum Absturz; die Suche meldet absolute Spaltenbuchstaben und zeigt Fehler pro Tabellenblatt an. Sheet-Diffs geben nun sowohl Hinzufügungen als auch Löschungen korrekt aus. - Allgemein: Variablen-Dialog funktioniert jetzt für jede Hub-App: Der „Variablen öffnen“-Button im Composer war früher fest für eine spezifische App programmiert. Er wird nun über das Hub-Manifest gesteuert, sodass jede App, die einen Variablen-Dialog mitbringt, ihren eigenen Button und ihr eigenes Label erhält.
- Allgemein: Persönliche Apps erscheinen an allen Lesestellen: Persönliche Apps (Apps, die Sie geforkt oder gespeichert haben) stellen ihre Skills, Modi, MCP-Server, Tools, Ansichten und Variablen nun an allen Stellen bereit, an denen der Agent sie liest — nicht nur im Composer. Sie sind jetzt vollwertige Apps, identisch mit über den Hub installierten Apps.
- Allgemein: Hub-Deinstallation entfernt tatsächlich alles: Das Deinstallieren einer Hub-App entfernt nun auch die Modi, Composer-Buttons, Skills, Vorlagenanhänge, Modus-Variablen-Patches, die Liste der deaktivierten Systeme und (falls aktiv) den aktiven Modus des Pakets. Keine verwaisten Modi mehr im Picker nach der Deinstallation.
- Allgemein: Hub-Installation warnt vor Überschneidungen: Wenn Sie ein Paket installieren, dessen Skills, Modi, MCPs, Tools oder Ansichten etwas duplizieren würden, das Sie bereits haben, weist ein Hinweis bei der Installation auf die Konflikte hin, damit Sie entscheiden können, wie Sie verfahren möchten. Duplikationsindikatoren pro Zeile bleiben in der Hub-Installationsliste und in Ihrem Settings-Inventar sichtbar.
- Allgemein: Thread-spezifische Variablen-Overlays für fallbezogenes Arbeiten: Modus-Variablen waren früher über alle Konversationen hinweg beständig, was für fallbezogenes Arbeiten falsch ist (jeder Rechtsfall, jedes Kundenprojekt, jedes Projekt ist ein anderer Kontext). Jeder Thread kann nun sein eigenes Variablen-Overlay tragen, sodass der Agent in einem Thread an Fall A und im nächsten an Fall B arbeitet, ohne diese zu vermischen.
- Allgemein: Hub-Installation öffnet keine Tab-Kaskade mehr für jeden erforderlichen Login: Die Installation einer Hub-App mit mehreren Providern öffnete früher nacheinander für jeden Provider einen Login-Tab. Installationen werden nun schnell abgeschlossen und fordern bei Bedarf nacheinander zu den verbleibenden Logins auf, anstatt Tabs zu stapeln.
- Allgemein: Robustheit der Cloud-Synchronisierung: Die Schlüsselableitung für den Team-Sync nutzt nun Ihre Organisations-ID und Ihr Passphrase anstelle Ihrer persönlichen E-Mail, sodass jedes Mitglied desselben Teams denselben Schlüssel ableitet und die Elemente der anderen tatsächlich entschlüsseln kann (dies war zuvor fehlerhaft). Sync-Timer, Vector Clocks und Manifest-Locking wurden ebenfalls verschärft, um zu verhindern, dass sich überschneidende Synchronisierungen den Status beschädigen.
- Allgemein: Button „Caiioo-Account verwenden“ funktioniert für neu ausgestellte bereitgestellte Keys: Der Button in den Settings bewirkte früher nichts, wenn Ihre bereitgestellte OpenRouter-Zeile durch einen vorherigen Wechsel zu BYOK oder einen Entschlüsselungsfehler deaktiviert worden war. Er erstellt nun eine neue Zeile, wenn der Server meldet, dass keine vorhanden ist, sodass der Button immer einen funktionierenden Key wiederherstellt.
- Allgemein: OpenRouter-Key-Feld bleibt mit den Settings synchron: Das Eingabefeld für den API-Key wird nun aktualisiert, wenn die übergeordnete Komponente einen neuen Wert pusht (z. B. nach Klick auf „Caiioo-Account verwenden“), anstatt den Wert beizubehalten, den es beim ersten Rendern der Seite hatte.
- Allgemein: Composer-Buttons werden bei Änderungen der Modus-Einstellungen neu geladen: Aktions-Buttons im Composer (Variablen etc.) werden nun sofort aktualisiert, wenn sich die Einstellungen eines Modus ändern, ohne dass der Chat neu geladen werden muss.
- Allgemein: Agent-Tools sehen Ihre neuesten Bearbeitungen, bevor sie ein Slate lesen: Wenn Sie noch tippen, während ein KI-Tool startet (Slate-Update, Revision, Auflösen von Tracked Changes), wartet das Tool nun, bis der aktuelle Editor-Inhalt gespeichert wurde, damit es auf dem basiert, was Sie tatsächlich sehen — nicht auf einem veralteten Snapshot von vor einer Sekunde.
- Allgemein: Inline-Karten passen ihre Größe dem Inhalt an: Die Self Checker-Ergebniskarte und andere Inline-Karten wachsen nun mit ihrem tatsächlichen Inhalt mit, anstatt einen festen Platz zu reservieren, und übernehmen das Theme der App (hell oder dunkel), anstatt einen weißen Hintergrund zu erzwingen.
- Allgemein: Schwebende Aktions-Buttons standardmäßig oben links: Die schwebenden Buttons ⚖ und 🛡 (sowie alle benutzerdefinierten schwebenden Buttons) landen nun standardmäßig oben links im Composer, anstatt den Senden-Button auf der rechten Seite zu verdecken. Sie können sie weiterhin an eine beliebige Stelle ziehen.
- Allgemein: Updates für Benutzerprofil und Modus-Variablen lehnen unbekannte Felder ab: Der Agent konnte früher Variablennamen wie
_clientNameerfinden, die stillschweigend ins Leere liefen. Updates erfordern nun, dass der Key im Schema existiert, andernfalls wird ein klarer Fehler zurückgegeben. - Allgemein: Vereinfachter Onboarding-Willkommensbildschirm: Beim ersten Start werden nun drei klare Optionen angezeigt — Free, Pro abonnieren oder Bring Your Own API Key mit Testphase — anstelle des bisherigen längeren Onboarding-Formulars. Wenn Sie den Composer, die Settings oder Slate zum ersten Mal öffnen, führt eine kurze interaktive Tour die relevanten Steuerelemente vor.
- Allgemein: Anmeldung in einem Schritt: Caiioo erforderte früher sowohl eine verifizierte Identität ALS AUCH eine aktive Lizenzprüfung, bevor der Zugriff gewährt wurde. Diese redundante Lizenzprüfung wurde entfernt — sobald Sie angemeldet sind, haben Sie Zugriff. Der Lizenzstatus beschränkt weiterhin Pro-exklusive Funktionen (Bildgenerierung etc.); er blockiert jedoch nicht mehr das Öffnen der App.
- Allgemein: Suche in den Settings zeigt erweiterte Bereiche an: Die Suche nach einer Einstellung, die sich in einem eingeklappten „Erweitert“-Bereich befindet, lieferte früher oft keine Ergebnisse, da der Bereich geschlossen war. Die Suchleiste öffnet nun passende eingeklappte Bereiche, und ein neuer Button „Alle einklappen“ macht dies mit einem Klick rückgängig.
- Allgemein: Benutzerfreundlicherer Provider-Katalog: Neu veröffentlichte OpenRouter-Modelle der Free-Stufe werden im Modell-Picker nun priorisiert, und veraltete Modelle werden sanft entfernt, anstatt die Liste zu überfüllen.
- Allgemein: Erkennung der Host-Sprache auf jeder nativen Plattform: Die Shells für macOS, iOS, Android und Tauri erkennen nun beim Start die Sprache Ihres Betriebssystems und geben diese an das Sidepanel weiter, sodass Übersetzungen beim ersten Start in der richtigen Sprache erscheinen, ohne dass Sie diese manuell einstellen müssen. Etwa 10.000 zusätzliche Übersetzungs-Strings wurden für 23 nicht-englische Lokalisierungen hinzugefügt.
- macOS: Erzwingung einer einzelnen Instanz: Eine zweite Kopie der macOS-App kann nicht mehr über einen
caiioo://-Link gestartet werden, wenn bereits eine Instanz läuft, selbst wenn die macOS Launch Services zwei registrierte Kopien haben (typischerweise ein Überbleibsel einer vorherigen Installation). - macOS: Über Homebrew installierte MCP-Server starten jetzt: macOS 15+ blockiert notarisierte Apps daran, Binärdateien auszuführen, die das Attribut „Provenance“ tragen, welches Homebrew an alles Anhängt, was es installiert. Caiioo löscht dieses Attribut nun automatisch bei einem „Permission Denied“-Fehler beim Starten, sodass lokale MCP-Server (Dateisystem, Speicher, Fetch etc.), die über Homebrew installiert wurden, ohne manuelle Bereinigung funktionieren.
- macOS, iOS: Hub-Installation über
caiioo://ist bei Kaltstart zuverlässig: Das Tippen auf einencaiioo://-Installationslink bei einer frisch gestarteten App konnte mit dem ersten Laden der WebView kollidieren und die Installationsabsicht stillschweigend verwerfen. Die Absicht bleibt nun über den Kaltstart-Prozess hinweg erhalten, sodass die Installation abgeschlossen wird, sobald die App bereit ist. - iOS: Apples neue „Write-only“-Kalenderberechtigung wird respektiert: iOS 17 führte eine dritte Berechtigung für Kalender / Erinnerungen ein — „Write-only“ —, die es Caiioo ermöglicht, Ereignisse und Erinnerungen zu erstellen, ohne Ihre bestehenden Einträge zu sehen. Caiioo behandelte dies bisher als „Abgelehnt“; nun wird der schreibgeschützte Zugriff korrekt genutzt, sodass Nutzer, die nur diese Stufe gewähren, den Agenten weiterhin Dinge planen lassen können.
- iOS: Klarere Meldung, wenn ein In-App-Kauf nicht verifiziert werden kann: Fehlgeschlagene Kaufverifizierungen zeigen nun einen spezifischen Grund anstelle eines generischen Fehlers an, und die Transaktion wird nicht mehr stillschweigend abgeschlossen, was den StoreKit-Richtlinien von Apple entspricht.
- Android: Speichern einer Datei friert die App nicht mehr ein: Das Schreiben einer großen Datei über den Android-Dateiauswahldialog lief früher im UI-Thread und konnte die App auf langsamem Speicher für mehrere Sekunden einfrieren. Schreibvorgänge finden nun außerhalb des UI-Threads statt.
- Android: Streaming-Netzwerkantworten liefern Header vor den Chunks: Lang laufende Streaming-Aufrufe liefern nun Header an den Aufrufer, bevor Body-Chunks eintreffen, was eine Kategorie von zeitweiligen Streaming-Fehlern behebt.
- Android: On-Device-Transkription schneller und speichereffizienter: Der Whisper / Moonshine-Audioerfassungspfad nutzt nun einen primitiven Float-Buffer anstelle einer Boxed-Liste, was sowohl Speicher als auch CPU schont. Das Laden, Entladen, Transkribieren und Leeren des Modell-Caches wird nun über einen gemeinsamen Lock serialisiert, sodass die App nicht mehr gelegentlich abstürzt, wenn Sie während der Transkription das Modell wechseln.
- Desktop: Zuverlässigkeits- und Sicherheitsaudit der Windows / Linux-Shell: Ein vollständiger Durchlauf der Tauri-Shell — der Berechtigungsumfang wurde auf das vertrauenswürdige Sidepanel beschränkt (sodass eine beliebig besuchte Seite keine privilegierten Befehle aufrufen kann), das HTML-Escaping auf der
caiioo://Hub-Installations-Bridge wurde gehärtet, eine freundliche „Node.js nicht gefunden“-Meldung statt eines stillen Absturzes wurde hinzugefügt, sowie eine Handvoll Robustheits-Fixes. - Desktop, macOS: On-Device-Sprach- und Sprachmodell-Downloads funktionieren jetzt: Die Content Security Policy der WebView in den Desktop-Apps blockierte Downloads von huggingface.co, sodass die Kokoro-Sprach- und Whisper-Sprach-zu-Text-Modelle bei der ersten Verwendung nicht geladen werden konnten. Die Policy erlaubt nun huggingface.co.
- Extension: Settings → Tools, Modes & Apps umbenannt und neu organisiert: Die alte Kategorie „Tools & Capabilities“ heißt nun „Tools, Modes & Apps“, wobei eine neue Kategorie „Connectivity“ von „Advanced“ getrennt wurde.
- Web: Preisgestaltungstexte in 23 Sprachen verfeinert: Ein redaktioneller Durchlauf der Free / Pro-Feature-Listen auf der Website hat die nicht-englischen Lokalisierungen an die neueste englische Quelle angepasst. Die Daten für „Zuletzt aktualisiert“ in rechtlichen Dokumenten wurden aktualisiert.
Sicherheit
- Allgemein: Härtung der Anmeldung: Mehrere Befunde aus einem Audit der Anmelde- und Anmeldedaten-Tresor-Pipeline wurden behoben. Google-ID-Token werden nur noch akzeptiert, wenn sie für Caiioos eigene Client-IDs ausgestellt wurden (Schließung einer Lücke, durch die Token eines beliebigen Google OAuth-Clients jemanden anmelden konnten). Die Apple-Anmeldung validiert nun die von Apple zurückgegebene Nonce gegen die von Caiioo generierte. Die Google- und Apple-Anmeldung verweigern die automatische Verknüpfung einer externen Identität mit einem Konto mit nicht verifizierter E-Mail (Schließung einer „Shadow Signup“-Übernahme). Der Refresh-Token-Endpunkt lehnt nun widerrufene Token ab, sodass ein abgemeldeter Token nicht gegen einen neuen getauscht werden kann. Der Endpunkt für die OAuth-Token-Ausstellung erfordert nun einen aktiven Bearer-Token. Die OAuth-Callback-Seite selbst wurde gegen mehrere Script-Injection-Vektoren gehärtet.
- Allgemein: Isolation pro Profil für alle Einstellungen: Die Einstellungsebene teilte sich in bestimmten Codepfaden einen einzigen Bucket über mehrere Anmeldungen auf derselben Installation hinweg, was dazu führen konnte, dass Anmeldedaten eines Kontos in der Ansicht eines anderen Kontos landeten. Jeder Lese- und Schreibvorgang von Einstellungen ist nun strikt profilbezogen, veraltete gemeinsame Buckets werden beim ersten Start nach dem Upgrade gelöscht, und der Cloud-Sync verweigert das Hoch- oder Herunterladen dieser veralteten Buckets.
- Extension: Automatische Erkennung der lokalen Bridge ist jetzt Opt-in: Die Chrome-Extension verband sich früher bedingungslos mit jeder Caiioo-Desktop-App, die sie auf localhost fand. Dies geschieht nun nur noch, wenn Sie den Zugriff auf die lokale Bridge in den Settings explizit aktiviert haben, sodass eine von einem anderen Benutzer auf einem gemeinsam genutzten Rechner installierte Desktop-App nicht stillschweigend mit Ihrer Extension-Sitzung verbunden werden kann.
- macOS, iOS: Härtung der
caiioo://-Installations-Bridge gegen Injection: Das manuelle String-Escaping im JavaScript, dascaiioo://hub/install/<id>-URLs verarbeitet, maskierte nur einfache Anführungszeichen — eine bösartig gestaltete Paket-ID konnte aus dem String-Literal ausbrechen und beliebiges Skript in der WebView ausführen. Dies wurde auf beiden Plattformen durch vollständiges JSON-Escaping ersetzt. - iOS, macOS, Extension: Google-Anmeldeflows nutzen nun die verifizierte Caiioo OAuth-App: Das Verbinden von Google für Private Sync, Kalender, Gmail, Drive und andere Workspace-Tools zeigte auf iOS, macOS und in der Chrome / Edge-Extension bisher die Warnung „Diese App ist nicht verifiziert“ an, da diese Plattformen noch gegen ein älteres, nicht verifiziertes Google Cloud-Projekt authentifizierten. Jede Plattform nutzt nun durchgängig Caiioos verifiziertes Google-Projekt, sodass Sie das korrekte Caiioo-Branding und den grünen Haken für verifizierte Apps auf dem Google-Zustimmungsbildschirm sehen. Einmaliger Re-Login: Bestehende Nutzer auf iOS und macOS werden automatisch abgemeldet und beim ersten Öffnen der App nach diesem Update um eine erneute Anmeldung gebeten — die vorherigen Anmelde-Token wurden vom älteren Google-Projekt ausgestellt und können nicht übernommen werden.
Fehlerbehebungen
- macOS: Warnung „Browser nicht verbunden“ verschwindet, wenn Safari sich verbindet: Das Verbinden der Safari-Extension mit der Mac-App hinterließ eine veraltete Warnung, dass die Browsersteuerung nicht verfügbar sei — und die Warnung nannte nur Chrome, obwohl Safari, Edge und Firefox ebenfalls funktionieren. Die App zählt nun jeden verbundenen Browser (Safari verbindet sich über einen anderen Kanal als die anderen, weshalb er übersehen wurde), sodass die Warnung verschwindet, sobald sich ein beliebiger Browser verbindet, und der Wortlaut Chrome nicht mehr hervorhebt.
- Allgemein: Neu gewählte Bildmodelle sind tatsächlich nutzbar: Der Bildmodell-Picker zeigte alle Modelle an, mit denen Ihr Account generieren kann — einschließlich neu veröffentlichter Modelle wie Recraft —, aber die Auswahl konnte mit „Unbekanntes Bildmodell“ fehlschlagen, da der Generator Ihre Auswahl gegen eine veraltete interne Liste statt gegen die Live-Liste prüfte. Der Generator aktualisiert nun die Live-Modellliste vor der Entscheidung, sodass alles, was im Picker sichtbar ist, auch funktioniert. Das Standardmodell wurde zudem von FLUX.2 [pro] auf das schnellere und günstigere FLUX.2 [flex] umgestellt, was ein besserer Allround-Standard ist.
- Allgemein: Tracked Changes in Word-Dokumenten werden nun korrekt akzeptiert und abgelehnt: Das Klicken auf Akzeptieren oder Ablehnen bei einer nachverfolgten Änderung in einem .docx-basierten Slate nutzte die Dokumentposition als Änderungs-ID, die nie mit der echten gespeicherten Änderungs-ID übereinstimmte — so änderte die Änderung zwar visuell ihren Status, wurde aber nie dauerhaft gespeichert. Behoben.
- Allgemein: Slate verarbeitet fehlerhafte Vorlagen-Installationen: Über den Hub installierte Slate-Vorlagen, die ohne den korrekten Wrapper geliefert wurden, ließen den Viewer früher bei „Loading artifact“ ohne Wiederherstellungsmöglichkeit hängen. Vorlagen reparieren sich nun beim Laden selbst, und der Viewer zeigt einen klaren Fehler an, wenn eine Vorlage tatsächlich beschädigt ist.
- Allgemein: Self Checker gibt das Urteil nicht mehr doppelt aus: Wenn der Self Checker seine Ergebniskarte renderte, beschrieb der Agent die Ergebnisse zusätzlich im Antworttext — zwei Kopien desselben Urteils auf demselben Bildschirm. Die Textzusammenfassung wird nun unterdrückt, wenn die Karte gerendert wird.
- Allgemein: Self Checker liest Bildanhänge korrekt: Der Judge dekodierte Bildanhänge bisher als Text und fütterte den resultierenden Datenmüll in die Bewertung. Bildanhänge werden nun als tatsächliche Bilder an den Judge weitergeleitet, sodass jeder Turn, dessen Korrektheit vom Inhalt eines Bildes abhängt, korrekt bewertet wird.
- Allgemein: Self Checker zeigt nur das neueste Urteil an: Jeder Klick auf ⚖ fügte eine neue Ergebniskarte hinzu, ohne die vorherige zu entfernen, sodass der Chat am Ende einen Stapel Duplikate enthielt. Jeder Turn zeigt nun nur noch das aktuellste Urteil an, mit einem × zum Löschen.
- Allgemein: Dialog zur Synchronisierung von Erinnerungen rendert Outlook-Ereignisse korrekt: Der interne Quellwert „microsoft_calendar“ sickerte in den Pfad zur Plattformerkennung im Erinnerungs-Modal durch. Das Modal nutzt nun seinen Fallback-Pfad, sodass Ereignisse korrekt gerendert werden, unabhängig von ihrer Herkunft.
- Allgemein: Große Gmail-Anhänge werden zuverlässig übertragen: Große Gmail-Anhänge (eine 25-MB-Datei ist nach der Base64-Kodierung etwa 33 MB groß) überschritten das Limit für Nachrichten zwischen Prozessen und wurden stillschweigend verworfen. Die Runtime nutzt nun bei übergroßen Payloads eine temporäre Datei, damit Anhänge ankommen.
- Allgemein: PandaDoc MCP-Installation funktioniert wieder: PandaDoc hat seinen MCP-Endpunkt auf einen neuen Pfad verschoben. Der Katalogeintrag von Caiioo weist nun auf den neuen Endpunkt.
- Allgemein: Workflow-Renderschritte lösen String-Ausgaben nicht mehr fälschlicherweise als Anhänge auf: Das Weiterleiten einer String-Ausgabe von einem Workflow-Schritt in einen View-Schritt schlug früher fehl, da jeder String als Anhang-ID behandelt wurde. Per Referenz weitergeleitete Strings werden nun von literalen Anhang-IDs unterschieden.
- Allgemein: Prüfung des Abonnementstatus hängt nicht mehr in reinen Browser-Umgebungen: Das Agenda-Tool prüfte bei jedem Cache-Miss die Desktop-Bridge in Umgebungen, die keine haben, was jedes Mal einen „Failed to fetch“-Fehler auslöste. Die Prüfung wird nun nur noch durchgeführt, wenn eine Desktop-Bridge tatsächlich erreichbar ist.
- Allgemein: Hintergrundprozess für den Agenten wird nun sauber beendet: Eine Änderung in einem früheren Release führte dazu, dass der Hintergrundprozess des Agenten nach Abschluss offen blieb, was nachfolgende Aktionen blockierte — am deutlichsten sichtbar beim automatischen Konversationstitel. Der Prozess wird nun sauber beendet, sodass die Titelgenerierung und andere Schritte nach dem Turn wie erwartet starten.
- Allgemein: Lab- und Admin-Modi im Modus-Picker ausgeblendet: Zwei Pfade ließen den internen „Lab“-Modus (und jeden anderen als nur für Admins markierten Modus) weiterhin im benutzerseitigen Modus-Picker erscheinen. Behoben.
- Allgemein: Doppelte Hub-Installationen beim Speichern dedupliziert: Ein Race-Condition in der Installations-Pipeline konnte dazu führen, dass zwei Einträge für dasselbe Paket geschrieben wurden. Neue Speichervorgänge deduplizieren nach Paket-Slug, und bestehende Duplikate werden beim nächsten Lesen bereinigt.
- Allgemein: Benutzerdefinierte Modus-IDs kollidieren nicht mehr mit Hub-Installationen: Der Storage-Key ist nun maßgeblich für die ID eines benutzerdefinierten Modus, wodurch Kollisionen vermieden werden, wenn ein über den Hub installierter Modus auf einem Key landete, der bereits eine benutzerbearbeitete Kopie enthielt.
- Allgemein: Sub-Agent-Anhänge und -Karten erreichen den Hauptchat: Wenn ein Sub-Agent ein Bild, ein Diagramm, ein Self Checker-Urteil oder einen anderen Anhang generierte, wurde das Ergebnis oft einem unsichtbaren Sub-Agent-Thread zugeordnet — und die übergeordnete Konversation erfand manchmal eine URL, um die Lücke zu füllen. Sub-Agent-Anhänge und -Karten werden nun über die Bereinigung des Agent-Runners hinweg korrekt dem Haupt-Thread zugeordnet, sodass das, was der Sub-Agent produziert hat, dort erscheint, wo Sie die Anfrage gesendet haben.
- Allgemein: PDF-Lesen auf Lazy-Rendered-Seiten: Das Pop-up „Originaltext anzeigen“ für einen PDF-Ausschnitt funktioniert nun auch auf Seiten, die zum Zeitpunkt der Erstellung des Ausschnitts noch nicht gerendert waren.
- macOS: Slack, Notion, Linear und andere Hub-OAuth-Logins werden nun in der nativen App abgeschlossen: Hub-MCP-Server, die HTTPS-only OAuth nutzen (Slack, Notion, Linear etc.), konnten nicht zum lokalen Relay zurückleiten, da ihre Provider http://-Callbacks ablehnen. Die macOS-App leitet diese Flows nun über den
/oauth/callbackdes Caiioo-Cloud-Relays, das den Autorisierungscode dann über den bestehenden benutzerspezifischen Kanal an das lokale Relay zurückgibt — so funktioniert die Anmeldung für diese Provider innerhalb der nativen App nun genauso wie in der Extension. Enthält eine einmalige Migration, die bestehende Installationen korrigiert, deren gespeichertes Profil noch nicht mit dem Identity-Provider des lokalen Relays verknüpft war. - Allgemein: „Benutzer fragen“ hängt nicht in Sub-Agent-Läufen: Ein Agent, der
ask_useraus einem Sub-Prozess heraus aufrief, stieß auf ein gemeinsames In-Memory-Singleton, das über Prozesse hinweg nicht erreichbar war, sodass die Frage nie erschien und der Lauf bis zum Abbruch stockte. Der Collaboration-Controller ist nun thread-spezifisch, sodass die Frage im Chat erscheint, genau wie im Haupt-Agent-Loop. - Allgemein: Native macOS-Helfer für Kalender / Notizen / Erinnerungen aktualisiert: Die Helfer-Binärdateien wurden gegen aktuelle macOS-SDKs aktualisiert, um ein Problem zu beheben, bei dem der Erinnerungs-Sync in Version 0.9.721 zeitweise falsche Elemente anzeigte.
- Extension: Self Checker-Ergebniskarten werden nun in der Extension gerendert: Inline-Skripte in Kartenvorlagen wurden durch die Content Security Policy der Extension blockiert. Karten werden nun über die Sandbox-Seite der Extension geleitet, damit sie korrekt gerendert werden.
- Allgemein: Text erscheint beim Umwandeln einer SVG-Zeichnung in ein Bild: Das Rendern einer SVG — eines Logos, Diagramms oder Charts — in ein Bild führte in der Chrome-Extension und der macOS-App oft zum Verlust des gesamten Textes (Wortmarken, Labels, Bildunterschriften), wodurch leere Lücken entstanden; nur die mobilen Apps renderten diesen korrekt. Caiioo liefert nun Fallback-Schriftarten mit (Sans-Serif, Serif und Monospace, einschließlich Fett), sodass Text exakt wie gezeichnet erscheint — einschließlich Symbolen wie &, ™ und Akzentzeichen — und jede angeforderte Schriftart, die nicht verfügbar ist, sauber auf eine Sans-Serif zurückfällt, anstatt zu verschwinden.
Version 0.9.721 (15. Mai 2026)
Neue Funktionen
- Common: Preisgestaltung auf Free und Pro reduziert, mit einem 5 $/Monat OpenRouter-Guthaben-Bonus für Pro: Wir haben die separaten Stufen Platform und Pro Mobile eingestellt und jede reine Platform-Funktion (Apple Calendar / Reminders / Notes, verschlüsselter privater Relay, API-Zugriffsvorschau, native Sprachdiktat, Browser-UI) in Pro integriert. Die Website, die Kontoseite und das Preispanel in der Erweiterung verfügen nun über ein übersichtliches Zwei-Karten-Layout (Free / Pro). Im Zuge dieser Änderung wird nun mit jedem bezahlten Pro-Monat (Stripe oder Apple) auch Ihr bereitgestellter OpenRouter-Key mit einem Guthaben von 5 $ zusätzlich zu Ihrem bestehenden Guthaben aufgeladen. Bestehende Platform-Abonnenten werden ohne zusätzliche Kosten in Pro übernommen und behalten alle Funktionen, die sie zuvor hatten. Die Untergrenze für den Kauf von OpenRouter-Guthaben wurde ebenfalls gesenkt: Endnutzer sehen nicht mehr den alten Zuschlag für die Mindestgebühr von 0,80 $, sondern nur noch die 5,5 % Durchreichgebühr.
- Common: Slack ist jetzt eine Ein-Klick-Installation im Community Hub: Die eigenständige Slack-Integration wurde entfernt; Slack wird nun wie Notion, Linear, GitHub usw. über den Community Hub installiert. Klicken Sie beim Slack-Paket im Hub auf „Install“, melden Sie sich einmal mit der Caiioo Slack-App an, und der offizielle Slack MCP-Server wird sofort verbunden – keine manuelle App-Konfiguration, kein Entwicklermodus. Slash-Befehle wie
/caiioound/caiioo-helpfunktionieren in jedem Kanal, in den der Bot eingeladen wurde. - Common: Workspace Files Tool: Ein neues sandboxed Datei-Tool ermöglicht es dem Agenten, Dateien in einem von Ihnen zugewiesenen Workspace-Ordner zu lesen, zu schreiben, zu bearbeiten und zu durchsuchen. Der Agent kann diesen Ordner nicht verlassen und über dieses Tool nicht auf das Netzwerk zugreifen. Lesezugriffe parsen automatisch Office-Formate (docx/xlsx/pptx) und PDFs. Konfigurieren Sie den Ordner unter Settings → Tools → Workspace Files; der Agent erkennt ihn sofort.
- Common: PHI Safe Harbor-Submodus für den Pseudonymizer: Der PHI-Modus des Pseudonymizer bietet nun zwei Submodi an – Limited Data Set (die bestehende Entfernung von 16 Kategorien, Standard) und Safe Harbor (der strengere HIPAA §164.514(b)(2) Standard, der zusätzlich spezifische Daten über das Jahr hinaus, vollständige geografische Adressen und Alter über 89 entfernt). Wählen Sie den Submodus in den Pseudonymizer-Einstellungen oder über den neuen Umschalter im Chat. Safe Harbor ist die richtige Wahl, wenn Sie einen de-identifizierten Datensatz benötigen, den Sie ohne ein Data Use Agreement teilen können.
- Common: Pseudonymizer ist jetzt allgemein verfügbar: Der Pseudonymizer – der Namen, E-Mails, Adressen, IDs und andere sensible Werte in Ihren Eingaben erkennt und gegen realistische Platzhalter austauscht, bevor sie das Modell erreichen – verlässt mit diesem Release das Testprogramm und ist in jedem Plan, einschließlich Free, verfügbar. Aktivieren Sie ihn unter Settings → Privacy → Pseudonymizer oder mit dem neuen Schild-Symbol im Chat. Das Modell sieht niemals Ihre echten Werte; Ersetzungen werden lokal wiederhergestellt, bevor Tool-Aufrufe ausgeführt werden, sodass die Ausgabe präzise bleibt.
- Common: Pseudonymizer-Steuerung im Chat: Der Pseudonymizer versteckt sich nicht mehr in den Einstellungen. Ein Schild-Symbol neben dem Senden-Button (grau = aus, blau = Personal Data Filter, petrol = PHI/Limited Data Set, smaragd = PHI/Safe Harbor) zeigt den aktiven Modus auf einen Blick an und öffnet ein Popover mit der gleichen Auswahl wie in den Einstellungen. Wenn der Pseudonymizer aktiviert ist, umschließt ein farblich passender 1-Pixel-Ring das Eingabefeld als dezente Erinnerung. Nach jedem Durchgang mit Ersetzungen erscheint ein kleiner „🛡 pseudonymized — N substitutions“-Chip unter Ihrer Nachricht; klicken Sie darauf, um genau zu sehen, welche Echt-zu-Fake-Paare mit Kategorie-Labels ausgetauscht wurden.
- Common: Einen Browser auf einem anderen Gerät mit Ihrem Computer verbinden: Ein neuer Pairing-Flow ermöglicht es Ihnen, Caiioo sicher in einem Browser auf Ihrem Telefon, Tablet oder einem anderen Laptop zu nutzen, während alles weiterhin auf Ihrem Hauptcomputer läuft. Generieren Sie unter Settings → Connections → Caiioo Bridge → „Pair a device“ einen 6-stelligen Code, der 5 Minuten lang gültig und einmalig verwendbar ist. Öffnen Sie dieselbe URL auf dem anderen Gerät, geben Sie den Code ein, und das Gerät bleibt von da an gekoppelt. Brute-Force-Versuche sind auf 10 Versuche pro IP und Minute begrenzt, und ein Server-Neustart auf Ihrem Hauptcomputer verbindet jedes Gerät sauber neu.
Verbesserungen
- Common: Agenda-Elemente mit Farbstreifen nach Quellkalender: Jede Ereigniskarte im Fenster Reminders / Agenda verfügt nun über einen farbigen Streifen, der dem Kalender entspricht, aus dem sie stammt. So sehen Sie auf einen Blick, ob ein Element aus Ihrem geschäftlichen, privaten oder geteilten Kalender stammt. Google Calendar ab heute; Apple und Microsoft folgen, sobald deren Datenfeeds eine Kalenderfarbe bereitstellen.
- Common: KI kann ein Google Sheet lesen, ohne vorher exakte Zellen zu benennen: Das Google Sheets-Lese-Tool verweigerte bisher den Dienst, wenn der Agent keinen exakten Zellbereich wie
Sheet1!A1:D200angab. Das Modell kann nun ein ganzes Blatt oder alle Blätter einer Arbeitsmappe anfordern, und das Tool ermittelt das Layout selbstständig. Eine integrierte Obergrenze von 1000 Zeilen verhindert, dass eine riesige Tabelle das Kontextfenster des Modells sprengt – falls ein Blatt begrenzt wird, teilt die Antwort dies dem Modell mit, damit es beim nächsten Mal einen kleineren Bereich oder eine höhere Zeilenzahl anfordern kann. - Common: Die Installation eines OAuth-Tools aus dem Community Hub öffnet nun automatisch die Anmeldung: Das Hinzufügen eines Hub-Pakets, das eine Anmeldung erfordert (Notion, Linear usw.), hinterließ die Karte bisher in einem „OAuth required“-Status mit einem „Sign in“-Button, den man separat anklicken musste. Die Installation öffnet nun automatisch den Anmelde-Tab für Sie – Ihr Klick auf „Install“ wird als Zustimmung gewertet – und eine Zeile „Opening sign-in for X…“ erklärt den Vorgang. Der manuelle „Sign in“-Button bleibt als Backup bestehen.
- Common: Settings → Connections zeigt die echte Netzwerkadresse für andere Geräte an: Das Panel „Connect from other devices on your network“ zeigte in der macOS-App
127.0.0.1:3847an (die Loopback-Adresse, die nur auf demselben Computer funktioniert). Nutzer kopierten daher eine Adresse, die von einem anderen Gerät aus nicht erreichbar war. Das Panel zeigt nun die echte LAN-IP und den.local-Netzwerknamen der Bridge selbst an. Die Adresse wird zudem ausgeblendet, wenn der neue Umschalter „Allow access from other devices“ deaktiviert ist. - Common: Web-Suche erfasst Google AI Overviews zuverlässig: Der Google-Scraper des Web-Browsing-Tools gab manchmal einen leeren AI Overview-Block zurück oder zog störenden Text aus der rechten Seitenleiste („Quellen“) und Inline-Skripte ein. Wir haben die Extraktion an Googles stabilen Abschnittsmarkierungen neu verankert und entfernen nun Skriptinhalte und die rechte Seitenleiste vor der Rückgabe, sodass der Agent nur die lesbare Antwort sieht.
- Common: Pseudonymizer schützt auch Firmennamen: Der Pseudonymizer behandelt Organisationsnamen nun als geschützte Entitäten und tauscht sie gegen realistische Fakes aus, die den juristischen Suffix-Stil (Inc., LLC, GmbH) und die „Partner-vs-Marke“-Struktur beibehalten. Stadt- und Kleinstregion-Namen („Springfield“, „St. Albans“) werden nun ebenfalls als erstklassige Kategorie erkannt, damit sie je nach aktivem Modus getauscht oder entfernt werden können.
- Common: Pseudonymizer fügt Spanisch, Französisch, Deutsch und weitere mehrsprachige Abdeckung für Städte und Regionen hinzu: Das Modell zur Erkennung personenbezogener Daten wurde mit manuell erstellten mehrsprachigen Daten für Städtenamen in 23 Sprachen neu trainiert, sodass Nutzer mit nicht-englischen Prompts nun den gleichen Schutzlevel wie englischsprachige Nutzer erhalten.
- Common: Pseudonymizer-Modelldownload zeigt Fortschritt auf iOS an: Der erstmalige Download des PHI / Personal Data-Detektors konnte auf iOS so wirken, als sei er hängengeblieben, da kein Status angezeigt wurde. Es gibt nun ein Heartbeat-Fortschrittsprotokoll, damit Sie sehen, dass der Download aktiv ist.
- Common: Sub-Agenten können den Modellkatalog nach Namen durchsuchen: Um die Tool-Beschreibung des Sub-Agenten im Budget zu halten, umfasst der darin eingebettete Katalog nun die 10 wertvollsten Modelle pro Anbieter. Wenn ein Sub-Agent ein Modell außerhalb dieser Liste benötigt, kann er die neue Aktion
search_modelsmit einem Namensfragment (z. B. „haiku“) aufrufen und erhält exakte Katalog-IDs, Preise und Capability-Flags zurück. - Common: Eigene MCP-Server zeigen einen Anzeigenamen im Credentials-Tresor: Wenn Sie sich bei einem benutzerdefinierten MCP-Server angemeldet haben, wurde dieser im Tresor mit der rohen Verbindungs-URL beschriftet. Der Tresor zeigt nun den von Ihnen vergebenen Anzeigenamen an und greift nur auf die URL zurück, wenn kein Name festgelegt wurde.
- Common: Community Hub fügt Legal Data Hunter hinzu: Ein neues Community Hub-Paket bindet Legal Data Hunter – über 18 Mio. Dokumente zu Rechtsprechung, Gesetzgebung und Doktrin aus über 110 Ländern – als Ein-Klick-MCP-Installation an.
- Web: SOC 2 Type I-Badge auf der Trust-Seite: Caiioo hat das SOC 2 Type I-Audit bestanden. Die Trust-Seite auf caiioo.ai trägt nun das AICPA SOC 2-Badge neben den bestehenden Sicherheitsinformationen.
- iOS: Ausblenden der Tastatur-Toolbar, die iOS zu Textfeldern hinzufügt: Die Vor/Zurück-Pfeile und der „Fertig“-Button, die iOS über der Tastatur für Web-Textfelder einblendet, verbrauchten spürbaren vertikalen Platz im Composer. Die Leiste wird nun ausgeblendet (unter Verwendung von Apple-öffentlichen APIs, um App Store-konform zu bleiben) und bleibt auch nach dem Neuladen der Seite verborgen.
Sicherheit
- Common: Die lokale Bridge bleibt standardmäßig auf Ihrem Computer; LAN-Zugriff ist Opt-in: Die lokale Bridge, die stdio MCPs und Desktop-Tools antreibt, lauschte bisher auf jeder Netzwerkschnittstelle. In einem öffentlichen WLAN-Netzwerk konnte ein anderes Gerät ein Session-Token anfordern und privilegierte Endpunkte zum Ausführen von Shell-Befehlen aufrufen. Die Bridge lauscht nun standardmäßig nur noch auf Ihrem eigenen Computer. Um sie von einem anderen Gerät aus zu nutzen, aktivieren Sie „Allow access from other devices on your network“ unter Settings → Connections und koppeln Sie das Gerät mit dem neuen Code-Flow (siehe oben). Selbst wenn der LAN-Zugriff aktiviert ist, werden Session-Token nur an Anfragen vergeben, die von Ihrem eigenen Rechner kommen.
- Common: Pseudonymizer verhindert das Abfließen Ihrer echten Werte an Perplexity: Wenn der Pseudonymizer aktiviert ist und der Agent versucht, eine Perplexity-Suche auszuführen, deren Abfrage einen pseudonymisierten Identifikator enthält (einen Namen, eine E-Mail oder Adresse, die bereits getauscht wurde), blockiert Caiioo die Suche nun und zeigt eine klare Erklärung an, anstatt den Wert wiederherzustellen und an Perplexity zu senden. Perplexity ist ein Drittanbieter-LLM-Dienst – der Sinn des Pseudonymizer ist es, dass solche Werte niemals einen LLM-Dienst erreichen. Um die Suche auszuführen, deaktivieren Sie den Pseudonymizer für diesen Durchgang oder formulieren Sie die Anfrage um.
- Common: Spreadsheet-Parser auf eine gewartete Bibliothek umgestellt (GHSA-4r6h-8v6p-xvw6): Die Bibliothek, die Caiioo zum Parsen von
.xlsx-Anhängen verwendete, hatte eine offene Warnung bezüglich Prototype-Pollution und wird nicht mehr gewartet. Wir haben sie durch die gut gepflegte Bibliothekexceljsersetzt. Spreadsheet-Uploads und.xlsx-Lesezugriffe im Workspace liefern dieselben Inhalte wie zuvor.
Fehlerbehebungen
- Common: Browser blieb nach einem Server-Neustart bei „Loading Caiioo… 0/0“ hängen: Wenn der Host-Server noch keine Ende-zu-Ende-verschlüsselte Sitzung mit einem verbindenden Browser hatte, ignorierte der Browser die Anfrage des Servers zum Schlüsselaustausch. Verschlüsselte Nachrichten wurden nie entschlüsselt und die UI lud nicht weiter. Der Browser beantwortet die Key-Exchange-Anfrage nun korrekt und das Sidepanel lädt.
- Common: Caiioo fragte wiederholt nach Google-Berechtigungen, die bereits erteilt wurden: Wenn Sie eine Google-Berechtigung während einer Konversation erteilt haben, bemerkte die In-Memory-Kopie Ihres Kontos dies nicht und fragte erneut nach derselben Berechtigung. Caiioo liest Ihr Konto nun einmal neu ein, bevor es eine fehlende Berechtigung reklamiert, sodass Berechtigungen innerhalb eines Durchgangs sofort berücksichtigt werden.
- Common: In 7 Sprachen wurde der KI mitgeteilt, sie sei „English“: Die interne Zuordnung von Locale-Codes zu Sprachnamen deckte 17 der 24 unterstützten Sprachen ab. Nutzer mit einer UI in Arabisch, Hebräisch, Hindi, Bengali, Urdu, Türkisch oder Niederländisch erhielten einen System-Prompt, der „respond in English“ verlangte. Die Zuordnung ist nun vollständig.
- Common: Reminders-Sync-Dialog zeigte rohe Textcodes statt übersetzter Labels: Die Caiioo-Karte im Synchronisationsdialog für Reminders / Agenda zeigte literale Platzhalter wie
reminders.sync.CaiiooNameanstelle des übersetzten Textes an. Behoben. - Common: Google-Login stoppt Ping-Pong-Effekt bei zusätzlicher Berechtigung: Wenn der Agent einen Google-Scope benötigte, den er noch nicht hatte (Drive, Sheets usw.), konnte der neue Login den Agenten in einen Zustand zurückversetzen, in dem er erneut nach demselben Scope fragte. Der OAuth-Flow führt den neu gewährten Scope nun korrekt mit Ihrer bestehenden Verbindung zusammen, anstatt sie zu überschreiben.
- Common: Sub-Agent-Anhänge erscheinen nun im Haupt-Chat: Wenn das Tool eines Sub-Agenten ein Bild, eine Datei oder einen anderen Anhang erstellte, wurde dieser bisher nur im unsichtbaren Thread des Sub-Agenten gespeichert. Sub-Agent-Anhänge werden nun automatisch mit dem Haupt-Thread verknüpft und inline gerendert.
- Common: Pseudonymizer-Detektor-Durchgang 2 erfasst Namen, die der erste Durchgang übersehen hat: Der Pseudonymizer führt nun vor dem Senden einen schnellen zweiten Detektor-Durchgang aus, um die Nachricht auf echte Werte zu prüfen, die hätten maskiert werden sollen. Ein doppelter Boden für geschützte Kategorien.
- Common: Pseudonymizer setzt Ihren echten Namen nicht mehr in den My Identifiers-Platzhalter: Das Feld Settings → Pseudonymizer → My Identifiers zeigte den echten Namen Ihres Kontos als Beispiel-Platzhalter an, was wie ein Datenleck wirkte. Ersetzt durch einen generischen Platzhalter.
- Common: Pseudonymizer-Pill-Text im Dark Theme lesbar: Die „🛡 pseudonymized“-Pille unter Benutzernachrichten verwendete im Dark Theme eine Textfarbe für den Light Mode, was sie fast unsichtbar machte. Behoben.
- Extension: Sidepanel „Get current location“ Sackgasse behoben: Die Standortanfrage des Sidepanels gab „Permission denied“ zurück, bevor der Browser überhaupt fragen konnte, da im Chrome-Manifest die Standortberechtigung fehlte. Berechtigung hinzugefügt.
- iOS: Abo-Seite verkauft nach dem Tier-Merge nur noch Pro: Die In-App-Paywall auf iOS zeigte kurzzeitig noch die eingestellten Stufen Pro Mobile und Platform an. Die Paywall verkauft nun exakt dieselbe Pro-Stufe wie die Website.
- iOS: Seltener Absturz bei der Navigation während des Ladens einer Seite: iOS konnte abstürzen, wenn eine Seitennavigation während des Ladevorgangs abgebrochen wurde. Der Fix leitet jeden Fehlerpfad durch denselben abgesicherten Helper.
- Web: Login funktioniert in In-App-Browsern (Slack / X / LinkedIn / Instagram) und auf iOS Safari: Der Google-Login im Popup-Stil schlug fehl, wenn caiioo.ai aus einem Link in einer anderen App geöffnet wurde. Auf mobilen und In-App-Browsern nutzt die Seite nun einen Full-Page-Redirect anstelle eines Popups.
- Web: Community Hub-Feinschliff für Tablets und lange Namen: Die Navigationsleiste auf der Website wechselt nun bei Tablet-Breiten (bis 1024px) zum Hamburger-Menü. Tool-Icons greifen nun auf ein Emoji, dann auf ein bekanntes Logo und schließlich auf einen Anfangsbuchstaben-Avatar zurück, anstatt das Layout zu sprengen.
- Web: Community Hub zeigt nun den richtigen Autor für jedes Paket an: Jedes Paket im Hub wurde bisher mit „by caiioo“ beschriftet. Die Autoren spiegeln nun den echten Maintainer wider – „Model Context Protocol“, „oraios“ oder die Herstellermarke.
- Web: Sitemap löst keine „Seite mit Weiterleitung“-Warnungen mehr aus: Die Search Console markierte Seiten auf caiioo.ai als Weiterleitung, da die Sitemap URLs ohne den abschließenden Schrägstrich (Trailing Slash) auflistete, den die Live-Seite verwendet. Die Sitemap entspricht nun den kanonischen URLs.
Version 0.9.720 (1. Mai 2026)
Marke
- Allgemein: PebbleFlow heißt jetzt Caiioo: Das Produkt wurde in Caiioo umbenannt — dasselbe Tier, dieselbe App, die Sie bisher genutzt haben. Sie werden den neuen Namen überall in der Seitenleiste, den Einstellungen, auf der Website, im Menü der macOS-Host-App und in der Safari-Host-App sehen. Bestehende Daten, Konten, Logins und die Synchronisierung bleiben unverändert — nur der Anzeigename ändert sich. Die Marketing-Website ist vorerst unter pebbleflow.ai erreichbar und zeigt bereits die neue Marke an; das kanonische Routing über caiioo.ai folgt in einem späteren Release.
Neue Funktionen
- Allgemein: Simple Mode ist für neue Benutzer standardmäßig aktiviert: Erstinstallationen starten nun im Simple Mode — einem ruhigeren Composer, der Token- und Kostendetails pro Nachricht, das Dropdown für verlustfreie Kompression und Tab-Kontext-Indikatoren ausblendet. Die Modellauswahl bleibt sichtbar, da die Wahl eines Modells eine Kernaktion ist. Bestehende Benutzer behalten ihre jeweilige Simple Mode-Einstellung bei. Ein neues Augen-Symbol im Composer ermöglicht es, die vollständigen Details mit einem Klick ein- oder auszublenden.
- Allgemein: Kontolöschung: Sie können Ihr Caiioo-Konto jetzt auf der Account-Seite der Website löschen (auch verlinkt in der iOS-App, gemäß Apples Anforderungen zur Kontolöschung). Die Löschung entfernt Ihr Profil, Ihre Anmeldedaten, Ihr AI-Guthaben und die verschlüsselte Kopie Ihres bereitgestellten OpenRouter-Keys; minimale Compliance-Audit-Logs ohne Account-ID werden gesetzlich vorgeschrieben aufbewahrt. Ein neuer Abschnitt in der Datenschutzrichtlinie erläutert genau, was entfernt und was einbehalten wird.
- iOS: Natives On-Device Text-to-Speech (Kokoro 82M): Die Kokoro-Sprachsynthese läuft nun im iOS-Host-Prozess via OnnxRuntime statt innerhalb der WKWebView, analog zur e5-embeddings-Architektur aus Version 0.9.719. Das Modell nutzt das erhöhte Speicher-Budget des Host-Prozesses, anstatt mit der UI der Seitenleiste um das pro-Prozess-Limit von WebKit zu konkurrieren. Dadurch bringt On-Device TTS die WebView auf dem iPhone 13/14 unter Last nicht mehr zum Absturz.
Verbesserungen
- Allgemein: Bildgenerator funktioniert mit langsamen Streaming-Modellen: Das Bildgenerierungstool nutzt nun Streaming für OpenRouter-Bildmodelle. Dies behebt den Fehler "Network error: Unable to connect to OpenRouter" bei langsamen Modellen wie
gpt-5.4-image-2(~167 s End-to-End). Der bisherige gepufferte Pfad wartete auf ca. 1,8 MB Keepalive-Padding, bevor das eigentliche JSON eintraf, wodurch das Timeout der Verbindungsebene zuerst auslöste. - Allgemein: Free-Tier-Modellauswahl wählt Modelle dynamisch: Der bisherige
openrouter/freeMeta-Router leitete Anfragen innerhalb von OpenRouter weiter, ohne zu wissen, welche nachgelagerten Modelle Tools oder Vision unterstützten — Android-Nutzer, die ein Bild zusammen mit einem Tool-Aufruf sendeten, erhielten die Fehlermeldung "No endpoints found that support tool use". Caiioo routet nun selbst: Onboarding, Einstellungen und der "Free-Modelle nutzen"-CTA im Upgrade-Modal wählen ein echtes kostenloses Modell, das Tools (und Bildeingabe, falls verfügbar) unterstützt, und wechseln bei Rate-Limits oder Kapazitätsfehlern automatisch. Bestehende Nutzer aufopenrouter/freewerden beim nächsten Start schrittweise migriert. - Allgemein: Personal Intuition findet den richtigen Kontext bei langen Nachrichten: Die Retrieval-Abfrage wurde bisher auf die letzten 500 Zeichen Ihrer Nachricht begrenzt und als einzelner Vektor eingebettet. Bei langen, kopierten Nachrichten oder Themenwechseln führte dies dazu, dass entweder vor der eigentlichen Frage abgeschnitten wurde oder alles zu einem unscharfen Themen-Schwerpunkt verschwamm, der schlecht bewertet wurde. Caiioo extrahiert nun eine prägnante Abfrage — behält den wortgetreuen Anfang bei und fügt eine deduplizierte Sammlung inhaltstragender Token aus den nächsten 3000 Zeichen hinzu — so bleibt das Retrieval thematisch relevant, selbst wenn Ihr Prompt lang ist.
- Allgemein: Einstellungen → "Minimal settings"-Schalter ändert nicht mehr den eigenen Titel: Der Schalter wechselte seine Beschriftung zwischen "Minimal settings" (ein) und "Advanced settings" (aus). Dadurch las sich der Aus-Zustand so, als würde das Aktivieren des Kontrollkästchens zu den erweiterten Einstellungen führen — das Gegenteil von dem, was passiert. Der Titel bleibt nun konstant; die Beschreibung stellt "On — " / "Off — " voran, um den aktuellen Zustand eindeutig zu machen.
- Allgemein: Download-Dialog für Sprachmodelle verarbeitet unbestimmten Fortschritt: Die Modell-Infokarte während des Downloads konnte in der schmalen Seitenleiste überlaufen; das Layout ist nun fixiert. Wenn der Server keine Content-Length zurückgibt, zeigt der Fortschrittsbalken einen unbestimmten Spinner anstelle eines eingefrorenen 0%-Balkens.
- Allgemein: Simple Mode zeigt kompakte Statistik-Leiste statt alles auszublenden: Zuvor blendete der Simple Mode die gesamte Thread-Statistik aus. Jetzt wird eine schmale Leiste angezeigt — Kontext-Fenster-Ring, kompakte Gesamtzahl der Token (z. B. "1k"), Kosten und verbleibendes Guthaben — und das Augen-Symbol im Composer erweitert dies mit einem Klick auf die vollen Details.
- Allgemein: Subagent-Kosten werden korrekt zusammengefasst: In der Kostenaufstellung pro Thread fehlten bisher Ausgaben für Subagenten wie Perplexity / Web-Suche, Helper-Kosten, Bild-/Video-/Musikgenerierung, PDF-OCR und Sprachkosten. Alle Kategorien werden nun in der Zeile
sub_agent_costdes übergeordneten Elements zusammengefasst. - Allgemein: Einstellungen → Tools-Auswahl überschreibt versteckte, standardmäßig deaktivierte Tools: Die Wahl von "Always" oder "Auto" bei einem Tool, das standardmäßig deaktiviert ausgeliefert wird, wurde bisher stillschweigend ignoriert. Ihre dynamische Tool-Konfiguration überschreibt nun den Standardwert.
- Allgemein: Lokaler Sidecar in "Desktop app" umbenannt: Alle für Benutzer sichtbaren Verweise auf "PebbleFlow Relay" — den Sidecar, der lokale stdio MCP-Server und Desktop-exklusive Tools unterstützt — lauten nun "Desktop app", da dies das ist, was Benutzer tatsächlich installieren.
- Allgemein: Datenschutz-Texte gestrafft: Redundante Formulierungen zu "Telemetrie" wurden in den rechtlichen Richtlinien, Store-Einträgen, der Datenschutzseite der Website und dem In-App-Guide entfernt. "Keine Analysen" deckt dies bereits ab; es gibt keine faktische Änderung an dem, was die Apps sammeln oder nicht sammeln.
- Allgemein: Provider-Kontoansicht kennzeichnet Guthaben-Quelle: Das Panel für Provider-Konten gibt nun an, für welchen Key das jeweilige Guthaben gemeldet wird (Ihr BYOK-Key vs. der von Caiioo bereitgestellte Key), sodass Guthaben und Restbetrag auf den ersten Blick nicht mehr falsch zugeordnet werden können.
Fehlerbehebungen
- Allgemein: Apple Sign-In nach der Markenumstellung: Apple Sign-In schlug bei neuen Anmeldungen fehl, da die OAuth Services ID noch auf das alte
com.sixcailloux.PebbleFlow.webverwies. Dies wurde aufcom.sixcailloux.Caiioo.webumgestellt, sodass "Anmelden mit Apple" auf iOS, macOS und der Web-Account-Seite wieder funktioniert. - Allgemein: "Sign in"-Button bei OAuth-erforderlichen MCP-Servern: Die Installation eines remote OAuth-erforderlichen MCP-Servers (z. B. Notion) schreibt den Server in den Speicher, selbst wenn die initiale Verbindung fehlschlägt, weil OAuth erforderlich ist, aber kein Client registriert wurde. Der "Sign in"-Button sendete dann eine Refresh-Anfrage, die einen rohen "MCP server
not found"-Fehler zurückgab, anstatt den OAuth-Dialog zu öffnen. Der Refresh greift nun auf einen neuen addServer-Aufruf zurück, wenn der Client nicht registriert ist, sodass der OAuth/DCR-Prozess eingeleitet und der Anmeldedialog tatsächlich geöffnet wird. - Allgemein: Von nativen Apps gesendete Bug-Reports erfassen jetzt die korrekte App-Version: Die Shells für iOS, macOS und Android injizieren nun beim Start die installierte App-Version in die WebView. So identifizieren eingereichte Bug-Reports, von welchem Build sie stammen, anstatt das Feld leer zu lassen oder die Version der gebündelten Seitenleiste auszugeben.
- Android: Absturz beim Start nach dem Rebranding: Eine zu eifrige Umbenennung von PebbleFlow zu Caiioo hatte die Application-Klasse und JNI-Symbole auf der Kotlin-Seite umbenannt, ohne die entsprechenden nativen Exporte umzubenennen. Die App stürzte beim Start ab, da Symbole nicht aufgelöst werden konnten. Die Umbenennungen wurden rückgängig gemacht; die App startet wieder sauber.
- Allgemein: Google Workspace Re-Autorisierungsschleife: Benutzer mussten Google Workspace etwa jede Stunde neu autorisieren, da ihre gespeicherte OAuth-Verbindung keinen
refresh_tokenenthielt. Sechs zusammenhängende Fixes garantieren nun einen Refresh-Token bei jeder Gewährung und bewahren diesen durch Cloud-Sync, sodass Google-Verbindungen die 1-stündige Access-Token-TTL überstehen, ohne den Consent-Screen erneut aufzurufen. - Allgemein: Wiederherstellung bei "User not found" auf OpenRouter: OpenRouter gibt HTTP 401 "User not found" zurück, wenn der zugrunde liegende Benutzerdatensatz eines bereitgestellten Sub-Keys gelöscht wurde, die Key-Entität aber noch existiert. Caiioo zeigte dies bisher als defekte Erweiterung an, was nur durch Logout+Login behoben werden konnte. Der Provider repariert sich nun selbst, indem er einen frischen bereitgestellten Key einsetzt und die Anfrage einmal wiederholt.
- Allgemein: Google Docs
insert_componentgab irreführende Fehler zurück: Das Einfügen einer Komponente nach einer zuvor eingefügten Tabelle meldete "Document not found", da die eingefügte Tabelle nie an ihrencomponentNamegebunden wurde. Tabellen erhalten nun in derselben Einfügephase einen benannten Bereich, der Positions-Resolver berücksichtigt Nicht-Standard-tabId, und Fehler auf App-Ebene werden nicht mehr fälschlicherweise als 404 klassifiziert. - Allgemein: Neu veröffentlichte OpenRouter-Modelle verloren ZDR-Routing: Wenn ein Modell noch nicht in der Intelligence-Datenbank von Caiioo enthalten war, markierte der synthetische Fallback-Datensatz es als nicht ZDR-fähig, selbst wenn ZDR-exklusive Provider es tatsächlich unterstützten. Das ZDR-Routing nutzt nun denselben Provider-Listen-Fallback wie der reguläre Pfad.
- Allgemein: API
/v1/runsignorierte Anhänge beim allerersten Aufruf: Wenn der API-Endpunkt einen Agenten in einem frischen Thread startete, ging die Liste der Anhänge in der Benutzernachricht verloren, da der Zweig für leere Threads nur Text übertrug. Anhänge werden nun korrekt durchgereicht. - Allgemein: Native Apps konnten veraltete Einstellungen direkt nach einem Modellwechsel lesen: Auf Android-Geräten mit wenig Speicher konnte das Wechseln des Modells und das sofortige Senden einer Nachricht dazu führen, dass der Agent das vorherige Modell von der Festplatte las, da der 500 ms verzögerte (debounced) Schreibvorgang noch nicht ausgelöst worden war. Der Sendepfad erzwingt nun einen State-Flush, bevor der Agent gestartet wird.
- Allgemein: Tester-Bug-Triage (PF-260429 / PF-260430): Fünf Korrekturen — Benutzer mit verwalteten Keys (Free-Tier) können Dokumente nun über PDF OCR einlesen, ohne einen eigenen Key einzugeben; macOS fixiert die Zeitzone des Node-Sidecars auf den Host, damit Daten in der Sandbox korrekt aufgelöst werden; geplante Aufgaben bleiben nun auf iOS/macOS/Tauri-Shells bestehen (der WebView-Speicher-Stub verwarf Schreibvorgänge stillschweigend); das Konfigurations-Tool zeigt einmalige und manuelle Zeitpläne als reguläre Optionen an; und Tool-Aufrufstellen nutzen denselben OpenRouter 401 Self-Heal wie der Agent-Runner.
- Allgemein: Upgrade-Modal trennt Tier-Abonnement strikter von Credits/BYOK: "Add Credits" öffnete tatsächlich das Abonnement-Portal — die Beschriftung war falsch. Das Modal konzentriert sich nun ausschließlich auf das Tier-Abonnement; iOS blendet zudem gemäß Apple §3.1.1 alle Oberflächen zum Credit-Kauf aus.
- Web: Abschnitt "Konto löschen" an das Ende der Account-Seite verschoben: Der destruktive Block zum Löschen des Kontos wurde bisher inline zwischen der Identitätskarte und der Abonnement-/Abrechnungs-UI angezeigt. Er befindet sich nun ganz unten auf der Seite, nach den FAQ. Das iOS-Deep-Link-Verhalten in die reine Löschansicht bleibt unverändert.
- iOS: "Manage Plan" öffnet jetzt das Apple-Abonnement-Fenster: "Manage Plan" auf iOS leitete bisher bei Free-, Trial-, Stripe- und Benutzern unbekannter Herkunft auf die Web-Account-Seite weiter, wo Google OAuth in der WKWebView fehlschlug. Das Tippen auf "Manage Plan" unter iOS öffnet nun immer das StoreKit-Fenster
showManageSubscriptionsvon Apple. - iOS: Webansicht zur Kontolöschung reduziert auf Löschseite: Wenn der Button "Konto löschen" in iOS die Website öffnet, blendet die Seite nun alle Abrechnungsbereiche (Abonnement, Pläne, Credits, Stripe-Portal, FAQ) aus und zeigt nur den Löschabschnitt an, um §3.1.1 zu erfüllen.
- iOS: ITMS-90208 Framework-Version Validierungs-Fix: Die Info.plist des onnxruntime-Frameworks wird nun beim Archivieren angepasst, um dem Deployment-Target der Host-App zu entsprechen. So lehnt App Store Connect Builds nicht mehr mit der Meldung ab, dass das Framework die in der Info.plist angegebene Mindest-OS-Version nicht unterstützt.
- Android: Externe Links öffnen in einem Custom Tab, damit Google OAuth funktioniert: Das Tippen auf Links wie "pebbleflow.ai/account öffnen" erfolgte bisher innerhalb der Android WebView, wo Google OAuth mit
disallowed_useragent(Fehler 403) blockiert. Externe Links werden nun über die native Bridge in einen Chrome Custom Tab geleitet, dem Google vertraut. - Android: Kopieren-Buttons unter Nachrichten kopieren jetzt tatsächlich: Das Kopier-Icon nutzte direkt
navigator.clipboard.writeText, was in der Android WebView stillschweigend fehlschlägt, wenn die Benutzeraktivierung über die asynchrone Grenze hinweg abläuft. Das Kopieren erfolgt nun über die native Clipboard-Bridge.
Version 0.9.719 (25. April 2026)
Sicherheit
- Common: protobufjs CVE-2026-41242 behoben (CVSS 9.8):
protobufjs >= 7.5.5(aufgelöst zu 8.0.1) fixiert, um eine kritische Sicherheitslücke für Arbitrary-Code-Execution inRoot.fromJSONzu schließen. Caiioo importiertprotobufjsnicht direkt — es ist eine transitive Abhängigkeit vononnxruntime-web— und das praktische Risiko war gering, da wir nur gebündelte Modelle und keine vom Benutzer bereitgestellten Schemas einspeisen. Dennoch behoben, da der Fix trivial ist. - Common: @xmldom/xmldom — 4 High-Severity CVEs behoben:
@xmldom/xmldom >= 0.9.10fixiert. XML-Parsing wird in DOCX/XLSX-Redline-Pipelines und verschiedenen Erweiterungs-Codepfaden verwendet. - Server: undici — 3 High-Severity CVEs behoben:
undici >= 7.24.0incloud/relayfixiert. Betrifft nur den HTTP-Client des Relay-Servers. - Desktop: rustls-webpki + quinn-proto — 2 High-Severity CVEs behoben: Diese Tauri Rust-Abhängigkeiten aktualisiert. Betrifft die Windows + Linux Desktop-Builds, die über die Tauri-Shell laufen.
Neue Funktionen
- Common: Videogenerierung (Pro): Erstellen oder animieren Sie kurze Videos mit Google Veo 3.1, OpenAI Sora 2 Pro und ByteDance Seedance via OpenRouter. Das Tool wählt gültige Dauern und Auflösungen pro Modell aus, pollt bis zum Abschluss des Auftrags und speichert das Ergebnis als Thread-Anhang.
- Common: Musikgenerierung (Pro): Erzeugen Sie Songs und Instrumental-Clips mit Googles Lyria 3 Pro Preview via OpenRouter. Die Ausgabe wird als Audio-Anhang gespeichert, der inline abgespielt werden kann.
- Common: Dynamischer Video-Modellkatalog: Der Videogenerator ruft die aktuelle Liste der videofähigen OpenRouter-Modelle zur Laufzeit ab, sodass neue Anbieter und Modelle ohne ein caiioo-Update erscheinen. Ein gebündelter Snapshot stellt die Offline-Funktionalität sicher.
- Common: Dynamischer Musik-Modellkatalog: Dasselbe für die Musikgenerierung — das Tool erkennt neue Musikmodelle, sobald OpenRouter sie veröffentlicht, mit Offline-Fallback.
- Common: Benutzerdefiniertes OAuth für Pro: Bring-Your-Own-Auth — der Google Workspace-Assistent, der Microsoft 365-Assistent und der generische Flow "Benutzerdefinierten Anbieter hinzufügen" — ist jetzt für alle Pro-, Platform-, Teams- und Enterprise-Benutzer unter Einstellungen → Custom OAuth sichtbar. Zuvor waren der Tab und die Schaltflächen hinter Tester-Flags versteckt, sodass zahlende Benutzer das BYOA-Setup nicht erreichen konnten.
- Common: Physik + Strukturanalyse (Pro): Das Physik-Simulations-Tool (Wurfbewegung, Kollisionen, kinetische/potenzielle Energie, Impuls, Kraft, Geschwindigkeit-zum-Ziel) und die Strukturanalyse (Balkenbelastung, Knicken von Säulen, Materialeigenschaften) sind jetzt für Pro-Nutzer neben den anderen Kreativ- und Hilfswerkzeugen verfügbar.
- Common: Seeing-Eye Dog — Vision-Fallback für reine Text-LLMs: Reine Textmodelle wie DeepSeek V4 Pro, Kimi K2.6, MiMo V2.5 Pro und lokale Ollama-Modelle können jetzt Bildanhänge verarbeiten, indem sie diese über ein konfiguriertes günstiges Vision-Modell leiten (Standard: Gemini 3.1 Flash Lite). Die automatische Bildbeschreibung erfolgt zum Zeitpunkt der Nachrichtenerstellung und wird pro Anhang zwischengespeichert, sodass für nachfolgende Runden keine Kosten anfallen; ein dediziertes
vision({action: "inspect"})Tool gibt dem Modell gezielten Follow-up-Zugriff. Unter Einstellungen → Tools → Vision Fallback Model kann der Helfer ausgewählt werden. - Common: XLSX-Änderungsnachverfolgung auf Zellenebene: Tabellenkalkulations-Artefakte unterstützen jetzt dieselbe Redlining-UX wie DOCX. KI-Vorschläge via
propose_change(editMode: 'xlsx_cell')erzeugen lokalisierte Änderungen, die ancellRef+sheetNameverankert sind; manuelle Bearbeitungen im Änderungsmodus erstellen Diffs auf Zellenebene; Zellen mit ausstehenden Änderungen werden inline als<del>alt</del><ins>neu</ins>gerendert; die vorhandene Toolbar (Nächste/Vorherige/Annehmen/Ablehnen) funktioniert nun auch für Zellenänderungen; gleichzeitige KI- und Benutzer-Edits werden Zelle für Zelle zusammengeführt, wobei bei Konflikten in derselben Zelle die Benutzeränderung Vorrang hat. - Common: Kostenverfolgung für Video- und Musikgeneratoren: Generierte Videos (via OpenRouter
/api/v1/videos) und Musik (viachat-completions) werden nun wie die Bildgenerierung in die Thread-Gesamtkosten eingerechnet, mit neuen Aufschlüsselungszeilen fürvideo_gen_costundmusic_gen_costim Kosten-Dropdown der Seitenleiste.
Verbesserungen
- Common: Stabilität der GPT-5 Serie: OpenAIs gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro und gpt-5.3-codex produzieren bei tool-intensiven agentischen Konversationen keine lautlosen leeren Antworten mehr. Eine Interaktion im Funktions-Tool-Schema führte dazu, dass das Backend von OpenAI Streams beendete, ohne eine Ausgabe zu erzeugen; Caiioo serialisiert Tools nun in dem Format, das diese Modelle erfordern.
- Common: Besseres Verhalten bei langen Konversationen auf GPT-5.4+: Multi-Turn-Konversationen mit gpt-5.4, gpt-5.4-pro und gpt-5.3-codex brechen bei langen Tool-Aufrufsequenzen nicht mehr vorzeitig ab — der Phasenmarker, den OpenAI verwendet, um Zwischenkommentare von finalen Antworten zu unterscheiden, bleibt nun über Turns hinweg erhalten.
- Common: GPT-5.x Reasoning im Thinking-Panel sichtbar: gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro und gpt-5.3-codex streamen nun ihre Reasoning-Zusammenfassung während des Denkprozesses in das Thinking-Panel im Chat, analog zum Verhalten von Gemini. Zuvor blieb das Thinking-Panel für diese Modelle leer, obwohl OpenRouter Reasoning-Text streamte.
- Common: Transparente Wiederherstellung bei vorübergehenden Upstream-Ausfällen: Wenn OpenRouter eine Anfrage an einen Upstream leitet, der einen vorübergehenden 5xx-Fehler zurückgibt, bevor Inhalte gestreamt werden, versucht Caiioo den Aufruf stillschweigend über einen anderen Upstream erneut, anstatt eine leere Antwort anzuzeigen.
- Common: Klarere Fehlermeldungen bei Stream-Abbruch: Abstürze auf Anbieterseite, Ablehnungen durch Inhaltsfilter und andere Fehler mitten im Stream werden nun mit einer spezifischen Fehlermeldung angezeigt, anstatt dass die Konversation ohne Erklärung einfach "stoppt".
- Common: Generierte Videos und Musik werden inline gerendert: Generierte Videos und Musik erscheinen nun wie generierte Bilder direkt in der Konversation — ein Video- oder Audioplayer wird über der finalen Antwort mit einem kleinen Badge des erzeugenden Modells angezeigt, anstatt im eingeklappten Tool-Bereich versteckt zu sein.
- Common: Standardmodell-Auswahl für Video- und Musik-Tools: Einstellungen → Tools enthält nun ein Dropdown-Menü für das Standardmodell der Video- und Musikgeneratoren, analog zur vorhandenen Bildgenerator-Auswahl. Der Agent verwendet standardmäßig Ihr ausgewähltes Modell; Sie können dies pro Anfrage weiterhin überschreiben, indem Sie ein anderes Modell nennen.
- Common: Personal Intuition Indexierungsstatus-Anzeige: Das Einstellungsmenü für Personalisierung zeigt nun eine Live-Zeile "Indiziert: N Threads · M Chunks · K Token · zuletzt indiziert vor Xm" an, damit Sie bestätigen können, dass der Memory-Indexer ordnungsgemäß arbeitet. Die Zusammenfassung des letzten Backfills bleibt nach Abschluss des Laufs sichtbar, anstatt zu verschwinden.
- iOS: Native On-Device Embeddings (schneller, weniger Speicher): Die Multilingual-e5-small Inferenz läuft nun im iOS-Host-Prozess via Apples
onnxruntime-objcanstatt innerhalb der WKWebView. Dies löst ein Speicherlimit pro Prozess, das die WebView ca. 7 Sekunden nach dem Laden des Modells zum Absturz brachte (der Crash nach dem Login). Nach der ersten Encodierung des Tool-Katalogs werden nachfolgende Tool-Auswahl-Aufrufe über einen In-Memory-Cache pro Text in ca. 10 ms statt ca. 5 s abgeschlossen. Das Refactoring der gemeinsamen Pipeline verhindert zudem, dass Personal Intuition und die On-Device Tool-Auswahl jeweils eine eigene ~115 MB Kopie des Modells laden. - Common: Personal Intuition + On-Device Tool-Auswahl teilen sich eine e5-Pipeline: Beide Funktionen instanziierten zuvor ihren eigenen Multilingual-e5-small Loader (jeweils ~115 MB, insgesamt ~230 MB im Renderer). Sie delegieren nun an eine einzige gemeinsame Pipeline, die gleichzeitige Ladevorgänge dedupliziert und die Kaltstartkosten halbiert.
Fehlerbehebungen
- Common: Browser-Session-Cookies leaken nicht mehr in API-Aufrufe: Wenn Sie openrouter.ai in einem Browser-Tab besucht hatten, hängte die Erweiterung unbeabsichtigt Ihre OpenRouter-Browser-Sitzung (Clerk / Stripe / Analytics-Cookies) an jeden API-Aufruf an. API-Aufrufe sind nun strikt Bearer-authentifiziert.
- Common: GPT-5.4 Antworten erscheinen nicht mehr doppelt: Ein Fehler wurde behoben, bei dem gpt-5.4, gpt-5.4-pro und gpt-5.3-codex Antworten denselben Text doppelt anzeigten — der Payload der finalen Antwort wurde zusätzlich zum Token-Stream akkumuliert, der ihn bereits gerendert hatte.
- Common: Modell-Auswahl aktualisiert sich nach Neuladen: Die Modellliste wird nun bei Versions-Upgrades ungültig gemacht und berücksichtigt eine kurze In-Memory-TTL, sodass neu veröffentlichte OpenRouter-Modelle nach einem Neuladen erscheinen, anstatt hinter einem veralteten Cache verborgen zu bleiben. Langlebige Service Worker behalten keinen eingefrorenen Katalog mehr bei.
- Common: Kurzlinks für generierte Medien öffnen den Player: Wenn ein Modell nach der Generierung von Audio/Bild/Video einen Kurzlink wie
[Anhören](audio-…)schreibt, öffnet ein Klick darauf nun den Slate-Player, anstatt als fehlerhafte externe URL fehlzuschlagen. Derselbe Fix gilt für Bild- und Videolinks. - Common: Generierte Medien als Markdown-Bildeinbettungen wurden fehlerhaft gerendert: Wenn das Modell einen Video- oder Audioanhang als
statt[Video 1](video-…)schrieb, wurde er als fehlerhaftes<img>gerendert, anstatt den Player zu öffnen. Das führende!wird nun entfernt, damit der Link den Slate-Viewer öffnet. - Extension: Seitenleiste "Standortberechtigung verweigert" Sackgasse: Ein Fehler wurde behoben, bei dem jede Standortanfrage in der Seitenleiste "Standortberechtigung verweigert. Bitte erlauben Sie den Standortzugriff in den Browsereinstellungen" zurückgab, unabhängig davon, was der Benutzer klickte. Ein Versuch, über das Offscreen-Dokument zu routen, führte sofort zu
PERMISSION_DENIED, da der Offscreen-Kontext keine Berechtigungsaufforderung anzeigen kann und das Manifestgeolocationnicht deklariert. Die Seitenleiste verwendet nun wieder die ursprüngliche Kette aus Content-Script und anschließender IP-Geolokalisierung. - Common: Vollständiger Neuaufbau von Personal Intuition hinterließ veraltete Indizierungszahlen: Ein Fehler wurde behoben, bei dem der Backfill beim vollständigen Neuaufbau das Update des Index pro Thread übersprang, sodass unter Einstellungen → Personalisierung nach einem Neuaufbau überhöhte Summen von vor dem Neuaufbau angezeigt wurden. Threads, die beim vollständigen Neuaufbau gescannt, aber zuvor nicht indiziert wurden, sind nun auch für den Abruf sichtbar.
- iOS: WKWebView-Absturzschleife nach dem Login: Drei kombinierte Fixes für den Absturz nach dem Login. (1) Native e5-Embeddings laufen nun in Batches von 8 Chunks, wobei die ORT-Memory-Arena so eingestellt ist, dass sie zwischen den Durchläufen schrumpft — der maximale Arbeitsspeicher bleibt unter ~100 MB, anstatt auf ~3 GB anzusteigen und den iOS-Prozess-Kill auszulösen. (2) Der On-Device-Retriever wird nun während
requestIdleCallbackaufgewärmt statt direkt beim Booten, sodass er nicht mehr mit Lizenz-Sync, Identitätswiederherstellung, UI-Rendering und Cloud-Sync-Initialisierung konkurriert. (3) Der On-Device-Retriever wird bei Identitäts- oder Tier-Wechsel neu bereitgestellt, sodass Neuinstallationen nicht mehr stillschweigend auf Cloud-Helfer zurückgreifen, weil das Tier bei der ersten Registrierung undefiniert war. - iOS: Fehlerhafte "Path Traversal Blocked" 403-Fehler:
LocalFileSchemeHandlermarkierte fälschlicherweise jeden 404-Fehler als Path-Traversal-Versuch, daNSString.standardizingPathnur für Dateien auf der Festplatte/var→/private/varauflöst. Legitime Pfade zu nicht existierenden Ressourcen (das iOS-Bundle schließt*.wasmaus, plus Chrome-Extension-API-Pfade wieapi/active-tab-context) gaben 403 statt 404 zurück, was den wasm-Pre-Fetch-Fallback von transformers.js unterbrach. Ersetzt durch eine stringbasierte../ NUL-Prüfung analog zum Android-Handler. - Common: In PDF eingebettete Bilder brachten reine Textmodelle zum Absturz: Das Senden eines PDFs mit eingebetteten Bildern an ein reines Textmodell von OpenRouter (DeepSeek V4 Pro, Kimi K2.6, etc.) führte zur Fehlermeldung "Keine Endpunkte gefunden, die Bildeingabe unterstützen" — genau die Warnung, die das neue Seeing-Eye Dog Routing eliminieren sollte. Der PDF-Übertragungspfad berücksichtigt nun dasselbe
supportsVision-Flag pro Modell wie die Bildblock-Übertragung, sodass reine Textmodelle ein reines Text-PDF erhalten und der Agent bei Bedarf einen Vision-Subagenten starten kann. - Common: Umschalten der Ad-Blocker-Stufe wurde nicht wirksam: Das Umschalten der Ad-Blocker-Stufe (Aus / Standard / Aggressiv) änderte nur den gespeicherten Wert, während die aktiven DNR-Regeln + das statische Regelset in Kraft blieben, bis der Service Worker zufällig neu startete — so blieben Seiten wie ads.google.com auch nach dem Ausschalten blockiert. Der Storage-Listener überwacht nun den
globalSharedSettings-Bucket, in den die Einstellung tatsächlich geschrieben wird, und das veralteteadBlockerEnabled-Flag wird über denselben Bucket geleitet. - Extension: Zu große Bilder wurden stillschweigend verworfen: Wenn ein Bildanhang das API-Limit überschritt, hatte der Extension Service Worker keine Komprimierungsimplementierung registriert (nur die serverbasierte sharp-Implementierung war vorhanden) — daher fing die Sicherung in
pushImageBlockden Fehler ab und verwarf das Bild vollständig. Der SW prüft nun die natürlichen Dimensionen viacreateImageBitmapund leitet die Encodierung über das vorhandene Offscreen-Dokument, sodass Aufrufer im Extension-Kontext das komprimierte Bild anstelle eines verworfenen Platzhalters erhalten. - Common: Generierte Bilder und Screenshots von Anbietern abgelehnt: Anthropic begrenzt base64-Bilder auf 5 MB; andere Anbieter haben ähnliche Limits. Generierte Bilder von FLUX / Gemini / Seedream und große Screenshots wurden in voller Größe weitergegeben, was zu 4xx-Fehlern führte, die den gesamten Agent-Turn abbrachen. Drei Schutzebenen: Der Bildgenerator komprimiert die Ausgabe vor der Speicherung; ein neuer
pushImageBlock-Helfer leitet jedeimage_url-Emission durch compress-or-drop; und sowohl der Screenshot-Rebuild als auch die Live-Screenshot-Injektion nutzen denselben Helfer. Ein konservatives 4 MB Limit sorgt nun für Kompatibilität mit allen Anbietern.
Version 0.9.718 (22. April 2026)
Neue Funktionen
- Common: Personal Intuition — assoziatives thread-übergreifendes Gedächtnis: Caiioo merkt sich im Hintergrund, worüber Sie zuvor gesprochen haben — über jede Konversation hinweg, nicht nur in der aktuellen. Relevante Erinnerungen werden während des Chats abgerufen; Ihr Agent kann diese direkt verwenden oder sie subtil in die Antwort einfließen lassen. Ähnlich wie ein Duft an einen Ort erinnern kann. Sie finden die Funktion unter Personalisierung → Personal Intuition; standardmäßig deaktiviert. Enthält Full-rebuild und Incremental backfill, damit Sie Ihre bestehenden Threads indexieren können.
- Common: Personal Intuition Backup & Restore: Sie können einen Snapshot des gesamten Gedächtniskorpus in einer JSON-Datei unter Backup & Restore → Personal Intuition speichern und diesen später wiederherstellen, falls Probleme auftreten oder Sie die Daten auf ein anderes Gerät übertragen möchten.
- Common: Instant Tool Chooser Standard für jeden Tier: Der semantische Tool-Chooser läuft jetzt lokal auf jedem Gerät und in jedem Tier — inklusive der kostenlosen Version. Er wählt die richtigen Tools für jeden Turn in ca. 10 ms aus, vollständig auf Ihrem Gerät. Die Picker-UI in Settings → Tools verdeutlicht die Wahl zwischen „Instant Tool Chooser“ und „Quick Tasks LLM“ (welches das Modell verwendet, das Sie im Model-Picker mit dem Blitzsymbol markiert haben).
- iOS / Android: Instant Tool Chooser in den nativen Apps: Derselbe On-Device Tool-Chooser ist nun innerhalb der WebView der iOS- und Android-Apps verfügbar, nicht mehr nur in der Browser-Extension und auf dem Desktop.
Verbesserungen
- Common: Slate Sandbox erlaubt HTTPS Script CDNs: HTML Slate-Artifacts können jetzt gängige Bibliotheken wie Chart.js oder D3 von vertrauenswürdigen HTTPS CDNs (jsdelivr, unpkg, etc.) laden. Der Datenabruf (Data fetching) ist weiterhin auf Same-Origin beschränkt; verwenden Sie daher
bind_data, um Attachment-Daten in ein Slate zu leiten. - Common: Klarerer Fortschritt bei Personal Intuition: Der Backfill zeigt nun während der Ausführung den Fortschritt pro Thread im Einstellungsbereich an (z. B. „47/75 Threads · 2.134 Chunks“), anstatt bis zum Abschluss keine Rückmeldung zu geben.
- Common: Schnellere Tool-Auswahl nach Gedächtnis-Indexierung: Die Indexierung eines großen Gedächtniskorpus löscht nicht mehr den Tool-Catalog-Cache im On-Device Retriever — der nächste Tool-Aufruf bleibt „warm“, anstatt die Kosten für eine erneute Kodierung zu verursachen.
Fehlerbehebungen
- Common: Gleichzeitige Sub-Agenten verursachten fälschlicherweise Tier-Upgrade-Fehler: Ein Race-Condition-Fehler wurde behoben, bei dem zwei parallel laufende Sub-Agenten den Kontext des jeweils anderen aktiven Threads überschreiben konnten. Dies führte dazu, dass Pro-exklusive Aktionen (update_slate, etc.) für den falschen Sub-Agenten abgelehnt wurden. Die Tier-Prüfung ist nun auf den spezifischen Thread des auslösenden Aufrufs beschränkt.
- Common: Slate CSV-Datenbindungen unterbrachen
forEach: Es wurde ein Fehler behoben, bei dem CSV-gebundene Daten in der Sandbox als nicht-iterierbares Objekt ankamen —data.forEach(...)innerhalb des Sandbox-JavaScript funktioniert nun wie erwartet.
Version 0.9.717 (17. April 2026)
Neue Funktionen
- Common: Einheitlicher Pro-Tier über alle Apps: Pro ist jetzt ein einziges Abonnement für 9 $/Monat, das jede caiioo-App freischaltet — Chrome, Desktop und Mobile — anstatt separater App-Tier-Kontingente. Platform (14 $/Monat) wird als „Pro + Infrastruktur“ neu positioniert (lokaler Server, API-Zugriffsvorschau, Messaging).
- Common: Pro Mobile Tier: Ein rein mobiles Pro-Abo ist für 2,99 $/Monat erhältlich und wird direkt im App Store und Play Store verkauft. Der In-App-Kauf selbst stellt die Berechtigung dar — es ist keine separate Lizenz erforderlich.
- Common: Ask-User-Tool für Human-in-the-Loop: Der Agent kann nun während eines Durchlaufs pausieren und einen vierstufigen Entscheidungsdialog anzeigen (Genehmigen, Genehmigen mit Anmerkungen, Ablehnen, Ablehnen mit Anmerkungen). Ihre Anmerkungen fließen als Anweisungen in einfachem Englisch an das Modell zurück, die den vorgeschlagenen Plan überschreiben — es wird kein neuer Zyklus gestartet, der Agent fährt an Ort und Stelle fort.
- Common: In-App-Suche für den Guide: Durchsuchen Sie das Benutzerhandbuch direkt über das Dokument-Menü. Ergebnisse verlinken direkt auf caiioo.ai/guide, wobei der bestehende Redirect-Flow beibehalten wird.
- iOS: Monatlicher/Jährlicher Paywall-Umschalter: Das iOS-Abonnement-Fenster ermöglicht es nun, vor dem Kauf zwischen monatlicher und jährlicher Abrechnung zu wechseln.
- Desktop: Auto-Updates unter Windows und Linux: Die Tauri-Desktop-App wird jetzt mit aktiviertem Updater ausgeliefert, sodass Windows- und Linux-Builds Updates direkt empfangen können, anstatt eine manuelle Neuinstallation zu erfordern.
- Web: Tab-Suche über Guide und Blog: Die Guide- und Blog-Layouts der Marketing-Website enthalten jetzt eine Suchleiste mit Tab-basierter Bereichsumschaltung — Titel-Treffer werden höher eingestuft als Text-Treffer, und der aktive Tab wechselt automatisch dorthin, wo die Ergebnisse liegen.
- Web: Dedizierte Linux-Installationsseite: Die Installationsseite leitet Linux-Nutzer zu
/install/linuxweiter, wo AppImage,.debund.rpmOptionen mit befehlsspezifischen Anweisungen pro Distribution aufgeführt sind. - Web: Stabile Download-Routen:
/download/macos,/download/linuxund/download/windowssind jetzt stabile, durch Edge-Worker unterstützte URLs, die immer auf das neueste Release verweisen — kein Website-Rebuild pro Release erforderlich.
Verbesserungen
- Common: In-App-Support-Ticketing: Support-Anfragen werden nun primär über den In-App-Ticket-Flow geleitet, mit klareren Fehlermeldungen zu Credits, die Sie an die richtige Stelle führen, wenn etwas schiefgeht.
- Common: Intelligenteres Google OAuth Re-Auth: Google-Tools verifizieren nun die tatsächlich von Google gewährten Scopes und lösen eine Just-in-Time-Aufforderung zur erneuten Autorisierung aus, wenn ein 403-Fehler auf einen fehlenden Scope hinweist, anstatt lautlos fehlzuschlagen.
- Common: Voller Drive-Scope für Google-Schreibvorgänge: Schreibaktionen in Google Drive fordern nun den vollen Drive-Scope an, damit Bearbeitungen an Dokumenten, die Sie nicht selbst erstellt haben, erfolgreich sind, anstatt auf Berechtigungsfehler zu stoßen.
- Common: Modellbeschreibungen für den Bildgenerator: Das Tool zur Bildgenerierung zeigt nun eine Beschreibung für jedes verfügbare Modell an, um die Auswahl des richtigen Modells für die jeweilige Aufgabe zu erleichtern.
- Common: Präzisere Slate-Artifact-Meldungen: Wenn ein Tool ein Slate-Artifact erstellt oder aktualisiert, behauptet das Modell nicht mehr, dass das Artifact „im Editor angezeigt wird“ — die Formulierung spiegelt nun das tatsächliche Geschehen wider.
- Common: Bessere dynamische Tool-Auswahl aus Tabs: Der Tab-Kontext-Hinweis gibt nun Tool-IDs aus, sodass der dynamische Tool-Selektor kontextbasierte Auswahlregeln anwenden kann, die davon abhängen, welche Tools verfügbar sind.
- Common: Sprachkosten den Threads zugeordnet: Die Nutzung von Streaming-TTS (ElevenLabs, Resemble) und STT (ElevenLabs Scribe) wird nun als Sprachkosten in der Konversation abgerechnet, in der sie angefallen sind, analog zum bestehenden One-Shot-Synthese-Pfad.
- Extension: Login-Untertitel betont lokale Agenten: Kleine Textaktualisierung auf dem Login-Bildschirm.
Fehlerbehebungen
- Desktop: Linux-Dateiauswahl wiederhergestellt: Fehler behoben, bei dem die Dateiauswahl unter Linux in der Tauri-Desktop-App fehlschlug.
- Desktop: Falsche Versionsanzeige: Fehler behoben, bei dem die Tauri-Desktop-App einen falschen Versionsstring in der UI und Telemetrie meldete.
- Desktop: Leiseres Linux-Audio und klarere Fehler: PipeWire-Log-Rauschen unter Linux unterdrückt, OpenRouter-Fehler angezeigt statt verschluckt, den API-Umschalter-Pfad wiederhergestellt und ein fehlerhaftes Paritäts-Banner korrigiert.
- Common: Gmail-Textextraktion verlor Links: Die Priorität der Gmail-Extraktion wurde umgekehrt, um zuerst Link-erhaltendes Markdown zu versuchen und erst dann auf Plain Text zurückzugreifen, wenn die Markdown-Ausgabe leer ist — E-Mails verlieren im Regelfall keine Links mehr.
- Common: Öffentliche API-Einstellungen wurden nicht gespeichert: Fehler behoben, bei dem der Public API-Umschalter und das Access Token auf einigen Systemen nicht gespeichert wurden; es wurde sichergestellt, dass diese Einstellungen strikt lokal bleiben und nicht in die Cloud synchronisiert werden.
- Common: Archivieren und Umbenennen fühlten sich verzögert an: Löschen, Archivieren, Dearchivieren und Umbenennen aktualisieren die UI nun optimistisch, sodass die Liste die Änderung sofort widerspiegelt, anstatt auf eine Server-Antwort zu warten.
- Common: Archiv-Löschungen wurden nicht synchronisiert: Fehler behoben, bei dem Archiv-Löschungen direkt auf den Speicher angewendet wurden und den Protokollpfad umgingen — sie werden nun wie jede andere Thread-Aktion über alle Clients hinweg propagiert.
- Common: Agenda zeigte fälschlicherweise „Fehlende Scopes“: Fehler behoben, bei dem das Erinnerungs-/Agenda-Widget direkt nach der Gewährung von Google Calendar-Scopes ein veraltetes Tool-Kontext-Profil las und fehlende Scopes meldete, obwohl die Tools funktionierten. Die UI liest nun das aktuelle Profil, und ein Refresh führt den Flow zur Zustimmung für inkrementelle Scopes nacheinander für alle verbundenen Google-Konten aus, die dies noch benötigen — das Öffnen des Sync-Dialogs zur Suche nach „Zugriff gewähren“ entfällt.
- Common: Google-Tool-Aufrufe mit „Unknown name exclusiveMinimum“ abgelehnt: Fehler behoben, bei dem Gemini Tool-Aufrufe ablehnte, deren Parameter-Schemas numerische
exclusiveMinimum/exclusiveMaximumGrenzen verwendeten — diese werden nun entfernt, bevor sie an Googles eingeschränktes OpenAPI-Subset gesendet werden. - Common: Remote MCP-Server ohne DCR konnten nicht verbunden werden: Fehler beim Hinzufügen von Remote-MCP-Servern behoben, die keine Dynamic Client Registration unterstützen (z. B. Slack): Der Client respektiert nun RFC 9728 protected-resource-metadata, folgt
authorization_serverszum AS-Host, wenn dieser vom Resource-Host abweicht, und versucht nicht mehr, einen nicht existierenden/register-Endpunkt anzusprechen. - Server: Tester-Tier-Nutzer von Gated Endpoints abgelehnt: Fehler behoben, bei dem Endpunkte für Organisationen, Hub, Admin und Provisioned-Keys Nutzer ablehnten, deren effektiver Tier (aus Lizenzen) höher war als der veraltete Tier-Snapshot in ihrem Auth-Token. Gated Endpoints bewerten den effektiven Tier nun konsistent mit
/api/auth/me. - Extension: Identity-Sync Ping-Pong-Schleife: Konfliktbehaftete Identitäten zwischen der Extension und dem Relay-Server, die eine Endlosschleife bei
IDENTITY_SYNCverursachten, wurden behoben. Die Extension bestätigt nun einmalig gegenüber demselben konfliktbehafteten Remote-Server, warnt, dass man sich auf einer Seite abmelden muss, und setzt bei Trennung / Übereinstimmung / Remote-Übernahme zurück. - Common: Gemini Flash TTS konnte nicht ausgewählt oder konfiguriert werden: Fehler behoben, durch den Gemini Flash TTS (Voice) durchgehend unbrauchbar war — die Auswahl wurde beim Schließen der Einstellungen zurückgesetzt, und das API-Key-Feld schien keine Eingaben zu akzeptieren. Der Provider ist nun eine vollwertige TTS-Option: Die Auswahl bleibt bestehen, API-Key + Voice-Picker speichern korrekt, und die Synthese nutzt einen SSE-Streaming-Endpunkt, sodass die Audiowiedergabe beginnen kann, bevor die vollständige Äußerung fertig generiert ist.
- iOS: UI für neue Threads wechselte nicht: Fehler behoben, bei dem die iOS-App die aktive Ansicht nicht auf einen neu erstellten Thread umschaltete, sowie ein damit verbundener
modelNameReferenceError, der den Composer zum Absturz bringen konnte. - iOS: Startup-Crash bei optionalem Storage-Hook: Ein iOS-Absturz wurde behoben, wenn
storage.primeSettingsCachewährend des Starts nicht verfügbar war — der Aufruf ist nun abgesichert. - Common: Tier-Audit-Diskrepanzen nach Preisänderung: Sechs Unstimmigkeiten bei Preisen und Funktionen wurden behoben, die durch das Tier-Audit aufgedeckt wurden, sodass Berechtigungsprüfungen, Upgrade-Aufforderungen und Feature-Flags nun über Extension, Website und mobile Apps hinweg übereinstimmen.
iOS App Store Compliance
- iOS: Externe Signup-CTAs im Onboarding ausgeblendet: Das Onboarding zeigt keine Handlungsaufforderungen (CTAs) mehr an, die Nutzer für die Kontoerstellung oder kostenpflichtige Upgrades von der App wegführen.
- iOS: UI für Credit-Käufe ausgeblendet: Oberflächen für den Kauf von Credits sind auf iOS gemäß Apples §3.1.1-Regeln ausgeblendet; Abonnements werden stattdessen über StoreKit abgewickelt.
- iOS: Support- und Credit-Fehler-Formulierungen aktualisiert: Die /support-Seite und Fehlermeldungen zu Credits wurden auf iOS umformuliert, um Apples Richtlinien bezüglich Verweisen auf externe Käufe zu entsprechen.
Version 0.9.716 (12. April 2026)
Neue Funktionen
- Common: Gemini 3.1 Flash TTS: Neue Sprachausgabe-Option, unterstützt durch Google's Gemini 3.1 Flash TTS. 30 vordefinierte Stimmen, über 70 Sprachen und Inline-Audio-Tags wie
[whispers]und[sighs]für expressive Synthese. Nutzen Sie Ihren eigenen Gemini API-Key; einen kostenlosen erhalten Sie unter aistudio.google.com. Audio ist mit SynthID wassergezeichnet. - Common: Sprachkosten in der Konversationssumme: Die API-Nutzung für Text-to-speech und Speech-to-text (Gemini, ElevenLabs, Resemble) wird jetzt in der Kostenzusammenfassung pro Thread neben Chat-, Bildgenerierungs-, Helper- und OCR-Kosten aufgeführt – damit die angezeigte Zahl der tatsächlichen entspricht.
- Common: SQL Database Tool: Fügen Sie SQLite-Datenbanken zu Konversationen hinzu und fragen Sie diese mit SQL ab. Ergebnisse können als Live-Dashboards in Slate-Artifacts gerendert werden.
- Common: Kalendereinladungen und Google Meet: Das Erstellen von Kalenderereignissen sendet jetzt Einladungs-E-Mails an Teilnehmer und kann automatisch einen Google Meet-Videolink hinzufügen.
- Common: Per-Tool Provider Routing: Leiten Sie einzelne Tools (Bildgenerierung, Suche, PDF OCR, etc.) über die Settings an spezifische Provider weiter, anstatt alles über das Standardmodell laufen zu lassen.
- Common: Conversation Sharing: Teilen Sie Konversationen als Markdown oder Klartext.
- Common: 14-tägige Platform-Testversion: Starten Sie eine 14-tägige Testversion der Platform-Stufe über die Extension-UI oder die Website-Account-Seite. Pro-Abonnenten sind ebenfalls berechtigt.
- Common: ZDR Quick-Filter im Model Picker: Neue Schaltfläche im Modell-Auswahlmenü, um schnell nach Zero-Data-Retention-Modellen (ZDR) zu filtern.
- Common: Vereinfachte Settings: Die Settings öffnen sich standardmäßig in einer optimierten Simple-Ansicht, die nur das Wesentliche zeigt. Wechseln Sie jederzeit in den Advanced-Modus, um alles zu sehen.
- Common: Kostenloser Google Gemini Zugriff: Nutzen Sie Ihren eigenen Google AI Studio Key, um Gemini 2.5 Flash kostenlos zu verwenden – die kostenlose Stufe von Google ist jetzt für alle Nutzer verfügbar, kein kostenpflichtiger Plan erforderlich.
- Common: Baseten Self-Hosted Models: Verbinden Sie Ihre eigenen Baseten-Deployments, um selbstgehostete Modelle direkt in Caiioo zu nutzen.
- iOS: WhisperKit On-Device Speech-to-Text: Die Diktierfunktion läuft jetzt vollständig lokal auf dem Gerät via WhisperKit – Audio verlässt das Telefon nie.
- Android: On-Device Whisper STT: Speech-to-text via whisper.cpp läuft vollständig lokal auf Android-Geräten mit Mikrofon-Berechtigungs-Flow.
- Android: GPU-beschleunigtes Moonshine STT: Auf GPU-fähigen Android-Geräten kann die Diktierfunktion auf Moonshine mit Inferenzzeiten im Sub-Sekunden-Bereich laufen. Nur Englisch; whisper.cpp bleibt der mehrsprachige Fallback.
- Web: Sign in with Apple auf Account- & Hub-Seiten: Apple Sign-In ist jetzt auf den Account- und Hub-Seiten der Website verfügbar.
Verbesserungen
- Common: Besserer PDF-Export: Der Export eines PDFs aus Slate erzeugt nun eine echte PDF-Datei, anstatt den Druckdialog zu öffnen, sodass Sie jedes Mal ein sauberes Dokument erhalten.
- Common: Google Slides Volltext: Das Anfordern von Folientext ohne Angabe einer Seite gibt nun den Text aller Folien der Präsentation zurück.
- Common: Intelligentere Web-Suche: Google-Suchergebnisse werden jetzt mit besserer Struktur extrahiert, wobei Titel, Snippets und Links nach den jüngsten Layout-Änderungen von Google zuverlässiger erfasst werden.
- Common: Kokoro Text-to-Speech auf allen Plattformen: Die Kokoro-Sprachoption erscheint nun auf iOS, macOS und Android – zuvor war sie in nativen Apps ausgeblendet.
- Common: Klarere Anzeige des Credit-Guthabens: Das Kontoguthaben für Prepaid- und BYOK-Setups zeigt nun Ihr tatsächliches Guthaben ohne verwirrende "Limit"-Formulierung an.
- Common: Hochwertigere PDF-zu-Word-Konvertierung: Der PDF→DOCX-Export nutzt jetzt eine dedizierte Document-Ansicht in Slate und erzeugt Word-Dateien, die Layout und Struktur des Quell-PDFs originalgetreuer bewahren.
- Web: Ruhigere Account- und Auth-Seiten: Google Analytics und das Cookie-Consent-Banner werden auf Account- und Auth-Seiten unterdrückt, um einen saubereren Anmelde-Flow zu ermöglichen.
Fehlerbehebungen
- Common: Settings-Suche navigierte nicht: Das Dropdown-Menü der Settings-Suche und Deep-Links sprangen bei mehreren Abschnitten (API Access, Private Sync, Backup & Restore, Voice und andere) nicht an die richtige Stelle – die Zielkategorie blieb eingeklappt, sodass nichts in den Sichtbereich scrollte.
- Common: OAuth-Prompts in Sub-Agents: Fehler behoben, bei dem OAuth-Autorisierungen und Upgrade-Aufforderungen lautlos verworfen wurden, wenn sie von einem Sub-Agent ausgelöst wurden, was Verbindungs-Flows mitten im Prozess unterbrach.
- Common: Ollama-Modell nach Onboarding nicht gespeichert: Fehler behoben, bei dem das während des Onboardings ausgewählte Ollama-Modell anschließend nicht dauerhaft gespeichert wurde.
- Common: UI-Chunks luden nicht während Rate Limiting: Fehler behoben, bei dem statische UI-Assets zusammen mit API-Anfragen ratenlimitiert wurden, was zu leeren Bildschirmen oder fehlenden Panels bis zum Refresh führte.
- Common: Metadaten von Composer-vorverarbeiteten Anhängen verloren: Fehler behoben, bei dem Anhang-Metadaten auf dem Server für Dokumente verloren gingen, die im Composer vorverarbeitet wurden, bevor sie an das Modell gesendet wurden.
- Common: "Free Time" zählte besuchte Termine als besetzt: Fehler in der Agenda-Freizeitberechnung behoben, der Sie während Terminen, an denen Sie nur teilgenommen haben, als besetzt markierte – nur Termine im eigenen Kalender werden jetzt gezählt.
- Common: Google-Suchergebnisse fehlerhaft: Fehler behoben, bei dem die Web-Suche leere Ergebnisse lieferte, nachdem Google das Layout der Suchseite geändert hatte.
- Desktop: Windows/Linux Login nicht synchron mit anderen Plattformen: Der Tauri-Desktop-Login-Flow wurde korrigiert, der von Chrome/macOS/iOS abwich – einschließlich fehlerhafter Stufenerkennung und der Unfähigkeit, sich nach dem Abmelden wieder anzumelden.
- Desktop: Public API blockierte die Desktop-UI: Fehler behoben, bei dem die eigene UI der Desktop-App durch die API-Authentifizierung blockiert wurde, wenn die Public API-Einstellung aktiviert war.
- Common: Google Docs OAuth-Fehler ausgeblendet: Fehler behoben, bei dem Google Docs-Operationen bei abgelaufener Authentifizierung lautlos fehlschlugen, anstatt einen klaren Fehler anzuzeigen.
- Common: Settings-Panel Absturz: Absturz des Settings-Panels beim Wiederherstellen eines bereitgestellten API-Keys behoben.
- Common: Google Drive Sync duplizierte Dokumente: Fehler behoben, bei dem Google Docs bei jedem Synchronisierungslauf dupliziert wurden, anstatt sie direkt zu aktualisieren.
- Common: Google Drive Sync Inline-Code verloren: Fehler behoben, bei dem die Formatierung von Inline-Code beim Synchronisieren von Dokumenten mit Google Docs verloren ging.
- Common: Gemini Thinking Extraktion: Fehler behoben, bei dem Thinking/Reasoning-Inhalte aus Gemini-Modellantworten nicht korrekt erfasst wurden.
- Common: Veraltete Daten bei Profilwechsel: Fehler behoben, bei dem beim Wechsel zwischen Profilen manchmal Konversationen des vorherigen Profils bis zu einem manuellen Refresh angezeigt wurden.
- Common: Task Scheduler "Method Not Found" Fehler: Fehler behoben, bei dem geplante Tasks in bestimmten Setups alle 60 Sekunden Fehler verursachten.
- Common: Zeilenumbrüche bei Texteinfügung in Google Docs: Fehler behoben, bei dem literale
bei Texteinfügungen anstelle von tatsächlichen Zeilenumbrüchen erschienen. - Common: Google Account Hint bei Tools: Fehler behoben, bei dem Google-Tools manchmal das falsche Google-Konto für API-Aufrufe verwendeten.
- Common: Settings- und Thread-Import Round-Trip: Fehler behoben, bei dem Settings- und Thread-Exporte nicht korrekt wieder importiert wurden.
- Common: Sub-Agent Token-Nutzung: Fehler behoben, bei dem die Token-Nutzung von Sub-Agents nicht in der übergeordneten Konversation gezählt wurde.
- Common: Messaging Bridge Antwort während Retry: Fehler behoben, bei dem Antworten der Messaging Bridge fehlschlugen, wenn der Assistant eine Antwort erneut versuchte.
- Common: Slate Redline Positionierung: Fehler behoben, bei dem Redline-Löschungen an der falschen Position landeten, wenn Markdown vorhanden war.
- Common: Browser-Verbindung übersteht Sleep/Wake: Fehler "No browser connected" nach dem Ruhezustand des Computers oder längerer Inaktivität behoben.
- Common: Geplante Tasks überstehen Service Worker Sleep: Fehler behoben, bei dem wiederkehrende Tasks nach langen Inaktivitätsphasen stoppten.
- macOS: Safari Google Suche Fehler: Fehler behoben, bei dem die Google-Suche in der Safari-Extension auf macOS nicht funktionierte.
- iOS: Mobile App Zugriff: Fehler behoben, bei dem die iOS-App fälschlicherweise einen kostenpflichtigen Plan erforderte – die mobile App ist jetzt für alle Nutzer verfügbar.
Version 0.9.715 (3. April 2026)
Neue Funktionen
- Common: Hub Delivery System: First-Party-Tool-Definitionen, Modus-Konfigurationen und der MCP-Katalog werden nun über den Cloud-Hub bereitgestellt, anstatt fest im Bundle kodiert zu sein. Dies beinhaltet lokales Caching und einen Offline-Fallback zur Vorbereitung auf den Community-Launch.
- Common: Single-Tab-Modus für Browser-Tools: Eine neue Browser-Tab-Richtlinie pro Modus verwendet einen einzigen Tab für die gesamte Navigation innerhalb einer Konversation wieder. Dies verhindert das Ansammeln von Tabs bei nachrichtenintensiven Workflows wie WhatsApp.
- Common: Binär-Uploads für API-Integrationen: Das api_integration Tool unterstützt jetzt Binärdatei-Uploads und direkte lokale Datei-Uploads über presigned URLs, anstatt Request-Bodys immer als JSON-Strings zu verarbeiten.
- Common: Anmeldedaten-Verwaltung via Tool: API-Anmeldedaten können nun programmatisch über das api_integration Tool gespeichert, aufgelistet und gelöscht werden – dies war zuvor nur über die Settings UI möglich.
- macOS: Auswahl des Audio-Eingabegeräts: Wählen Sie aus, welches Mikrofon für die Spracheingabe verwendet werden soll – listet alle verfügbaren Audiogeräte auf und speichert Ihre Auswahl dauerhaft.
- Android: OAuth-Wiederherstellung bei geringem Speicher: Android OAuth-Flows überstehen nun die Neuerstellung der Activity, wenn das System die App aufgrund von Speichermangel beendet, und stellen die Auth-Sitzung nahtlos wieder her.
- Common: 3-Layer Mobile CSS-Architektur: Neues Mobile-Responsive CSS-System mit Plattform-, Layout- und Komponenten-Layern, das eine konsistente UI über Phone-, Tablet- und Desktop-Viewports hinweg gewährleistet.
Verbesserungen
- Extension: Inkrementelles OAuth via Tab: Inkrementelle Scope-Anfragen öffnen nun einen vollständigen Browser-Tab anstelle eines Popups, was Hänger bei Konten behebt, die eine interaktive Zustimmung erfordern.
- Common: MCP Tool Schema-Qualität: Alle MCP-Tools bestehen nun einen Qualitäts-Lint-Test, der vollständige Schemas, korrekte Beschreibungen und konsistente Parameterdefinitionen verifiziert.
- Extension: Automatisches Schließen von Browser-Tabs bei Stopp: Vom Assistenten geöffnete Browser-Tabs werden nun geschlossen, wenn ein Run gestoppt wird; zudem werden OAuth Safari-Fenster unter macOS geschlossen.
- Android: Toolchain-Upgrade: Android-Build auf AGP 9.1, Kotlin 2.2.10 und Gradle 9.3.1 aktualisiert.
Fehlerbehebungen
- Common: Google Docs Tabellen-Positionierung: Fehler behoben, bei dem Mutationen an falschen Positionen landeten, wenn Tabellen dem Zieltext in Google Docs vorangestellt waren.
- Common: Entfernen von Page Content Footern: Fehler bei der Extraktion von Seiteninhalten behoben, bei dem Footer-Elemente fälschlicherweise von den erfassten Seiten entfernt wurden.
- Common: Web-Browsing Pagination: Fehler in der Pagination für Seite 2+ behoben, wenn kein explizites maxLength angegeben war.
- Common: Content Script Fallback: Fehler behoben, bei dem die Extraktion von Seiteninhalten lautlos fehlschlug; nun erfolgt ein Fallback auf executeScript, wenn das Content Script nicht verfügbar ist.
- Common: PDF-Rendering für über URL aufgenommene Dokumente: Fehler beim nativen PDF-Rendering für Dokumente behoben, die via URL aufgenommen wurden.
- Common: Gemini Tool Call Parsing: Fehler behoben, bei dem Keys in doppelten Anführungszeichen in LLM-Tool-Call-Argumenten zu Parsing-Fehlern bei Gemini-Modellen führten.
- Common: Amazon Nova Kompatibilität: Fehler behoben, bei dem tool_call-Nachrichten von Amazon Nova aufgrund leerer Textfelder abgelehnt wurden.
- Common: Agent Run terminiert nicht: Fehler behoben, bei dem Agent-Runs endRun im Service-Worker-Kontext nicht zuverlässig aufriefen, wodurch Browser-Tabs und Status nicht bereinigt wurden.
- macOS: Fortsetzen von Voice Audio: Fehler behoben, bei dem Voice Audio nach dem Ruhezustand der macOS-App oder dem Minimieren im Dock nicht fortgesetzt wurde.
- macOS: Screenshots erscheinen nicht: Fehler behoben, bei dem macOS-Screenshots aufgrund fehlerhafter Kontexterkennung nicht in der Assistenten-UI erschienen.
- macOS: Standortbestimmung funktioniert nicht: Fehler in Safari und der nativen macOS-App behoben durch Hinzufügen der CoreLocation-Bridge und Korrektur des IP-Fallbacks.
- macOS: Fehlende Location Entitlement: Fehlende Berechtigung für die Standortbestimmung korrigiert und Timeout für native Standortbestimmung erhöht.
- iOS: File Picker defekt: Fehler behoben, bei dem sich der File Picker in iOS WKWebView nicht öffnete, durch Hinzufügen des runOpenPanel-Delegates.
- Extension: OAuth Scope Over-Granting: include_granted_scopes aus Web-Popup und Post-Login OAuth-Pfaden entfernt, um unbeabsichtigte Scope-Ausweitung zu verhindern.
- Extension: OAuth Consent Screen übersprungen: Fehler behoben, bei dem die OAuth-Scope-Erhöhung den Consent Screen während inkrementeller Scope-Anfragen übersprang.
- Desktop: Konsolenfenster unter Windows sichtbar: Fehler behoben, bei dem das Konsolenfenster beim Starten des Tauri-Sidecars unter Windows erschien.
- Desktop: Windows Build defekt: Auflösung des node-Binärpfads korrigiert und node_modules für Windows Tauri-Builds geglättet.
- Server: Doppelte Webhook-Verarbeitung: Fehler behoben, bei dem Webhooks mehrfach verarbeitet wurden, wenn mehrere Clients verbunden waren.
- Server: Promotion-Codes bei Credit-Käufen: Promotion-Codes für Credit-Käufe im Stripe-Checkout deaktiviert.
Version 0.9.714 (29. März 2026)
Neue Funktionen
- Common: Überarbeitetes Onboarding: Der neue Onboarding-Bildschirm präsentiert 6 klare AI-Zugangspfade, was es neuen Benutzern erleichtert, ihre Optionen für die Verbindung mit AI-Providern zu verstehen.
- Common: PDF aus Markdown: Neu erstellte Dokumente können jetzt als PDF exportiert werden, wobei Markdown-Inhalte in ein formatiertes PDF-Ausgabeformat umgewandelt werden.
- Common: Einheitliches Google OAuth: Die Verbindung zum Google-Konto nutzt nun eine einzige verifizierte OAuth-App mit allen Scopes und ersetzt das bisherige Multi-App-Setup. Einfacherer Verbindungsfluss mit weniger Abfragen.
- Common: Save to Slate Meta-Parameter: Tools können Ergebnisse jetzt über den Parameter
_save_to_slatedirekt in ein Slate-Dokument ausgeben und so strukturierte Ergebnisse ohne Copy-Paste erfassen. - Common: Slate Anker-Links: Chat-Nachrichten mit Slate-Referenzen enthalten jetzt anklickbare Anker-Links, die zum relevanten Abschnitt innerhalb des Dokuments scrollen.
- Common: Sandbox Data Bridge: HTML-Artifact-Sandboxes können jetzt über eine postMessage-Bridge dynamisch auf Slate-Daten zugreifen, was Live-Dashboards und interaktive Visualisierungen ermöglicht.
- Common: Tier-Badges: Einstellungen, Tools und Automatisierungsfunktionen zeigen jetzt Tier-Badges an, die das erforderliche Zugriffslevel markieren und Benutzern mit erweitertem Zugriff Sichtbarkeit über Gating-Beschränkungen geben.
- macOS: Native Spracherkennung (WhisperKit): On-Device-Spracherkennung via WhisperKit und CoreML ersetzt browserbasiertes STT durch eine schnellere, private und native Implementierung.
- macOS: Sparkle Auto-Update: Produktionsreife automatische Updates für die macOS-App und die Safari-Erweiterung via Sparkle, mit Appcast-Feed und Delta-Updates.
- macOS: Nativer Tab-Kontext: AppleScript-basierte Extraktion des Tab-Kontexts ermöglicht der macOS-App die Erkennung der im Vordergrund befindlichen Browser-Tabs.
- macOS: Voice Hotkey Streaming: Der Voice-Hotkey zeigt nun während der Aufnahme ein Echtzeit-Streaming-Overlay mit automatischem Laden des WhisperKit-Modells an.
- Safari: Native Messaging: Die Safari-Erweiterung kommuniziert jetzt via Native Messaging statt HTTP-Polling mit der macOS-App, was die Reaktionsfähigkeit und Zuverlässigkeit verbessert.
- iOS/Android: Native Speicher-Dialoge: Der JSON-Export nutzt jetzt native Speicher-Dialoge (NSSavePanel auf macOS, SAF auf Android) anstelle von fehlerhaften Blob-Downloads.
- Web: Teams Landing Page: Neue /teams-Seite mit Team- und Enterprise-Messaging für potenzielle Kunden.
- Web: Blog-Bereich: Neuer Blog-Bereich auf der caiioo-Website.
- Web: Aktivierung der kostenlosen Testversion: Die Kontoseite unterstützt jetzt die Aktivierung der kostenlosen Testversion mit angepasstem Onboarding-Flow.
- Common: Unterstützung für geteilte Ablagen: Der Google Picker und alle Drive API-Aufrufe unterstützen jetzt geteilte Ablagen (Shared Drives), was den Zugriff auf teamübergreifende Dokumente ermöglicht.
Verbesserungen
- Common: Adaptives Greeting: Die adaptive Begrüßung greift nun benutzerdefinierte Willkommensnachrichten auf, anstatt sie zu ignorieren, und bewahrt so den personalisierten Ton des Benutzers.
- Common: OAuth Callback Bereinigung: OAuth-Callback-Tabs schließen sich jetzt automatisch mit einem Countdown-Timer, anstatt offen zu bleiben.
- Common: OAuth Anleitung: Wenn ein Tool eine Kontoverbindung benötigt, enthält die Fehlermeldung nun konkrete Hinweise dazu, welches Konto verbunden werden muss.
- Common: Drive Sync Force-Rewrite: Der Drive Sync-Workflow unterstützt jetzt eine Force-Rewrite-Option zur Neusynchronisierung aller Dateien.
- macOS: Einheitlicher Debug-Log-Viewer: Die Debug-Log-Ansicht aggregiert jetzt Server-, Swift- und UI-Logs in einem einzigen chronologischen Stream.
- macOS: Bucketed Settings Storage: Der Server-Storage-Adapter wurde auf eine Bucketed-Architektur umgestellt, inklusive robuster Migration, persistenter Marker, Multi-Profil-Atomizität und First-Writer-Wins-Konfliktlösung.
- macOS: Notarisierte Safari-Erweiterung: Die Safari-Erweiterung ist jetzt mit Developer ID signiert und verfügt über Notarisierungs-kompatible Entitlements, wodurch die Anforderung "Unsignierte Erweiterungen erlauben" für verteilte Builds entfällt.
- iOS: Standardmäßig Apple Reminders: iOS und macOS nutzen jetzt standardmäßig Apple Reminders und rufen diese automatisch in der Sync-Ansicht ab.
- Common: OAuth Scope Elevation: Inkrementelle Scope-Anfragen zeigen nicht mehr alle 22 Scopes an — nur die neu angeforderten Scopes werden eingeblendet, mit übersichtlicheren Eingabeaufforderungen zur Kontenauswahl.
- Common: Google Account Auto-Retry: Wenn ein Dokument einen 404-Fehler zurückgibt, werden automatisch andere verbundene Google-Konten geprüft, bevor ein Fehler angezeigt wird.
- Common: Settings Deep-Link Navigation: Alle Einstellungsbereiche sind jetzt ordnungsgemäß für die Suche und Deep-Link-Navigation registriert.
Fehlerbehebungen
- Common: Tool-Fehlleitung: Fehler behoben, bei dem Tools falsch geleitet wurden, wenn Modelle das Format
tool:action(mit Doppelpunkt getrennt) in ihren Antworten verwendeten. - Common: Tabellenzellen-Formatierung: Formatierungen und Links in Tabellenzellen bleiben nun erhalten; vererbte Listen-Nummerierungen, die zwischen Zellen auftraten, wurden bereinigt.
- Common: Slate Highlight Scroll: Das Scrollen zu Highlights im TipTap-Editor für Hintergrund-Tabs, den Vorschaumodus und native Ansichten wurde mittels zuverlässiger ProseMirror-basierter Positionierung korrigiert.
- Common: Code-Block Textsuche: Fallback zur Textsuche korrigiert, wenn das strukturelle Block-Mapping für Code-Blöcke in Slate-Dokumenten fehlschlägt.
- macOS: Einstellungsverlust bei Modus-Wechsel: Globale Einstellungen (API-Keys, Verbindungen) werden beim Modus-Wechsel auf macOS/iOS nicht mehr gelöscht — eine explizite Allowlist steuert nun, welche Einstellungen zurückgesetzt werden.
- macOS: Storage Purge Parität: Das vollständige Löschen des Speichers bereinigt nun konsistent alle Statusfelder, entsprechend dem Verhalten von chrome.storage.local.clear(). Profil-Löschungen und Bereinigungen werden ebenfalls korrekt über Buckets geleitet.
- macOS: Settings Concurrency: Lesezugriffe auf Einstellungen in applyModeDefaults fordern nun zuerst den Lock an, um Race Conditions zu vermeiden. Storage-Statistiken lesen aus Buckets statt aus veraltetem Flat-Cache.
- macOS: Migrations-Robustheit: Die Storage-Migration wird bei Fehlern wiederholt, nutzt persistente Abschluss-Marker und bereinigt automatisch veraltete Daten aus der Zeit vor der Migration.
- macOS: MCP Server Zombie-Prozesse: MCP-Server-Kindprozesse werden nun ordnungsgemäß beendet, wenn die macOS-App geschlossen wird.
- macOS: Kalender/Erinnerungen in Agenda: Fehler behoben, durch den Apple Kalender-Events und Erinnerungen nicht im Agenda-Modal angezeigt wurden.
- macOS: Google OAuth Flow: Google-Login-Fehler in macOS WKWebView behoben, indem OAuth über den Relay-Server-Web-Flow geleitet wird.
- macOS: Abmelde-Navigation: Fehler behoben, bei dem die Abmeldung auf macOS nicht zum Login-Bildschirm zurückführte.
- macOS: Remote Access Auth: 401-Fehler am set-remote-access Endpunkt durch Entfernen einer fehlerhaften Authentifizierungsanforderung behoben.
- Server: WhatsApp Antwort-Zustellung: Fehler behoben, bei dem WhatsApp-Antworten nicht an WhatsApp zurückgesendet wurden, sondern nur im PF-Chat-Thread verblieben.
- Server: WhatsApp Relay-Back Timeout: WhatsApp Relay-Back Timeout von 120s auf 10 Minuten verlängert und Fehlerbehandlung bei Generierungsfehlern korrigiert.
- Server: Private Sync Reauth: Re-Authentifizierungs-Flow für Private Sync, serverseitiger OAuth-Guard und Abmelde-Bereinigung auf macOS korrigiert.
- Server: Local Folder Sync Auth: 401-Authentifizierungsfehler bei Synchronisationsvorgängen für lokale/Netzwerk-Ordner behoben.
- Server: Google Session Re-Auth: Der Unlock-Dialog löst nun bei Ablauf der Google-Sitzung eine Re-Authentifizierung aus, anstatt einen Sackgassen-Fehler anzuzeigen.
- Safari: Erweiterungs-Signierung: Fehler behoben, bei dem die Safari-Erweiterung als unsigniert angezeigt wurde; Nutzung von Release-Entitlements ohne
get-task-allowfür Developer ID signierte Builds. - Common: OAuth Account Mismatch: Fehler behoben, bei dem OAuth fehlerhafte Verbindungen erzeugte; es werden nun korrekt neue Verbindungen erstellt, statt bestehende mit anderen Konten zu überschreiben.
- Common: OAuth Scope Inflation: Fehler behoben, bei dem fehlerhafte Verbindungen die Scopes des ursprünglichen Kontos erbten, was zu unbeabsichtigten Scope-Überberechtigungen führte.
- Common: Thread-Listen-Löschung: Fehler bei STATE_UPDATE Timeout/Retry behoben, der einen falschen Feldnamen verwendete und die Thread-Liste löschen konnte.
- Common: Tier-Badge Genauigkeit: Fehler behoben, bei dem Tier-Badges fälschlicherweise "Tester" bei Free-Tier-Funktionen anzeigten.
- Common: Settings Panel Overflow: Flex-Overflow in den Kartenzeilen des Einstellungs-Panels behoben, der Layout-Probleme verursachte.
- Server: Private Sync API Key Verlust: Fehler behoben, bei dem Private Sync API-Keys während der Synchronisation zwischen Geräten verlor.
- Server: Messaging Bridge: Archivierte Chats, Stop-Button und Modus-Auswahl in der Messaging Bridge korrigiert.
- macOS: Verlust von Custom Mode Einstellungen: Fehler behoben, bei dem Einstellungen für benutzerdefinierte Modi auf macOS/iOS aufgrund eines No-Op-Speicherpfads stillschweigend verloren gingen.
- macOS: OpenRouter Header blockiert: Fehler behoben, bei dem Relay-CORS die OpenRouter-Attributions-Header auf macOS/iOS blockierte.
- macOS: Tab-Kontext-Wechsel: Fehler behoben, bei dem der Tab-Kontext beim Wechsel zwischen Browser-Tabs nicht aktualisiert wurde.
Version 0.9.713 (28. März 2026)
Neue Funktionen
- Common: Sub-Agents: Vollständiges Sub-Agent-System mit persistenten benannten Agenten, Konversationsverlauf, paralleler Ausführung (Committee-Muster), sequenziellen und Interjektions-Modi, Abbruch-Kaskade und dediziertem UI-Rendering mit chronologischem Status-Tracking.
- Common: MCP Tool Approval: Registrierte MCP-Tools erscheinen nun im Tool-Genehmigungssystem, was Benutzern Sichtbarkeit und Kontrolle darüber gibt, welche MCP-Tools von Agenten aufgerufen werden können.
- macOS: Sidepanel Push Mode: Das Sidepanel unterstützt jetzt neben dem Overlay auch den Push-Modus, mit einer Standardbreite von 425px und persistenter angedockter Breite über Sitzungen hinweg.
- Server: WhatsApp Rich Messages: Die WhatsApp-Verbindung unterstützt jetzt neben Text und Medien auch Standortfreigabe, Kontakte, Reaktionen und Sticker-Nachrichten.
- Server: API Key Encryption at Rest: Im Relay-D1-Speicher hinterlegte API-Keys werden nun im Ruhezustand verschlüsselt. Serverseitige OAuth-Keys werden nach der lokalen Speicherung gelöscht.
Verbesserungen
- Common: Model Alias Display: Argumente von Sub-Agent-Tool-Aufrufen zeigen nun annotierte Modell-Aliase zur einfacheren Identifizierung an.
- Common: BYOA Connection Priority: OAuth-Anfragen mit erweitertem Umfang bevorzugen nun BYOA-Alternativverbindungen gegenüber Basisverbindungen, was unnötige Re-Authentifizierungsaufforderungen reduziert.
- Common: Thought Signature Preservation: Thought/Reasoning-Signaturen werden nun sowohl für die OpenAI Responses API als auch für Gemini Multi-Turn-Tool-Calling-Flows korrekt beibehalten.
- macOS: Debug Log Propagation: Der Schalter für das Debug-Logging wird nun an den Node.js-Server-Subprozess weitergegeben.
- Common: Bengali Language Support: Plattform und Website unterstützen jetzt Bengalen, zusätzlich wurden der Marken-Haftungsausschluss und die Medienbeiträge auf der Website aktualisiert.
Fehlerbehebungen
- Common: Safari/WKWebView Streaming: Polyfill für die asynchrone Iteration von ReadableStream für kokoro-js implementiert, wodurch TTS-Streaming-Fehler in Safari und WKWebView behoben wurden.
- Common: Custom Mode Creation: Fehler in einem veralteten React-Closure behoben, der dazu führte, dass die Erstellung benutzerdefinierter Modi beim ersten Versuch fehlschlug.
- macOS: Agent Storage Mutations Lost: Speicheränderungen im Agent-Subprozess (Modus-Erstellung, Einstellungen, Skills) gingen unter macOS aufgrund einer fehlenden Persistenz-Bridge lautlos verloren.
- macOS: Clipboard Copy: Fehler behoben, bei dem das Kopieren in die Zwischenablage in macOS WKWebView lautlos fehlschlug.
- macOS: WASM/WebGPU in WKWebView: WASM-Backend für TTS/STT und lokale ONNX-Pfade in der nativen macOS-App erzwungen — CDN-Cross-Origin-Importe und WebGPU-JSEP-Modul-Importe schlagen in localhost WKWebView fehl.
- macOS: Transport Request Collisions: requestId-Kollision behoben, die die Tool-Genehmigung unter macOS unterbrach, sowie verbesserte MCP-Anzeigenamen.
- macOS: WhatsApp Auto-Reply: End-to-End-Verkabelung für WhatsApp-Auto-Reply auf dem macOS-Relay-Server korrigiert, einschließlich Thread-Sichtbarkeit.
- iOS: Voice Dictation Stuck: Fehler behoben, bei dem die Sprachdiktat-Funktion im Aufnahmezustand hängen blieb, wenn das stopRecording-Cleanup umgangen wurde.
- Safari: Browser Commands Timeout: Zeitüberschreitungen bei Safari-Browserbefehlen aufgrund hängender WebExtension-APIs nach der Suspendierung des Service Workers behoben.
- Safari: Heartbeat Stale Check: Der Heartbeat-Stale-Check für Safari-HTTP-Polling-Browser wird übersprungen, um fälschliche Verbindungsabbrüche zu verhindern.
- Server: Private Relay Stability: Probleme mit Durable Object Hibernation, Idle-Timeout (1006), Reconnect-Verzögerungen, veralteter Socket-Handhabung und Zombie-readyState behoben. Split-Brain zwischen serverState und ctx.state eliminiert.
- Server: Webhook Broadcast: Webhooks senden nun nach dem Aufwachen aus der DO-Hibernation an alle Server-Sockets, um den Zombie-readyState zu umgehen.
- Server: MV3 Messaging Race: Race-Condition in der Lazy-Init-Messaging-Bridge bei Webhook-Eingang behoben, um Abstürze des MV3-Service-Workers zu verhindern.
- Server: Webhook Verify CORS: Webhook-Verifizierungstest über den Server geroutet, um CORS-Ablehnungen im Browser zu vermeiden.
- Extension: Logout Cleanup: Die Abmeldung löscht nun korrekt die lokale Relay-Server-Sitzung auf macOS, indem der localhost-Kontext erkannt wird.
- Common: Security — Thread Isolation: Status-Broadcasts filtern Threads nun nach dem aktuellen Profil, um Datenlecks zwischen Profilen zu verhindern.
Version 0.9.712 (26. März 2026)
Neue Funktionen
- Common: WhatsApp-Verbindungsdiagnose: Der Verbindungstest für WhatsApp prüft nun zusätzlich zum API-Token auch den Webhook-Abonnementstatus und die Gültigkeit des App-Secrets, um lautlose Zustellungsfehler von Meta abzufangen.
- macOS: Nativer OAuth-Flow: Die macOS-App nutzt nun ASWebAuthenticationSession für OAuth anstelle von Browser-Weiterleitungen, inklusive automatischem Upgrade veralteter Verbindungen ohne Refresh-Token.
Verbesserungen
- Common: Robustheit bei DOCX Suchen/Ersetzen: Suchen und Ersetzen in DOCX-Dokumenten verarbeitet nun doppelte Leerzeichen, geschützte Leerzeichen, typografische Anführungszeichen, numerische Entitäten und Groß-/Kleinschreibungsfehler. Enthält einen Fallback für die ignorierte Groß-/Kleinschreibung, wenn eine exakte Übereinstimmung fehlschlägt, sowie Warnungen, wenn mehrere Instanzen ersetzt werden.
- Common: DOCX-Listen-Nummerierung: Der DOCX-Export generiert nun eine korrekte Word-Listen-Nummerierung (w:numPr) anstelle von literalen Aufzählungszeichen, sodass Word nummerierte und Aufzählungslisten korrekt erkennt.
- Common: Agent-Startperformance: Verzögerungen beim Agent-Start von 30-50s wurden eliminiert, die durch Ghost-MCP-Server, HTTP-Readiness-Timeouts und redundante Modell-Abrufe verursacht wurden. Der Modell-Cache wird nun an Agent-Subprozesse übergeben.
- Server: Sicherheits-Härtung: Fix für Command-Injection im URL-Handler, zeitsichere Token-Vergleiche, Content-Security-Policy-Header auf dem Relay-Server, Rate-Limiting am Session-Endpunkt, CORS-Beschränkung auf bekannte Origins und parallele E2E-Broadcast-Verschlüsselung.
- Server: Webhook-Signatur-Verifizierung: Webhook-Payloads verwenden nun den Base64-kodierten Raw-Body, um JSON-Roundtrip-Korruption zu verhindern, die HMAC-Signaturen ungültig machte.
- Server: OAuth-Token-Persistenz: Fehlerbehebung für den Split-Brain-Zustand zwischen Server-Statusobjekten, der dazu führte, dass OAuth-Verbindungen (Google Drive etc.) nach einem App-Neustart verloren gingen.
- macOS: Performance & Stabilität: Menügesteuertes Tray-Polling (zuvor bedingungsloser 3s-Timer), entprellte Speicherung des Fensterstatus, nicht-blockierendes Logging, WKWebView-Crash-Recovery mit exponentiellem Backoff und Behebung von Memory-Leaks bei Script-Message-Handlern.
- macOS: Zentralisiertes Logging: Relay-Server-Ausgaben und App-Lifecycle-Events werden nun unter
~/Library/Logs/caiioo/mit automatischer 10MB-Rotation protokolliert, was lautlos verworfene Ausgaben ersetzt.
Fehlerbehebungen
- Common: Dateiauswahl-Anweisungen: Das
pick_files-Tool gibt nun klare Anweisungen für den Benutzer zurück, anstatt eines toten UI-Aktionssignals, das lautlos fehlschlug. - Server: Active-Tab-Poll-Spam: Das Polling des aktiven Tabs im Relay-Modus erzeugt keine endlosen Timeout-Fehler mehr, wenn keine Browser-Erweiterung verbunden ist. Verwendet nun exponentiellen Backoff (30s bis 5min) bei aufeinanderfolgenden Fehlern.
- Server: CORS für native App: Behebung der Blockierung der 127.0.0.1-Origin durch die CORS-Whitelist, die Google OAuth über die WKWebView der nativen macOS-App verhinderte.
- Server: Verwaiste Agent-Prozesse: Agent-Subprozesse werden nun beim Herunterfahren des Servers und bei nicht abgefangenen Ausnahmen ordnungsgemäß bereinigt.
- macOS: Browser-Orchestrator Log-Spam: Warnungen bezüglich "Unhandled message type" für Browser-Protokollnachrichten in Erweiterungsverbindungen wurden behoben.
Version 0.9.711 (24. März 2026)
Neue Funktionen
- Common: Auto-Save für Einstellungen: Einstellungsfelder werden nun während der Bearbeitung dauerhaft gespeichert, mit einem 500ms Debounce für Textfelder und sofortiger Speicherung für Toggles/Selects, um Datenverlust bei Abstürzen oder Navigation zu verhindern.
Verbesserungen
- Common: Erhalt der DOCX-Nummerierung: Tabulatorzeichen in nummerierten DOCX-Abschnitten (z. B. Rechtsdokumente mit „3.2.3 → Überschrift“) bleiben nun über den gesamten Bearbeitungszyklus erhalten, anstatt stillschweigend entfernt zu werden.
- Common: Intelligentere Tool-Auswahl: Die dynamische Tool-Auswahl verarbeitet nun auch Sachanfragen (Öffnungszeiten, Preise, Adressen), die eine Web-Verifizierung erfordern, anstatt nur auf strikte Trigger-Wörter zu reagieren.
- Common: Sprachänderungen durch Agenten: Vom Agenten initiierte Sprachänderungen werden nun sofort angewendet, ohne dass ein manuelles Umschalten in den Einstellungen erforderlich ist.
- Common: Multi-Account OAuth Fallback: Wenn dem primären Google-Konto erforderliche Scopes fehlen, werden verbundene Sekundärkonten geprüft, bevor eine erneute Authentifizierung angefordert wird. Behebt nicht abgefangene Fehler, wenn Tokens von Sekundärkonten ablaufen.
- Server: Validierung der Modus-Einstellungen: Der Server validiert nun die Tier-Berechtigungen beim Speichern von Einstellungen, um zu verhindern, dass Nutzer im Free-Tier Einstellungen des Pro-Tiers dauerhaft speichern.
- Common: Sicherheits-Härtung: DOMPurify-Sanitisierung bei der Reasoning-Vorschau-Ausgabe, eingeschränktes CORS auf bekannte Origins, HTTPS-first IP-Geolocations-Abfrage und verschärfte web_accessible_resources.
Fehlerbehebungen
- Common: Google-Suchergebnis-URLs: Die Browser-Suche über Google liefert nun strukturierte Links mit tatsächlichen URLs zurück. Zuvor benötigte der Agent 5 Tool-Aufrufe, um URLs zu extrahieren, da AgentMarkdown Link-Hrefs aus dem komplexen verschachtelten HTML von Google verlor — jetzt werden Links direkt aus dem DOM extrahiert und in das erste Suchergebnis aufgenommen.
- Common: Endlosschleife bei Private Sync: Ein Synchronisationsfehler wurde behoben, bei dem Schreibvorgänge in Manifest-Backup-Dateien kontinuierlich eine erneute Synchronisation auslösten. Leere Einstellungsobjekte werden nun korrekt über alle Geräte hinweg propagiert.
- Common: Messaging Bridge Updates: Eingehende Nachrichten, Antworten des Agenten und Relay-Back-Antworten werden nun sofort an die UI übertragen, anstatt erst nach Abschluss der Antwort des Agenten zu erscheinen.
- Extension: Private Relay Reconnect: Es wurde behoben, dass das Relay nach einem Neustart des MV3 Service Workers getrennt blieb, indem auf den gespeicherten Aktivierungsstatus zurückgegriffen wird. Zudem wurde eine Race Condition beim Selbstaustausch während enable() und beim Reconnect nach Identitätswechsel behoben.
- Extension: Private Relay Race Conditions: Absicherung von Race Conditions beim Aktivieren/Deaktivieren, Hinzufügen von Guards für unhandled rejections bei Messaging Bridge Callbacks und Behebung eines Timer-Leaks beim Schließen des Einstellungs-Panels.
Version 0.9.710 (22. März 2026)
Neue Funktionen
- Common: Zero-Day Risk (ZDR) Enforcement: Live-ZDR-Datensynchronisierung mit einem Enforcement-Toggle für OpenRouter — zeigen Sie Aufschlüsselungen der Provider-Anzahl an und blockieren Sie Modelle, die mit Zero-Day-Risiken markiert sind.
- Common: Tool Call Healing: Schwache Modelle, die XML-Tool-Calls innerhalb von Reasoning-Blöcken ausgeben, werden nun automatisch erkannt und korrigiert, was die Zuverlässigkeit bei Nicht-Frontier-Modellen verbessert.
- Common: Unified Token Lifecycle: Symmetrischer OAuth-Token-Refresh über alle Plattformen hinweg (Extension, Server, macOS, iOS) via eines vereinheitlichten TokenLifecycleManager, mit proaktivem Refresh vor Ablauf.
- iOS: Composer Icon Scaling: Composer-Aktions-Icons skalieren auf iOS jetzt um das 1,18-fache für bessere Tippziele, mit einer dedizierten
native-iosBody-Klasse für plattformspezifisches Styling.
Verbesserungen
- Common: Slate Proposed Changes: Die Navigation zwischen vorgeschlagenen Änderungen, Hover-basiertes Akzeptieren/Ablehnen und Counter-Updates funktionieren jetzt korrekt im Slate-Editor.
- Common: Slate Selector Dropdown: Der Slate-Typ-Selektor verwendet nun ein Inline-Dropdown anstelle eines portalierten Popovers, was Z-Index- und Positionierungsprobleme behebt.
- Common: Propose Change Full Replacement:
propose_changeerlaubt nun den vollständigen Dokumentenaustausch bei kleinen Dokumenten (500 Zeichen oder weniger), anstatt Teilbearbeitungen zu erfordern. - Common: Voice Send Waits for Transcription: Das Drücken von Senden/Enter während der Aufnahme wartet nun auf den Abschluss der Transkription vor dem Absenden, um leere oder unvollständige Nachrichten zu verhindern.
- Common: Private Sync Setup Flow: Der Passphrasen-Dialog wird nun nach OAuth während des Private Sync Setups automatisch angezeigt, was den Onboarding-Flow optimiert.
- Common: BYOA Registry Refresh: Die BYOA-Provider-Registry wird nun neu initialisiert, nachdem Private Sync neue Zugangsdaten heruntergeladen hat, um sicherzustellen, dass importierte Verbindungen sofort nutzbar sind.
- Common: Terminology Consistency: "Cloud Sync" wurde in den Inhalten des Benutzerhandbuchs in "Private Sync" umbenannt, inklusive eines Terminology-Guard-Tests, um Regressionen zu verhindern.
- Server: Private Relay Stability: Kompatibilitätsdatum aktualisiert, Durable Object Crash-Handling verbessert und MV3-Reconnect-Logik für zuverlässige, langlebige Verbindungen gehärtet.
- Server: Private Sync Settings Excluded: Private Relay-Einstellungen sind nicht mehr in Cloud-Sync-Payloads enthalten, um geräteübergreifende Relay-Konfigurationskonflikte zu vermeiden.
Fehlerbehebungen
- Common: SVG Image Handling: SVG-Dateien werden nicht mehr als
image_urlan Provider gesendet, was bei Modellen, die das SVG-Format nicht unterstützen, zu HTTP 400-Fehlern führte. - Common: Private Sync Race Conditions: Fehler bei der Nachrichtenweiterleitung behoben, die durch Race Conditions während der Private Sync Initialisierung verursacht wurden. Sync-Loop und Quarantäne-Logik gehärtet.
- Common: Private Sync Data Deletion: Löschung von Cloud-Daten und Audit funktionieren nun korrekt nach der Deaktivierung von Private Sync.
- Common: Model Matching Contamination: Fehler beim familienübergreifenden Model-Matching im Auto-Adjust-System behoben, der Modelle fälschlicherweise über Provider-Familien hinweg zuordnen konnte.
- Common: Dynamic Tool Selector: Der Prompt des dynamischen Tool-Selektors wurde gehärtet, um Agent-ähnliches Reasoning zu verhindern, das zu Fehlern bei der Tool-Auswahl führen konnte.
- Common: Validation Error Messages: Die Validierung von Pflichtfeldern gibt nun fokussierte Fehlermeldungen anstelle von generischen Fehlern zurück.
- Extension: Private Relay WebSocket Drops: WebSocket-Verbindungen brachen nach ca. 60 Sekunden aufgrund der MV3-Service-Worker-Suspendierung ab. Keepalive- und Reconnect-Logik verbessert.
- Extension: Google OAuth Incremental Scopes: OAuth-Scope-Erweiterung mittels
launchWebAuthFlowim Extension-Kontext korrigiert, anstatt lautlos fehlzuschlagen. - Extension: Relay Toggle Settings Reload: Unnötiges Neuladen der Einstellungen beim Umschalten des Relays unterdrückt, um UI-Flackern und Diagnose-Rauschen zu vermeiden.
- Server: Durable Object Hibernation: WebSocket-Close-Handling nach Durable Object Hibernation korrigiert, das Verbindungen in einem veralteten Zustand hinterlassen konnte.
- Server: Messaging Credential Persistence: Messaging-Zugangsdaten bleiben nun sofort bei Änderung bestehen, anstatt auf den nächsten Speicherzyklus zu warten.
- iOS: Stale WebSocket Callbacks: WebSocket-Handler werden nun beim Schließen gelöscht, um zu verhindern, dass veraltete Callbacks nach einer Rekonnektion auf iOS ausgelöst werden.
- Desktop: NSIS Installer Upload: Der Windows NSIS-Installer wird nun korrekt via API in Draft-Releases hochgeladen.
Version 0.9.709 (21. März 2026)
Neue Funktionen
- Common: Slack Messaging Adapter: Neuer Slack Events API Adapter für die Messaging-Bridge mit Bot-Signaturverifizierung, Unterstützung für Medien-Downloads und Konfiguration der Benutzeroberfläche in den Einstellungen.
- Common: Slate File Roundtrip: Lokale Dateien können jetzt direkt in Slate geöffnet und gespeichert werden, inklusive Persistenz der Dateisystem-Handles und Hash-basiertem Dirty-Tracking. Die neue Schaltfläche „Datei laden“ im Slate-Auswahldialog verarbeitet Dokumente vor und öffnet sie mit dem korrekten Editor.
- Common: Slate Dateimenü-Restrukturierung: Das Dateityp-Menü wurde in die Kategorien Dokumente, Renderbar (HTML/Vega/Mermaid) sowie Code & Daten umstrukturiert, inklusive automatischer Erkennung bei Umbenennung.
- Common: Remote Browser App: Remote-Browser-Clients können nun Sidepanel-Assets über das Private Relay abrufen, was einen browserbasierten Zugriff ohne installierte Extension ermöglicht.
- Common: Geräteidentität im Private Relay: Relay-Clients zeigen nun einen menschenlesbaren Gerätenamen an. Wenn ein Gerät durch ein anderes verdrängt wird, zeigt die Benutzeroberfläche an, welches Gerät den Platz eingenommen hat.
- Common: Redesign des Composer Mic Chips: Die Mikrofon-Schaltfläche wurde als sichtbarer Chip/Pill neu gestaltet, mit einer klaren Anzeige des Aufnahmestatus, 44px Mindest-Touch-Zielen für Mobilgeräte und einem Voice-Overlay, das über dem Eingabebereich gerendert wird.
- Common: Link zum Benutzerhandbuch: Das Benutzerhandbuch ist nun im Einstellungsbereich Dokumentation & Rechtliches verlinkt.
- iOS: BYOA Setup Gate: Der BYOA-Assistent auf Mobilgeräten zeigt nun eine Meldung an, die Benutzer anweist, Private Apps auf dem Desktop einzurichten, da der 8-stufige Browser-Flow auf Mobilgeräten nicht praktikabel ist.
- Server: Login Challenge: E-Mail-basierte 6-stellige MFA-Verifizierung für den Login, mit Consent-Tracking und Sitzungswiderruf.
Verbesserungen
- Common: Private Sync Settings-First: Einstellungen werden nun vor den Konversationen synchronisiert. Dies stellt sicher, dass Tokens und Konfigurationen sofort verfügbar sind, während die Massensynchronisation der Threads im Hintergrund fortgesetzt wird.
- Common: WebSocket Request Korrelation: WebSocket- und Private Relay-Transporte warten nun ordnungsgemäß auf Serverantworten, anstatt sofort aufzulösen. Dies behebt über 40 UI-Operationen im macOS Sidepanel und bei Relay-Clients (Drive-Audit, Ollama-Test, MCP-Operationen usw.).
- Server: Webhook-Signaturverifizierung: Die Verifizierung der Webhook-Signatur wurde auf die Route-Ebene des App-Secrets verschoben, um eine sauberere Architektur zu gewährleisten.
Fehlerbehebungen
- Common: WhatsApp Antwort-Zustellung: Fehler behoben, bei dem Agenten-Antworten lautlos verschluckt wurden, anstatt an WhatsApp zurückgesendet zu werden. Der Messaging-Relay-Back-Pfad protokolliert nun Diagnosedaten bei Zustellungsfehlern, wodurch zukünftige Probleme sofort diagnostizierbar sind.
- Common: Thinking Block Signaturen über Modelle hinweg: Fehler „Ungültige Signatur im Thinking Block“ beim Wechsel von einem Nicht-Claude-Modell zu Claude mit Thinking-Modus behoben. Die Erkennung des Reasoning-Formats ist nun standardmäßig auf „unknown“ eingestellt, anstatt fälschlicherweise als Anthropic-Format identifiziert zu werden.
- Common: Slate-Editierbarkeit für neue Dokumente: Neue DOCX-, PDF-, RTF- und XLSX-Slates werden nun korrekt in ihren Editoren geöffnet, anstatt als statisches HTML gerendert zu werden.
- Common: Slate Export Fallback: Neue Dokumente ohne ursprüngliche Binärdaten werden nun ordnungsgemäß exportiert — XLSX fällt auf CSV zurück, RTF auf HTML-Konvertierung, PDF auf Browser-Druck.
- Common: Sandbox Preview Rendering: Leere HTML- und Vega-Vorschauen behoben, die durch eine Diskrepanz des Sandbox-Origin beim postMessage-Targeting verursacht wurden.
- Common: Track Changes Spalten-Offsets: Löschungen in den Änderungsnachverfolgungen ordnen nun HTML-zu-Text-Offsets korrekt zu, was falsch positionierte Änderungen in TipTap behebt.
- Common: Private Sync Auth Recovery: Abgelaufene oder widerrufene OAuth-Tokens während der Synchronisation lösen nun automatisch eine Re-Autorisierung aus, anstatt eine manuelle Neuverbindung zu erfordern.
- Common: Voice Streaming Entwurfs-Indikator: Das Voice-Transkript-Overlay zeigt nun den Status „Vorschau“ mit reduzierter Deckkraft an, um zu signalisieren, dass der Text vorläufig ist, bis die Aufnahme stoppt.
- Common: MCP Tools auf nativen Plattformen: Lokale MCP-Server-Tools werden nun ordnungsgemäß auf macOS, Windows und Linux registriert — zuvor startete der Handler den MCP-Prozess, rief jedoch dessen Tools nie ab oder registrierte sie.
- Common: Slate Context Chip Update: Der Kontext-Chip des aktiven Tabs wird nun aus dem Speicher aktualisiert, wenn sich der Titel eines Slate-Tabs nach dem Laden von Drive oder GitHub ändert. Der Texteingabebereich für Titel im Dark Mode ist nicht mehr unlesbar.
- Extension: Chrome Stub Polyfill: Chrome-Browser-Tabs auf localhost mit
window.chrome, aber ohne Extension-APIs, erhalten nun eine ordnungsgemäße Stub-Injektion, anstatt übersprungen zu werden. - Extension: Relay Client Bundle Crash:
import.meta.env-Absturz im Relay-Client IIFE-Bundle durch Definition von Build-Zeit-Umgebungsvariablen behoben. - Extension: Remote App Login: Der Login der Remote-Browser-App wurde bereinigt, mit Google OAuth als primärer Methode und E-Mail/Passwort als eingeklappte sekundäre Option.
Version 0.9.708 (19. März 2026)
Verbesserungen
- Common: Koordination der Generierungsanzeige: Die Typing-Dots pro Nachricht werden nun mit dem Fallback-Indikator auf Thread-Ebene koordiniert, wodurch doppelte hüpfende Punkte während der Generierung vermieden werden. Die Punkte bleiben nun während der Reasoning- und Tool-Ausführungsphasen sichtbar und werden erst ausgeblendet, sobald die finale Antwort zu streamen beginnt.
- Common: Streaming-Cursor: Ein blinkender Cursor erscheint nun am Ende des gestreamten Textes und bietet einen klaren visuellen Hinweis darauf, dass die Antwort noch generiert wird.
- Common: Formatierung der Reasoning-Vorschau: Eingeklappte Reasoning-Blöcke rendern nun Inline-Fett- und Kursivformatierungen anstelle von roher Markdown-Syntax.
- Common: Slate-Dokumentenauflistung:
list_slateszeigt nun korrekt die Inhaltsgröße für DOCX-, PDF- und XLSX-Dateien an, die über leichtgewichtige Thread-Abfragen geladen wurden. Die Auflistungen enthalten zudem Workflow-Anleitungen für die Bearbeitung von DOCX- und XLSX-Dokumenten. - Common: Bereich für Private Sync-Einstellungen: Die Private Sync-Einstellungen befinden sich nun in einem eigenen, dedizierten Bereich für eine klarere Organisation, getrennt von den allgemeinen Einstellungen.
- Extension: Restrukturierung der Verbindungs-Einstellungen: Der Bereich Private Relay wurde in zwei klare Unterabschnitte gegliedert — Private Relay (Remote-Zugriff-Umschalter, immer sichtbar) und Caiioo Bridge (lokale MCP-Server und System-Tools). Der Remote-Zugriff-Umschalter erfordert nicht mehr, dass die Bridge ausgeführt wird.
- Desktop: Tauri Unified Binary: Die Windows/Linux Desktop-App wurde von Compile-Zeit-Varianten in ein einziges Binary mit Runtime-Tier-Gating konsolidiert — die Sichtbarkeit des Sidepanels wird zur Laufzeit durch die Abonnementstufe bestimmt.
Fehlerbehebungen
- Extension: Private Relay ohne Bridge: Private Relay verbindet sich nun unabhängig ohne die Caiioo Bridge-App. Zuvor wurde die Authentifizierung nur durch die Bridge-Verbindung initialisiert, wodurch reine Extension-Nutzer (einschließlich Linux/Windows) keine Messaging-Webhooks empfangen oder den Remote-Zugriff nutzen konnten.
- Extension: Google OAuth-Routing: OAuth-Popup-Fehler in Chrome wurden behoben, indem
getAuthTokenübersprungen wird, wenn es nicht verfügbar ist, und auf BYOA-Anmeldedaten zurückgegriffen wird. Die COOP-Popup-Resilienz verhindert leere Fenster auf restriktiven Websites. - Common: ElevenLabs Streaming STT: Fehler behoben, bei dem die Sprachtranskription abbrach oder fehlschlug, wenn beim ElevenLabs-Streaming Verbindungsunterbrechungen auftraten. Die Spracheingabe der nativen App nutzt nun einen ordnungsgemäßen Fallback.
- iOS: Externe Links in WKWebView: Links, die in Safari geöffnet werden sollten, öffnen sich nun korrekt extern, anstatt innerhalb der WebView der App geladen zu werden.
- Common: Verwaiste Ad-Blocker-Regeln: Dynamische DNR-Ad-Blocking-Regeln bleiben nach Neustarts des Service Workers nicht mehr bestehen.
disableAllBlockingfragt verwaiste Regeln nun direkt ab und entfernt sie, selbst wenn die Blocker-Instanz null ist. - Common: Lizenz-Synchronisierung bei Profilwechsel: Beim Wechseln von Profilen wird die Lizenz nun vom Server synchronisiert, um sicherzustellen, dass Tier-gated Tools sofort aktualisiert werden, anstatt einen Neustart zu erfordern.
- Common: Token-Refresh vor dem Provisioning: Abgelaufene OAuth-Tokens werden nun vor dem Provisioning von API-Keys aktualisiert, um Silent Failures zu verhindern. Neue Server können nun bestehende Identitätsverbindungen übernehmen.
- Web: Mobiles Menü in iOS Safari: Das Hamburger-Menü auf der Marketing-Website ist in iOS Safari nicht mehr transparent.
- Common: React-18 Batching Race: Ein Generierungsindikator auf Thread-Ebene wurde als Fallback für Fälle hinzugefügt, in denen das React-18 State-Batching das Erscheinen der Typing-Dots pro Nachricht verhinderte.
Version 0.9.707 (17. März 2026)
Verbesserungen
Vorausfüllung bei BYOA-Rekonfiguration: Bei der Neukonfiguration einer bestehenden Google oder Microsoft Private App werden Client-Secret und Tenant-ID nun vorausgefüllt, sodass diese nicht erneut eingegeben werden müssen.
Sortierung der Modellliste: Modelle innerhalb jeder Anbietergruppe werden nun nach Veröffentlichungsdatum sortiert (neueste zuerst), um eine konsistente Reihenfolge über alle Plattformen hinweg zu gewährleisten.
Fehlerbehebungen
Wiederherstellung der Private Sync-Authentifizierung: OAuth-Token-Fehler (abgelaufene Sitzungen, entzogene Tokens, Chrome-Profil-Tokens) während der Initialisierung der privaten Synchronisierung werden nun korrekt in der UI angezeigt, anstatt lautlos in einen Fehlerzustand überzugehen.
Zuverlässigkeit von Slate-Änderungsverfolgung: 10 vertrauenskritische Korrekturen für nachverfolgte Änderungen – Race Condition beim Zusammenführen von Revisionen, Persistenz der Diff-Basis über alle Aktualisierungspfade, Erhalt der Formatierung beim DOCX-Export, Entfernen von HTML-Tags für TipTap-Abgleiche, Reihenfolge beim Akzeptieren/Ablehnen aller Änderungen sowie Konvergenzkorrekturen für Entity-Escaping und Tag-Regex-Matching.
Slate-Datenintegrität: Fehler behoben, bei dem eingefügte Bilder in einen toten lokalen Cache geschrieben wurden, Cloud-Quell-Metadaten nicht persistiert wurden und BroadcastChannel-Fallback für Live-KI-Updates im Relay/Mobile-Modus implementiert.
Slate-Sicherheit: XSS-Injection im Bildbetrachter behoben und Wildcard-postMessage-Ursprünge durch spezifische Erweiterungs-URLs ersetzt.
Version 0.9.706 (16. März 2026)
Neue Funktionen
- Provider-Fehlerbanner: Wenn ein KI-Anbieter einen Fehler zurückgibt (402 Zahlung erforderlich, fehlender API-Schlüssel, Ratelimit), erscheint nun ein interaktives Banner mit klaren Anweisungen anstelle einer generischen Fehlermeldung.
Verbesserungen
DOCX Cross-Span-Bearbeitung: Das
propose_change-Tool verarbeitet nun Suchen/Ersetzen-Vorgänge korrekt, die sich über mehrere Formatierungsbereiche erstrecken (z. B. teilweise fettgedruckter Text). Die Absicht wird weitergegeben, damit der Agent kontextbezogene Änderungen vornehmen kann.PDF-Speicherleistung: Das native Speichern von PDFs ist deutlich schneller – redundantes Parsing wurde eliminiert, Importmodule werden zwischengespeichert und unnötige Operator-Bereinigungen übersprungen.
Modusname in Nachrichten: Die Modus-Auswahl in den Nachrichteneinstellungen zeigt nun den Markennamen des Modus anstelle der internen ID an.
Fehlerbehebungen
Google OAuth Token-Aktualisierung: Fehler „Nicht autorisiert“ beim Aktualisieren von Google OAuth-Tokens behoben, die den Zugriff auf Calendar, Gmail und Drive blockieren konnten.
Fehlermeldung bei bereitgestellten Schlüsseln: Benutzer mit bereitgestellten API-Schlüsseln sehen keine irreführende „Guthaben hinzufügen“-Fehlermeldung mehr – die Nachricht erklärt nun das tatsächliche Problem und die nächsten Schritte.
Race Condition bei gleichzeitigen Threads: Ein Fehler wurde behoben, bei dem das Wechseln von Threads während der Generierung dazu führen konnte, dass GENERATION_COMPLETE/ERROR-Ereignisse auf den falschen Thread angewendet wurden.
Wiederherstellungsschaltfläche im Versionsverlauf: Die Wiederherstellungsschaltfläche im Versionsverlauf von Slate erscheint nun korrekt, wenn der aktuelle Inhalt von der ausgewählten Revision abweicht.
Doppeltes OAuth-Popup: Neue Chrome-Erweiterungsbenutzer sehen bei der ersten Anmeldung nicht mehr zwei OAuth-Popups.
Version 0.9.705 (15. März 2026)
Neue Funktionen
- Gruppierung der Einstellungskategorien: 19 Einstellungsbereiche sind jetzt in 5 ausklappbare Kategorien für eine schrittweise Offenlegung unterteilt. Der Bereich „Agenten-Modi“ zeigt einen übergreifenden Indikator mit Navigationslinks zu den betroffenen Abschnitten (Tool-Konfig, Modell-Konfig, Erscheinungsbild). Der Bereich „API-Anbieter“ öffnet sich standardmäßig mit einer Warnung zur Modellkapazität.
Fehlerbehebungen
- Agenda-Synchronisierung bei doppelten Kalendern: Google Calendar-Konten erscheinen nicht mehr doppelt im Sync-Tab, wenn sowohl eine Login-Verbindung (Identität) als auch eine private Verbindung für dieselbe E-Mail-Adresse bestehen. Verbindungen werden nun vor dem Rendern dedupliziert.
- i18n Einstellungskategorien: Bezeichnungen der Einstellungskategorien werden nun in alle unterstützten Sprachen übersetzt.
Version 0.9.704 (14. März 2026)
Neue Funktionen
- Microsoft 365 Integration Foundation: Microsoft Scope-Routing, Graph API Client und Account-Service mit BYOA-Unterstützung. Definitionen der Scope-Hierarchie und Erweiterungen der Tool-Scope-Registrierung für den Microsoft-Provider. Microsoft wurde als Relay-Proxied-Provider hinzugefügt.
- Rich Inline Rendering (RIR): Neue Codec-Architektur für das Rendern von Rich-Content direkt in Chat-Nachrichten. Enthält Codecs für HTML, Markdown und DOCX mit einer erweiterbaren Codec-Schnittstelle.
- PDF-Strukturbaum & Layout-Analyse: Parser für getaggte PDF-Strukturbäume für semantisches Dokumentenverständnis. Heuristische Absatzgruppierung für nicht getaggte PDFs bietet eine Fallback-Layout-Analyse. Bildersetzung/-einfügung und Erkennung von Inhaltsüberlauf.
- Auswahl des Messaging-Modus: Die Einstellungen der Messaging-Bridge enthalten jetzt einen Standard-Modus-Selektor, mit dem der Agent bei eingehenden Nachrichten mit der richtigen Persönlichkeit antworten kann.
Verbesserungen
- Provider Rate Limit Retry: Alle LLM-Provider versuchen nun automatisch bei 429 (Rate Limit) und 529 (Overloaded) Antworten mit einem exponentiellen Backoff erneut zu senden, anstatt sofort abzubrechen. Bis zu 3 Versuche mit Jitter.
- Google OAuth Scope Superset Matching: Schreib-Scopes erfüllen nun die Anforderungen für Lese-Scopes (z. B. deckt
driveauchdrive.readonlyab). Dies verhindert unnötige Re-Autorisierungen, wenn bereits ein umfassenderer Scope gewährt wurde. - BYOA Full-Scope Initial Auth: Wenn eine Private Connection erforderlich ist, fordert der initiale Auth-Flow nun alle notwendigen Scopes im Voraus an, anstatt zweimal zu fragen (einmal für Basis, einmal für Erweitert).
- Google 404-zu-Expanded-Access Promotion: Wenn eine BYOA-Verbindung einen 404-Fehler bei einer Google Workspace-Datei erhält, wird der Fehler zu einer Aufforderung für erweiterten Zugriff hochgestuft, anstatt eine Sackgassen-Fehlermeldung anzuzeigen.
- Messaging Credentials Private Sync: Zugangsdaten für die Messaging-Bridge werden jetzt über E2E-verschlüsselten Private Sync geräteübergreifend synchronisiert, anstatt gerätespezifisch zu sein. Sync-Manifest auf v10 aktualisiert.
- OAuth Wait Extended Timeout: BYOA- und Expanded-Access-OAuth-Flows haben nun ein Timeout von 5 Minuten (vorher 2 Minuten), um Benutzern genügend Zeit für die Schritte in der Google Cloud Console zu geben.
- Sparkle Framework Signing: macOS-Distributions-Builds signieren nun verschachtelte Binärdateien des Sparkle-Frameworks korrekt in Inside-Out-Reihenfolge, wodurch Notarisierungsfehler behoben werden.
- Tauri Node Binary Bundling: Tauri-Konfigurationen bündeln nun die Node.js-Binärdatei als Ressource für die Sidecar-Ausführung unter Windows/Linux.
- Messaging Settings Search: Der Bereich Messaging-Bridge ist nun über die Suchleiste der Einstellungen mit Schlüsselwörtern wie „whatsapp“, „telegram“, „webhook“ auffindbar.
- Settings Relay Forwarding: Das Speichern von Einstellungen wird nun über die WebSocket-Bridge an den Relay-Server weitergeleitet, um sicherzustellen, dass Messaging-Zugangsdaten und andere Konfigurationsänderungen die Statusdatei des Servers erreichen.
Fehlerbehebungen
- Slate Währung vs. Math: Dollarbeträge wie
$9/moin Markdown-Tabellen werden nicht mehr fälschlicherweise als LaTeX-Inline-Math-Begrenzer interpretiert. Der Math-Regex berücksichtigt nun maskierte Währungs-Dollarzeichen. - Conversation Page ToastProvider: Ausgekoppelten Konfigurations-Tabs fehlte der
ToastProvider, was dazu führte, dass Toast-abhängige Funktionen lautlos fehlschlugen. Der Provider-Baum entspricht nun dem Sidepanel.
Version 0.9.703 (14. März 2026)
Neue Funktionen
- Google Picker Integration: Vollständiger Google Drive Datei-Picker mit Popup/Iframe-Hybrid, Multi-View-Filtern (Docs, Sheets, Slides, PDFs) und Drive-Referenz-Chips im Composer. Dateien, die über den Google Picker ausgewählt werden, erhalten automatisch
drive.file-Zugriff. - Google Sheets Native Sync: Öffnen Sie Google Sheets in Slate mit vollständiger Bearbeitung auf Zellenebene (Round-Trip). Der Sheets-Codec konvertiert Tabellen-Grid-Daten in TipTap HTML-Tabellen und zurück, inklusive Konflikterkennung via Drive
modifiedTime. Unterstützt Lesen, Batch-Zellen-Updates und strukturelle Änderungen (Blätter hinzufügen/löschen, Zellen verbinden). - Google Slides Read-Only View: Google Slides Präsentationen werden in Slate mit Folien-Thumbnails und extrahierten Textinhalten für die Suchbarkeit gerendert.
- Gmail Batch Fetch & Markdown Konvertierung: Das Gmail-Tool ruft Nachrichten-Metadaten jetzt in Batches (bis zu 100 gleichzeitig) statt einzeln ab, verfügt über einen 5-minütigen Label-Namen-Cache und eine automatische HTML-zu-Markdown-Konvertierung des Bodys für eine sauberere Verarbeitung durch LLMs.
- Selection Overlay: Die Schaltfläche „Zum Prompt hinzufügen“ erscheint beim Markieren von Text auf jeder Webseite, sodass Sie ausgewählte Inhalte schnell zur Konversation hinzufügen können.
- Relay Overlay Manager: Agent-Overlay-Befehle werden jetzt über die Browser-Extension geroutet, was Agent-gesteuerte UI-Overlays auf der aktiven Webseite ermöglicht.
- Inline Quick-Tasks Model Picker: Die Modellauswahl für Quick-Tasks ist jetzt direkt in das Dropdown-Menü des Model Pickers eingebettet, statt in einem separaten Menü.
- Slate DOCX Export aus Google Drive: In Slate geladene Google Docs werden jetzt als DOCX exportiert (via
readFileContentAsBinary), wodurch der vollständige visuelle TipTap-Editor mit Änderungsverfolgung aktiviert wird, anstatt sie als reines Markdown zu öffnen. - Private Connection Setup Wizard: Verbesserter BYOA-Assistent mit einem dedizierten Schritt „Testbenutzer hinzufügen“, der dem aktuellen Google Cloud Console-Flow entspricht. Die Teilschritte des Consent-Screens folgen nun dem tatsächlichen 4-stufigen Accordion von Google. E-Mail-Anweisungen werden personalisiert, wenn die Identität des Benutzers bekannt ist.
- Private Connection Promotion Banner: Wenn der Agent erweiterte Google-Scopes benötigt (Gmail, Calendar etc.) und keine Private Connection existiert, erscheint ein animiertes Banner mit einem One-Click-Pfad zum Setup-Assistenten. Der Agent bleibt pausiert, während der Benutzer das Setup abschließt, und setzt die Arbeit automatisch fort, sobald die Verbindung gespeichert ist.
- Export Fidelity Warnings: Vor dem Export eines Dokuments in ein anderes Format (z. B. PDF zu DOCX) warnt ein Fidelity-Dialog vor potenziellen Formatierungsverlusten mit nach Schweregrad kategorisierten Hinweisen (Info, Warnung, Kritisch).
- PDF Annotation Extraction: PDF-Textanmerkungen und Markups werden nun während der Dokumentenverarbeitung und -rekonstruktion extrahiert und beibehalten.
- Reminders Calendar Sync: Das Reminders-Modal unterstützt jetzt den Kalender-Sync mit erweitertem Access-Gating.
Verbesserungen
- Google Docs Sync Fidelity: Verbesserte Extraktion von Formatierungs-Spans mit korrektem Tag-Matching (behandelt selbstschließende Tags, fehlerhafte Verschachtelungen) und Konflikterkennung bei gleichzeitigen Bearbeitungen.
- Private Sync Account Mismatch Detection: Das Account-Dropdown in den Sync-Einstellungen erkennt jetzt, wenn die konfigurierte Sync-E-Mail mit keinem verbundenen Google-Konto übereinstimmt, und zeigt einen „Nicht verbunden“-Indikator mit der Option zum Wechseln an.
- Teams/Enterprise Effective Tier: Die Lizenzvalidierung verwendet jetzt
effectiveTieraus der Team/Enterprise-Delegation, um den korrekten Feature-Zugriff sicherzustellen, wenn der Tier eines Benutzers von einem Team-Plan geerbt wird. - „Private App“ umbenannt in „Private Connection“: Alle benutzerorientierten Referenzen verwenden jetzt „Private Connection“ statt „Private App“ – klarer für Nicht-Entwickler, die OAuth-Integrationen nicht mit „Apps“ assoziieren.
- Google OAuth Scope Alignment (
drive.file): Alle erweiterten Google Drive Scopes (drive,drive.readonly,documents.readonly,spreadsheets.readonly,presentations.readonly) werden für Nicht-BYOA-Benutzer nun durch den engerendrive.fileScope ersetzt, entsprechend den Anforderungen für verifizierte Apps von Google. BYOA-Benutzer behalten die vollen Scopes. - Gmail-Berechtigungen im Scope-Selector sichtbar: Scopes zum Lesen, Verfassen und Ändern von Gmail sind jetzt für alle Benutzer im Google Permissions Editor unter „Hochempfindliche Berechtigungen“ sichtbar, statt nur für BYOA-Nutzer. Diese Scopes werden auf dem Consent-Screen genehmigt und via JIT angefordert, wenn Gmail-Tools sie benötigen.
- Google Picker Consent Recovery: Wenn Google-Berechtigungen extern widerrufen werden (z. B. in den Google-Konto-Einstellungen), erkennt die App veraltete Scopes jetzt automatisch, entwertet sie, autorisiert neu und versucht es erneut – statt lautlos mit 403-Fehlern abzubrechen.
- Agent Google Drive Guidance: Tool-Fehlermeldungen und Hinweise bei leeren Ergebnissen weisen den Agenten nun an, dem Benutzer zu sagen, dass er auf die +-Schaltfläche im Composer klicken und Google Drive auswählen soll, anstatt nicht verfügbare Tool-Aktionen vorzuschlagen.
- Slate Drive Picker vereinfacht: Slates „Aus Google Drive laden“ lädt Dateien jetzt direkt und überspringt den Auswahlbildschirm zwischen „In Drive bearbeiten“ und „Zur Konversation hinzufügen“.
- Offizielles Google Drive Logo: Drive-Chips und das Anhang-Menü verwenden jetzt das offizielle Google Drive Logo anstelle des generischen grünen Dreiecks.
- Unified Model Picker: Die Auswahl des Helper-Modells fällt auf das Standardmodell zurück, mit einem einzigen konsolidierten Modell-Dropdown.
- DOCX Non-Text Element Passthrough: Die DOCX-Rekonstruktion bewahrt Nicht-Text-Elemente (Bilder, Diagramme, eingebettete Objekte), die nicht Teil des Textbearbeitungs-Flows sind.
- PDF Multi-Segment Line Editing: Der PDF-WYSIWYG-Editor verarbeitet jetzt Zeilen, die über mehrere Textsegmente verteilt sind.
- Auth Rate Limit erhöht: Das Rate-Limit für den Auth-Endpunkt wurde von 10/Min auf 30/Min erhöht, um schnelle OAuth-Token-Austausche während des BYOA-Setups zu ermöglichen.
- OAuth Token Endpoint Reclassified: Der OAuth-Token-Austausch wurde vom Auth-Rate-Limit-Bucket in den allgemeinen Bucket verschoben, um Drosselungen während Multi-Scope-Autorisierungs-Flows zu verhindern.
Fehlerbehebungen
- iOS Modal Stacking: Absturz behoben, wenn Datei-Picker oder Slate-Overlays angezeigt wurden, während bereits ein anderes Modal (z. B. Browser-Overlay) aktiv war. Picker und Overlays werden nun auf dem obersten View Controller angezeigt.
- Slate Line Range Validation:
get_slate_contentgibt nun einen klaren Fehler zurück, wennstartLineaußerhalb der Dokumentlänge liegt, anstatt lautlos leeren Inhalt zu liefern. - Server Path Traversal: Storage-Keys werden jetzt gegen Directory-Escapes validiert, um Path-Traversal-Angriffe auf den Sync-Storage-Endpunkt zu verhindern.
- Ad Blocker Regex Cap: Der DNR-Konverter begrenzt Regex-Regeln jetzt auf das Chrome-Limit von 1000 Regeln und verwirft große begrenzte Quantifizierer, die das Speicherlimit von RE2 überschreiten, um Installationsfehler der Extension zu vermeiden.
- OAuth Timeout bei erweitertem Zugriff: Timeout von 120 Sekunden behoben, wenn der Agent erweiterte Google-Scopes benötigt (Gmail, Calendar). Die Wartezeit für ausstehende OAuth-Anfragen wurde für das BYOA-Setup auf 5 Minuten verlängert; das Abschließen der Verbindung in den Einstellungen setzt den pausierten Agenten automatisch fort.
- Chat UI Freezes: Überlappende asynchrone Intervalle und stille Broadcast-Fehler behoben, die die Chat-Oberfläche einfrieren konnten.
- Cloud Sync Download Batch: TypeScript Null-Check-Fehler im Cloud-Sync-Download-Batch-Handler behoben.
- Service Worker Dynamic Imports: Dynamische Imports wurden für die Kompatibilität mit dem Chrome MV3 Service Worker in statische Imports umgewandelt.
- BYOA-Only Scope Enforcement: Die Aktionen
convert_to_google_docundconvert_to_google_sheeterfordern jetzt korrekt nurdrive.fileanstelle von breiten Editor-Schreibrechten. - Drive Chip Format: Dreiteiliges Format für Drive-Referenz-Chips mit korrektem BYOA-only Scope-Gating.
- Google Picker CORS: Der Picker wird jetzt auf dem privaten Relay gehostet, um Cross-Origin-Probleme mit dem Popup-Scope-Flow zu lösen.
Version 0.9.701 (6. März 2025)
Verbesserungen
- Ollama Context Window Anzeige: Der Kreis für die Nutzung des Kontextfensters wird nun für Ollama-Modelle gerendert, indem der
/api/show-Endpunkt fürnum_ctxabgefragt wird, anstatt sich auf die Modellliste von OpenRouter zu verlassen, die keine lokalen Modelle enthält. - Ollama Tool Calling: Dynamische Tool-Auswahl für Ollama korrigiert – reicht
tool_choicean die API weiter (unterstützt seit Ollama v0.5.1), deaktiviert den Think-Modus bei aktiven Tools, um korruptes JSON zu verhindern, und nutzt ein leichtgewichtiges Non-Streaming-Hilfsmodell als Fallback, wenn das Primärmodell Tool-Aufrufe nicht unterstützt. - OpenRouter Reasoning Cache: Fehler behoben, bei dem Reasoning-Text vorzeitig vom Streaming-Provider gelöscht wurde. Der Cache-Lebenszyklus wird nun vom
agent-runneran Iterationsgrenzen verwaltet, konsistent mit Anthropic- und Google-Providern. - PDF WYSIWYG Zuverlässigkeit: Die globale Textausrichtung verarbeitet PDF.js-Splitting-Operatoren über mehrere TextItems hinweg. Block-Bearbeitung auf nicht übereinstimmenden Spannen (Anmerkungen/Header-Text) deaktiviert, um Exportfehler zu verhindern. CMap 2-Byte-Dekodierung beschädigt keine mehr von Word generierten PDFs mit 1-Byte-ASCII-Schriftarten. Bounds-Check für Operator-Matching verhindert Out-of-Range-Indizes bei leeren Textelementen.
- Desktop-Plattform-Erkennung: Der dynamische Tool-Selektor verwendet die
localFolderSync-Fähigkeit anstelle voncaiiooRemindersfür die Desktop-Erkennung undappleScript/appleNotesanstelle von Kalender/Erinnerungen für die macOS-Erkennung (Kalender/Erinnerungen sind via EventKit Apple-übergreifend).
Version 0.9.700 (5. März 2025)
Neue Funktionen
- File Manager: Vollständiges Dateiverwaltungssystem mit verschachtelten Ordnern, Benutzer-Tags, Favoriten und einer dedizierten File Manager UI. Organisieren Sie Anhänge in Ordnerhierarchien, filtern Sie nach Typ (Screenshots, AI-Bilder, Fotos), suchen, sortieren und betrachten Sie Dateien im Raster- oder Listenmodus. Automatisches Thread-Tagging verknüpft Dateien mit Konversationen. Unterstützung für Private Sync via Manifest v9.
- Local Folder Sync: Bidirektionale Synchronisierung zwischen lokalen Dateisystemordnern und dem File Manager. Die mutationsgesteuerte Resynchronisation überträgt Löschungen, Massenlöschungen und Verschiebungen automatisch mit einem 2-Sekunden-Debounce auf die Festplatte. Die Erkennung von Unterordner-Verschiebungen verschiebt Dateien auf der Festplatte, wenn sie in Caiioo neu organisiert werden. Das Navigieren in einen beliebigen Unterordner innerhalb eines Sync-Baums löst eine automatische Resynchronisation aus.
- Dateitypübergreifende Tracked Changes: Einheitlicher Workflow zum Akzeptieren/Ablehnen über DOCX, PDF und Markdown hinweg. DOCX-Bearbeitungen werden jetzt als Tracked Changes mit derselben Diff-Engine aufgezeichnet, die auch für Markdown und Code-Slates verwendet wird. PDF Tracked Changes sind in den visuellen Editor integriert. Die Aktion
resolve_tracked_changesermöglicht es dem Agenten, Revisionen programmatisch zu akzeptieren oder abzulehnen. - PDF WYSIWYG Editing: Direkte Textbearbeitung auf gerenderten PDF-Seiten mit dokumentenangepasstem Styling. Die Textebene verknüpft Bearbeitungen über
textItemIndexmit Quell-Content-Stream-Operatoren für eine chirurgische Rekonstruktion beim Export. Enthält eine plainText-Baseline für die Änderungserkennung. - DOCX-Rendering-Treue: Umfangreiche DOCX-Vorschau mit Absatzausrichtung, Hyperlinks, Schriftfarbe/-größe, Zeilenabstand, Einzug und Tabellenzellenschattierung. Die Code-Ansicht zeigt die Markdown-Konvertierung für einen Token-effizienten LLM-Verbrauch.
- Universal Messaging (nur interne Tests): Senden und Empfangen von Nachrichten über WhatsApp, Telegram und Slack mit Local-First-Privatsphäre. Der Agent kann Nachrichten verfassen und senden, Konversationen auflisten und auf Threads antworten – alles geroutet über Ihr eigenes Gerät.
- Google Meet Integration: Meeting-Recall-Tool mit mehreren Aktionen:
list_meetings(Entdecken der letzten Meetings mit Datumsbereichsfilterung) undget_meeting(Abrufen von Transkripten). Durchgängig implementiert über die volle OAuth/JIT/Scope-Approval-Pipeline mit Credentials-Vault-Unterstützung. - Gmail Send Email: Direkter E-Mail-Versand über die Gmail API, abgesichert durch eine Genehmigung für Hochrisiko-Tools. Risk-Level-Overrides pro Aktion ermöglichen es, dass
send_emaileine explizite Bestätigung erfordert, während Entwurfsaktionen auf mittlerem Risiko bleiben. - Microsoft BYOA: Bring Your Own App Unterstützung für Microsoft 365. Registrieren Sie Azure AD App-Registrierungen für Microsoft OAuth Verbindungen. Multi-Provider BYOA-Registry (Google + Microsoft) mit Tenant-ID-Unterstützung und einem 3-stufigen Azure Portal Setup-Assistenten.
- Poe Provider: Neue LLM-Provider-Integration für Poe, mit Modellauflistung, Provider-gruppierter Modellauswahl, Erkennung von Vision/Tools/Reasoning-Fähigkeiten und Preisanzeige.
- What's New Dialog: Eine über die API bereitgestellte Content-Pipeline liefert Release Notes und Benutzerhandbuch-Seiten. Ein asynchroner What's-New-Dialog zeigt bei Updates die Highlights der Version an.
- Private Sync Account Selector: Wählen Sie aus, welches Google-Konto für Private Sync verwendet werden soll, anstatt standardmäßig das Primärkonto zu nutzen.
- Native TipTap Diff Marks: Das separate marked.js Rendering-Overlay für AI-Revisionsvorschauen wurde durch native ProseMirror-Markierungen (DiffAdded/DiffRemoved) ersetzt. Revisionen werden nun als Inline-Tracked-Changes mit konsistenter Typografie gerendert, inklusive Akzeptieren/Ablehnen auf Chunk-Ebene.
- Mermaid Diagrams: Live-Rendering von Mermaid-Diagrammen in Code-Blöcken innerhalb des TipTap-Vorschaumodus von Slate.
- Fuzzy Section Search im Help Tool: Das Help Tool unterstützt jetzt Fuzzy Matching bei der Suche nach spezifischen Abschnitten innerhalb der Dokumentationsseiten.
Verbesserungen
- File Manager UX Polish: Icon-Indikatoren für Ordner-Sync, Löschbestätigungsdialoge, Shift-Klick-Bereichsauswahl, Toolbar-Umbruch statt Überlauf bei geringer Breite und korrigierte Tag-Persistenz nach Neuladen.
- Responsive Composer Layout: Ein Drei-Zonen-Flex-Layout verhindert, dass der Button für neue Threads bei geringer Breite aus dem Bildschirm geschoben wird. Modus- und Modellauswahl verwenden gestaffelte Breakpoints zum Ausblenden von Text. Eigene Icons für Agenten und AI-Chips ersetzen generische Standardwerte.
- Settings UX: Neu geordnete Abschnitte für besseren Flow (Personalization → Credentials → Tool Approvals → Agent Modes → Tool Configuration → Skills Library → Tool Servers → Document Processing → Voice).
- Revision State Integrity: Korrektur von Fehlern beim Löschen großer Inhaltsblöcke während aktiver AI-Revisionen – sourceContent Immutabilität, Schwellenwert für Chunk-Relokation auf 0,7 erhöht, veraltete Chunks werden automatisch abgelehnt und Integritätsprüfungen der Versionshistorie.
- Agent Loop Reliability: Behebung einer Abort-Controller Race Condition, bei der alte Durchläufe den Controller eines neuen Durchlaufs löschen konnten. Das Abbruchsignal wird nun in die in der Warteschlange befindlichen Tools propagiert. Verwaiste Ausführungszustände senden Fehlermeldungen, anstatt leere Nachrichten zu hinterlassen.
- Interjection Handling: Vereinheitlichte
getActiveBranchMessagesTraversierung auf Server und UI, um Interjections konsistent zu überspringen. Fehler behoben, bei dem die Antwort nach einem Follow-up verschwand, wenn die Streaming-parentId auf die Interjection statt auf die Benutzernachricht zeigte. - macOS Native Stability: Behebung einer Restart Race Condition mit Process Epoch Tracking, URLSession-Leak bei Wiederverbindung und LineBuffer Data Race zwischen Pipe-Handler und Stop.
- Google Sheets Fix:
create_tableschreibt nun Spaltenüberschriften, anstatt die erste Zeile leer zu lassen. - Middleware Cleanup:
requireAuthMiddleware aus 10 Inline-Auth-Prüfungen in apple-routes, mcp-routes und attachment-routes extrahiert. - Image Type Filtering: Der File Manager unterscheidet Screenshots, AI-generierte Bilder und Benutzerfotos mit separaten Filteroptionen und unterschiedlichen Icons.
- Mode/Model Picker Parity: Schriftstärke und Icon-Strichstärke zwischen Modus-Auswahl und Modell-Auswahl angeglichen.
- Beta Tier Gating: Der Credentials Vault beschränkt Beta-Features basierend auf Tier-Prüfungen.
- CIDFont Re-Encoding: Die PDF-Rekonstruktion unterstützt CIDFont-Kodierung mit ToUnicode CMap-Tabellen und Identity-Fallback für Zeichen, die nicht in der Map enthalten sind.
- PDF Export Renamed: "Download" wurde im gesamten PDF-Workflow zur Klarheit in "Export" umbenannt.
Fehlerbehebungen
- PDF Text Disappearing: Fehler behoben, bei dem PDF-Ansichtstext beim Blur verschwand und Inhalte beim Export aus der WYSIWYG-Bearbeitung verstümmelt wurden.
- PDF Tracked Changes Routing: Verhindert, dass PDF Tracked Changes durch die einheitliche Diff-Engine geleitet werden, was PDF-spezifische Operatordaten beschädigte.
- PDF Export Integrity: Der PDF-Download schlägt nun explizit mit Diagnosemeldung fehl, anstatt stillschweigend auf den Markdown-Export zurückzufallen.
- Markdown Table Line Breaks:
<br>Tags in Markdown-Tabellen werden nun als tatsächliche Zeilenumbrüche statt als literaler Text gerendert. - DOCX Tracked Deletions Preserved: Fehler behoben, bei dem nachverfolgte Löschungen in DOCX beim Wechsel zwischen Visual- und Code-Ansicht entfernt wurden.
- Tracked Changes on Stored Markdown: Fehler behoben, bei dem
propose_changeauf Markdown-Slates keine Korrekturmarkierungen anzeigte, wenn diese aus dem Speicher geladen wurden. - Reject Reverts Content:
resolve_tracked_changesmit "reject" setzt den Inhalt für Markdown- und Code-Slates nun korrekt zurück. - Slate Save Loop: Endlosschleife beim Speichern behoben, die ausgelöst wurde, wenn Track Changes aktiv war.
- Messaging Stability: Korrekturen an Routing, Reply-Threading, Profil-Handling, Queue-Resilienz, Webhook-Signaturen, Sender-Sanitization und Payload-Limits.
Version 0.9.662 (27. Februar 2025)
Neue Funktionen
- Bring Your Own App (BYOA): Verwenden Sie Ihre eigenen Google OAuth-Zugangsdaten anstelle der integrierten App von caiioo. Die Multi-App-Unterstützung ermöglicht es Teams, einen einzigen OAuth-Client organisationsweit zu teilen, während individuelle API-Keys beibehalten werden. BYOA-Verbindungen erkennen veraltete Token automatisch und fordern zur erneuten Authentifizierung auf.
- Wikilink-Navigation: Wikilinks in doppelten eckigen Klammern im Obsidian-Stil zwischen Slate-Dokumenten zum Aufbau vernetzter Wissensdatenbanken. Klicken Sie auf einen Wikilink, um sofort zwischen Slates zu navigieren.
- Skills-Menü: Einfügen von Skills per Tab-Taste, Dropdown-Menü mit dynamischer Höhe, Inline-Bearbeitung mit Variablen-Chips und eine gemeinsame SkillForm-Komponente für vollständiges CRUD direkt aus dem Composer.
- DOCX-Download: Laden Sie Slate-Markdown- und Textdokumente als DOCX-Dateien herunter, wobei nachverfolgte Änderungen erhalten bleiben.
- Automatisches Ausfüllen von Tabellen:
insert_componentfüllt jetzt Tabellenzellen automatisch aus strukturierten Daten aus, wodurch leere Platzhaltertabellen eliminiert werden. - Gemini 3.1 Flash: Als Bildgenerator-Modelloption neben den bestehenden Gemini-, FLUX- und Seedream-Modellen hinzugefügt.
- Google Drive Speicherung für alle Konten: Das Speichern in Google Drive ist jetzt für jedes verbundene Google-Konto verfügbar, nicht nur für das Primärkonto.
- Einheitliche Diff-Engine: Komplette Neuentwicklung des Diff-Systems zur Änderungsvorgabe von Slate (Phasen 0–7) mit TOCTOU-Sicherheit, Caching, Widgets zum Annehmen/Ablehnen pro Änderung und Unterstützung für Mobile-Tap-to-Toggle.
Verbesserungen
- Adaptiver Private Sync: Die Sync-Polling-Rate passt sich dynamisch basierend auf der Aktivität an. Die Optimierung der Download-Only-Sperre reduziert Konflikte.
- OAuth-E-Mail-Erfassung: Google OAuth enthält jetzt immer Identity-Scopes, sodass die E-Mail des Benutzers bei jeder Verbindung erfasst wird, was leere E-Mails bei einigen Konten behebt.
- Sicherheitshärtung: Gehärtete OAuth PKCE-Flows, Agent-Subprozess-Grenzen und Brute-Force-Sperre pro Konto bei wiederholten fehlgeschlagenen Authentifizierungsversuchen.
- Browser-Chip-Layout: Browser-Selector-Chips sind kleiner und brechen um, anstatt den Container zu überlaufen.
- Registry-gesteuerte Bildanbieter: Die fest codierte Liste der Bildanbieter wurde durch eine dynamische Registry ersetzt, was das Hinzufügen neuer Modelle trivial macht.
- Content i18n Pipeline: Einheitlicher Hash-gesteuerter Content-Sync für alle Dokumentationsseiten mit Unterstützung für inkrementelle Übersetzungen.
Fehlerbehebungen
- Mathematische Ausdrücke in der Vorschau: Fehler behoben, bei dem mathematische Ausdrücke beschädigt wurden, wenn von der TipTap-Vorschau zur Code-Ansicht gewechselt wurde.
- Wikilinks in der Vorschau: Fehler behoben, bei dem die Wikilink-Syntax beim Umschalten zwischen TipTap-Vorschau und Code-Ansicht entfernt wurde.
- Verschwindende Thread-Nachrichten: Fehler behoben, bei dem Thread-Nachrichten durch STATE_PATCH entfernt wurden oder beim Modellwechsel während der Konversation verschwanden.
- Interjektions-Waisen: Fehler behoben, bei dem verwaiste parentIds nach der Filterung von Interjektions-Nachrichten zu Rendering-Fehlern führten.
- Endlosschleife bei Private Sync: Endlosschleife im Sync behoben, die durch gleichzeitige Zeitstempel-Konflikte bei Collection-Items und thread_data_-Präfix-Verschmutzung verursacht wurde.
- BYOA-Sonderfälle: Fehler behoben, bei dem die BYOA-Konfiguration beim Löschen nicht wiederhergestellt wurde, sowie Probleme mit asynchronen Save-Races, der Nutzung veralteter Localhost-Popups in der Extension anstelle von launchWebAuthFlow und falscher Priorisierung von issuedByClientId.
- Wiederherstellung des Private Sync Scopes: Fehler behoben, bei dem die Entsperrung des Private Sync lautlos fehlschlug, wenn Google Drive-Scopes abgelaufen waren oder fehlten.
- Doppelte Skills: Verhindert, dass doppelte Skills nach Private Sync-Merges erscheinen.
- Routing nachverfolgter Änderungen:
get_tracked_changesundget_commentsin das SlateTool-Action-Routing integriert, damit der Agent den Revisionsstatus lesen kann. - DOCX-Download-Quelle: Fehler behoben, bei dem downloadAsDocx veraltete Artefakt-Inhalte anstelle des Live-Editor-Status verwendete.
- Intelligente Modellnamen-Abkürzung: Lange Modellnamen überlaufen den kompakten Picker dank intelligenter Abkürzung nicht mehr.
- Markdown-Link-Rendering: Fehler behoben, bei dem chrome-extension: und Caiioo: URLs in gerenderten Markdown-Links blockiert wurden.
- Thread-Erstellungsgeschwindigkeit: Die Zeit zur Thread-Erstellung wurde durch Eliminierung redundanter Einstellungs-Kaskaden-Lookups halbiert.
- Chrome-Tab-Titel: Der dynamische Chrome-Tab-Titel basierend auf dem aktiven Konversations-Thread wurde wiederhergestellt.
- Adaptive Greeting Tokens: max_tokens für adaptive Begrüßungen erhöht, um Abschneiden bei Reasoning-Modellen zu verhindern.
Version 0.9.661 (25. Februar 2025)
Neue Funktionen
- Agent Interjection: Steuern Sie die KI während des Laufs, indem Sie eine Nachricht eingeben und die Eingabetaste drücken, während sie arbeitet. Der Agent sieht Ihre Anweisungen am nächsten Entscheidungspunkt und passt den Kurs an — ein Abbrechen und Neustarten ist nicht erforderlich. Eine bernsteinfarben markierte Senden-Schaltfläche erscheint neben der Stopp-Schaltfläche, wenn Sie Text zum Senden bereit haben.
- API Tool Management: Das API-Integrations-Tool unterstützt jetzt
save_tool,list_toolsunddelete_toolals erstklassige Aktionen. Dies erleichtert die Verwaltung von vom Agenten entdeckten APIs direkt aus Konversationen heraus. Kostenlose Nutzer sehen GET und list_tools; Pro-Nutzer erhalten den vollen Funktionsumfang. - Live Token Counter: Token- und Kostenverbrauch werden jetzt in Echtzeit während des Streamings aktualisiert und in der Fußzeile jeder Nachricht angezeigt. Spezialisierte Kosten (Bildgenerierung, Web-Suche) werden schrittweise hinzugefügt, sobald das jeweilige Tool abgeschlossen ist.
- Auto-Expand Tool Cards: Tool-Karten erweitern sich automatisch, wenn sie Streaming-Argumente empfangen oder eine Genehmigung benötigen, und schließen sich automatisch bei erfolgreichem Abschluss. Fehler und abgelehnte Tools bleiben zur Überprüfung erweitert.
- Monaco Diff Editor: Slate-Code-Revisionen verwenden jetzt den nativen Inline-Diff-Editor von Monaco mit Schaltflächen zum Akzeptieren/Ablehnen pro Änderung und ersetzen damit das bisherige benutzerdefinierte Dekorationssystem.
Verbesserungen
- Private Sync Auth Recovery: Private Sync-Fehler aufgrund abgelaufener oder widerrufener Google-Token zeigen jetzt handlungsrelevante Schaltflächen "Google neu verbinden" und "Berechtigungen erteilen" anstelle einer passiven Fehlermeldung. Die Wiederverbindung fordert die korrekten Drive-Berechtigungen an und wählt das richtige Google-Konto vor.
- Private Sync Multi-Account: Private Sync authentifiziert sich jetzt gegenüber dem Google-Konto, das mit der Konfigurations-E-Mail übereinstimmt, anstatt auf das zuerst verbundene Konto zurückzugreifen. Behebt das Synchronisieren mit dem falschen Drive, wenn mehrere Google-Konten verbunden sind.
- Brand Refresh: Neue Farbpalette in River Blue und Rock Grey, abgeleitet vom caiioo-Logo, ersetzt das bisherige lila Thema in der gesamten App und auf der Website.
- OAuth Security: Google, GitHub und Slack OAuth Client Secrets wurden aus dem Extension-Paket entfernt. Der Token-Austausch erfolgt nun über einen sicheren Cloudflare-Relay-Proxy, wodurch Secrets aus dem Client-Code eliminiert werden.
- Schnellerer Start: Anhangsinhalte (Bilder, extrahierter Text) werden jetzt bei Bedarf geladen statt beim Start, was die initiale Ladezeit für Konversationen mit vielen Anhängen erheblich verkürzt.
- Schnelleres Streaming: Die Nutzung des Context-Fensters wird jetzt über den schnellen Broadcast-Pfad gestreamt, anstatt den Umweg über den Speicher zu nehmen, was Echtzeit-Updates ohne Async-I/O pro Agent-Schleife ermöglicht.
- Private Sync Speed: Der Google Drive File-ID-Cache bleibt über Neustarts hinweg erhalten, wodurch ein vollständiger API-Aufruf zur Dateiauflistung beim ersten Synchronisierungszyklus entfällt.
- Unified Streaming Render Path: Streaming- und finale Inhalte fließen nun durch einen einzigen Render-Pfad, was das Flackern bei Abschluss der Generierung eliminiert und Interjection-Nachrichten erhält.
- Cross-Model Switching: Das Wechseln zwischen AI-Providern mitten im Thread (z. B. Gemini zu Claude) verursacht keine "Invalid signature in thinking block"-Fehler mehr. Fremde Reasoning-Artefakte werden automatisch zu narrativem Text geglättet, wodurch der Kontext ohne inkompatible kryptografische Signaturen erhalten bleibt.
- Disabled Tool Guidance: Wenn die KI versucht, ein deaktiviertes Tool zu verwenden, erhält sie nun hilfreiche Vorschläge (ähnliche aktivierte Tools, Anleitung zur Aktivierung) anstelle eines generischen "nicht gefunden"-Fehlers.
- Responsive Composer Layout: Die Composer-Toolbar nutzt ein gestaffeltes progressives Einblenden — Modus-Auswahl, Modell-Auswahl, Einstellungen, Agenda und Hilfe-Icons erscheinen, sofern Platz vorhanden ist, anstatt abgeschnitten zu werden.
- Settings Color Coding: Einstellungsbereiche verwenden jetzt ein 3-Farben-System — Akzenttönung für Anpassungsbereiche, abwechselnde neutrale Töne für den Rest — für eine klarere visuelle Gruppierung.
- Onboarding Errors: Die Bereitstellung kostenloser Keys zeigt nun beschreibende Fehlermeldungen unter den Aktionsschaltflächen an, anstatt lautlos fehlzuschlagen.
- AI Provider Settings: Der Bereich "API & Provider" wurde zur Klarheit in "AI Provider" umbenannt.
- Extended Free Trial: Der Pro-Testzeitraum wurde von 7 Tagen auf 14 Tage verlängert, um neuen Nutzern mehr Zeit zum Erkunden der Pro-Funktionen zu geben.
- Optimistic Branch Switching: Das Wechseln zwischen Nachrichten-Zweigen und das Neuladen von Nachrichten aktualisiert die UI jetzt sofort, ohne auf Speicher-Antworten zu warten.
- MCP Tool Configuration: Schema-Autokorrektur und verbesserte MCP-Tool-Konfiguration für eine zuverlässigere Tool-Einrichtung.
Fehlerbehebungen
- Per-Message Costs: Die Kosten für einzelne Nachrichten entsprechen nun kumuliert der Gesamtsumme im Thread-Header. Kosten für Helper, OCR, Bildgenerierung und Suche werden einzelnen Nachrichten zugeordnet statt nur der Thread-Zusammenfassung.
- Interjection Rendering: Interjection-Nachrichten werden jetzt als kompakte bernsteinfarbene Annotationen inline in der Assistant-Timeline gerendert, anstatt bei Abschluss der Generierung verloren zu gehen.
- Loop Detection: Behebung einer fälschlicherweise positiven Wiederholungserkennung bei zitatreichen Antworten, in denen URLs natürlicherweise 3+ Mal vorkommen.
- Slate Diff Alignment: Ausrichtung von roten/grünen Linien im Vorschaumodus für mehrzeilige Blöcke korrigiert, bei denen die Overlay-Schleife unabhängig von der Blockspanne nur um 1 Zeile voranschritt.
- Slate Deletion Positions: Doppelte Zählung des Einfüge-Versatzes korrigiert, die dazu führte, dass Löschungen nach ihren zugehörigen Einfügungen statt davor gerendert wurden.
- Private Sync Fixes: JIT-Scope-Anfragen werden nun korrekt über Code-Split-Chunks hinweg ausgelöst; Endlosschleife beim Synchronisieren nach Uploads behoben.
- Onboarding Flow: Der OAuth-Flow schließt das Onboarding nun ordnungsgemäß ab, IDs für Modi mit Bindestrich werden bei der Trigger-Erkennung unterstützt und 0 verbleibende Tage werden nicht mehr zu null erzwungen.
- Password Reset: Das Zurücksetzen des Passworts über einen E-Mail-Link verifiziert nun die E-Mail-Adresse. Resend-Verification-Endpunkt für Nutzer mit abgelaufenen Verifizierungs-E-Mails hinzugefügt.
- License Tier: Nutzer mit einem vom Admin zugewiesenen Tier, aber ohne Lizenz-Eintrag, hängen nicht mehr am Upgrade-Gate fest.
- Settings Scroll: Das Klicken auf das Gehirn-Icon für eine gelernte Seite scrollt nun zum korrekten Einstellungsbereich, anstatt aufgrund von Lazy-Loading-Bereichen darüber zu früh zu stoppen.
- Monaco Disposal: Reihenfolge der Modell-Entsorgung im Diff-Editor korrigiert, um verwaiste Referenzen und das Durchscheinen von Monaco durch die TipTap-Vorschau zu verhindern.
- Walkthrough Targeting: Walkthrough-Schritte überspringen jetzt Elemente, die durch responsive Container-Queries ausgeblendet sind, anstatt ein 16x16 Pixel großes Feld in der oberen linken Ecke zu markieren.
- Kokoro TTS: Text-to-Speech in der Extension korrigiert — die Erkennung der ONNX-Laufzeit schlug in Offscreen-Dokumenten fehl, was zu "no available backend found"-Fehlern führte.
- Custom API Tool Save: Das Speichern von vom Agenten entdeckten APIs als benutzerdefinierte Tools in der Extension korrigiert, das aufgrund verbotener dynamischer
import()-Aufrufe im Service Worker-Kontext abstürzte. - Boot Performance: Sitzungsmigration wurde bei jedem Zugriff auf die Einstellungen (20+ Mal beim Start) ausgeführt; dies wurde behoben, um unnötige Schreibvorgänge und langsamen Start zu vermeiden.
- Duplicate Storage Broadcasts: Doppelte Speicheränderungs-Benachrichtigungen im Relay/Server-Modus unterdrückt, die UI-Flackern verursachen konnten.
- Cairn Texture Recovery: Texturgenerierung korrigiert, die fehlschlug, wenn der In-Memory-World-Cache zwischen Laden und Rendern geleert wurde; Renderer zeigt kein Schwarz mehr für anhangsbasierte Texturen.
- Security Patches: fast-xml-parser (DoS über DOCTYPE Entity Expansion) und tar (Hardlink Escape Vulnerability) aktualisiert.
- MV3 Compliance: Über CDN geladenes vega-embed durch lokale Vendor-Bundles ersetzt, um sicherzustellen, dass der gesamte Chart-Rendering-Code der Remote-Code-Richtlinie des Chrome Web Store entspricht.
- Vega-Lite Charts: Die KI generiert Vega-Lite-Visualisierungen jetzt direkt in Slate anstelle von über CDN geladenem HTML, was interaktive Diagramme ohne Abhängigkeiten von Remote-Skripten ermöglicht.
- Google Drive Save: 403-Fehler beim Speichern in Google Drive aus Slate behoben, die durch veraltete OAuth-Scope-Prüfungen in Nicht-Agent-Drive-Handlern verursacht wurden.
- New User Onboarding: Onboarding-Bildschirm wird für neue Nutzer nicht mehr übersprungen, wenn während des Logins automatisch ein API-Key bereitgestellt wurde.
- OpenRouter OAuth Popup: "Verbinden..."-Spinner hängt nicht mehr unendlich fest, wenn Popup-Blocker das OAuth-Fenster lautlos geschlossen haben.
- Trial Banner Copy: Das Test-Banner behauptet nicht mehr, dass Modelle nach Tier beschränkt sind — aktualisiert, um Pro-Funktionen (Schreibzugriff, Bildgenerierung, benutzerdefinierte Modi) korrekt zu beschreiben.
- DOCX Review Toolbar: Flackern der Toolbar bei der Anzeige von Dokumentenprüfungs-Steuerelementen durch Verzögerung des Scrollens bis zur initialen Sichtbarkeit behoben.
- Add to Prompt Overlay: Overlay-Logo wurde durch Content Security Policy blockiert und Hintergrund-Deckkraft entsprach nicht dem Thema; beides behoben.
- Message Edit/Reload State: In-Memory-Status wurde nach dem Bearbeiten einer Nachricht, dem Neuladen einer Antwort oder dem Wechseln von Zweigen veraltet; dies wurde behoben.
- Server Login Hang: WebSocket-Speicheroperationen schlugen während des Server-Login-Flows fehl. Die Authentifizierung ist nun entkoppelt, sodass die lokale Sitzung sofort funktioniert, während die Server-Identität im Hintergrund aufgelöst wird.
- WebSocket Connection Hang: Race Condition behoben, bei der AUTH_STATE: ready während der initialen WebSocket-Verbindung eintraf und das Auth-Promise verwaisen ließ, was den Abschluss der Verbindung verhinderte.
Version 0.9.655 (19. Februar 2025)
Neue Funktionen
- Slack-Integration: Verbinden Sie Ihren Slack-Workspace, um KI-gestützte Slack-Tools mit vollständiger OAuth V2-Autorisierung zu aktivieren
- API-Tool-Anmeldedaten: Vom Agenten entdeckte APIs können jetzt als benutzerdefinierte MCP-Tools mit gespeicherten Anmeldedaten gespeichert werden, was die Wiederverwendung über Gespräche hinweg ermöglicht
- Gespeicherte API-Badge: Vom Agenten erstellte API-Tools zeigen zur einfachen Identifizierung ein „Gespeicherte API“-Badge in den Einstellungen an
- Gesprächsimport: Importieren Sie Gespräche von ChatGPT, Claude, Gemini, Perplexity und Grok — laden Sie Ihre Exportdatei hoch und Caiioo konvertiert sie mit vollständigem Nachrichtenverlauf, Anhängen und Metadaten
Verbesserungen
- Verschachtelung gelernter APIs: Gelernte API-Tools sind jetzt für eine sauberere Organisation unter einem ausklappbaren Bereich in den Einstellungen gruppiert
- Caiioo-Branding: Integrierte Tools zeigen jetzt das Caiioo-Symbol für visuelle Konsistenz an
- Browser-bewusste Links: Vom Agenten geöffnete URLs werden jetzt in dem Browser gestartet, den Sie in den Einstellungen ausgewählt haben
- Slate Cloud Load: Das Laden eines Slate-Dokuments von Google Drive löst jetzt eine JIT-OAuth-Aufforderung aus, anstatt mit einem kryptischen Fehler fehlzuschlagen
Fehlerbehebungen
- DOCX-Bearbeitung: Regex-Matching für Absatzläufe über verschachtelte Spans hinweg korrigiert, das beim Bearbeiten von formatiertem DOCX-Text zu Inhaltsfehlern führte
- Sicherheit bei Suchen/Ersetzen: Struktureller HTML-Musterschutz wiederhergestellt, der beim Refactoring verloren ging — verhindert, dass Bearbeitungen das interne Markup von XLSX/DOCX beschädigen
- Tool-Genehmigungsschleife: Race-Condition behoben, die wiederholte Genehmigungsaufforderungen für dasselbe Tool innerhalb eines einzelnen Agentenlaufs verursachte
- Veraltete Identität: Fehler behoben, bei dem die veraltete Benutzeridentität bei 401 während der Lizenzsynchronisierung nicht gelöscht wurde, mit Logout-Escape beim Onboarding wiederkehrender Benutzer
Version 0.9.651 (17. Februar 2025)
Neue Funktionen
- Berechtigungen mit minimalen Privilegien: Google Workspace-Tools fordern nun nur noch die exakten Scopes an, die für die jeweilige Aktion erforderlich sind, anstatt umfassenden Zugriff zu verlangen. Das Lesen von E-Mails erfordert nur Lesezugriff; das Erstellen von Terminen erfordert nur Schreibzugriff auf den Kalender.
- Erweiterter Berechtigungsdialog: Der Just-in-Time-Autorisierungsdialog zeigt genau an, welche Berechtigungen angefordert werden, warum sie benötigt werden und ob der Vorgang schreibgeschützt oder Lese-/Schreibzugriff ist.
- Berechtigungsauswahl: Beim manuellen Verbinden eines Google-Kontos können Sie vorab auswählen, welche Dienste (Calendar, Gmail, Drive, Docs, Sheets, Slides) und Zugriffsebenen (schreibgeschützt vs. Lese-/Schreibzugriff) gewährt werden sollen. Schaltfläche „Berechtigungen bearbeiten“ bei bestehenden Verbindungen verfügbar.
- Bild-Ergebnisse: Generierte Bilder und Screenshots werden nun prominent zwischen eingeklappten Prozessschritten und der endgültigen Antwort dargestellt, wodurch das Aufklappen von Tool-Aufrufen zur Ansicht visueller Ausgaben entfällt.
Verbesserungen
- Sicherheit bei Private Sync: Gleichzeitige Bearbeitungen werden nun zum Zusammenführen heruntergeladen statt hochgeladen, die Sperr-Aktualisierung überprüft den Besitz, und die Manifest-Zusammenführung verhindert Datenverlust durch vorzeitige Löschvorgänge.
- P2P Sync entfernt: P2P-Echtzeit-Synchronisierung wurde entfernt, wodurch über 100 MB an unnötigem WebSocket-Traffic eingespart und die Leistung der Erweiterung verbessert wurden.
- Leistung der Einstellungen: Memoization des Einstellungsbereichs und Isolierung des Kontext-Einklappens für schnelleres Rendering.
- DOCX-Rendering: Verbessertes Rendering von Absätzen, Nummerierungen und Stil-Unterstützung im Dokument-Parser.
Fehlerbehebungen
- Google Docs Scope: Fehler „insufficient authentication scopes“ beim Indizieren von Google Docs behoben –
index_documentbenötigte Schreibzugriff für benannte Bereiche. - Google Docs Read: Fehler behoben, bei dem
read_documentundget_document_infofehlschlugen, wenn nur Docs-Scopes gewährt wurden – diese Aktionen benötigen zusätzlich Drive-Lesezugriff. - Calendar Copy: Fehlende
copy_event-Aktion im Scope-Register behoben, was JIT-Berechtigungsanfragen verhinderte. - API Key Persistence: Fehler behoben, bei dem der BYOK API Key stillschweigend verloren ging, wenn
saveCustomModewährend der Aktivierung der Pro-Testversion den Speicherpfad der Einstellungen zum Absturz brachte. - Settings Reload Race: Fehler behoben, bei dem ein nicht gespeicherter API Key gelöscht wurde, wenn das Ein-/Ausklappen von Einstellungsbereichen einen Speicher-Neuladezyklus auslöste.
- Chrome Identity Cancellation: Fehler behoben, bei dem Benutzerabbrüche während inkrementeller Scope-Anfragen nicht von Fehlern unterschieden wurden; die Auth-Methode wechselt nun korrekt nach Erhalt eines Web OAuth Refresh Tokens.
- Private Sync Overwrite: Fehler behoben, bei dem Private Sync aktuelle Turns bei gleichzeitigen Bearbeitungen überschrieb.
- Viewport Screenshots: Anzeige von Viewport-Screenshots über dem endgültigen Antworttext unterbunden.
- Agent Coordination: 7 Probleme bei der Turn-Koordination, Wahrnehmung und Zustandsverwaltung behoben.
- Track Changes: Fehler behoben, bei dem der Modus „Änderungen nachverfolgen“ nach der Slate-Dekomposition aufgrund eines Dual-State-Variablen-Desyncs defekt war.
- File Manager: Lösch- und Download-Aktionen sind nun in allen Modi verfügbar, nicht mehr nur bei verwaisten Dateien.
- MCP Tool Names: Tools korrigiert, die interne Server-IDs anstelle von menschenlesbaren Namen verwendeten.
- Agenda Tool: Fehler behoben, bei dem die Sync-Karte immer fehlende Berechtigungen anzeigte; nun mit dem Google OAuth-Verbindungssystem verknüpft.
Version 0.9.642 (16. Februar 2025)
Verbesserungen
- Erstellung neuer Dokumente: Neue DOCX-, XLSX-, PDF- und RTF-Dateien aus dem „Neue Datei“-Dropdown sind jetzt vollständig bearbeitbar, inklusive Unterstützung für nachverfolgte Änderungen
- Gemini-Stabilität: Erkennung von Wiederholungen bei der Schlussfolgerung hinzugefügt, um Gemini-Denkschleifen automatisch zu unterbrechen und zu verhindern, dass durchgesickerte Denktexte im Chat erscheinen
- Bildverarbeitung: DNG-Rohfoto-Vorschauen berücksichtigen jetzt die EXIF-Ausrichtung für eine korrekte Anzeige und verhindern Verzerrungen bei hochgeladenen Bildern.
Fehlerbehebungen
- Bearbeitbarkeit neuer Dokumente: Fehler behoben, bei dem über „Neue Datei“ erstellte leere Dokumente als statische Vorschauen statt als bearbeitbare Rich-Text-Editoren gerendert wurden
- API-Schlüssel-Erkennung: Der Wechsel zu Ihrem eigenen API-Schlüssel (BYOK) wird jetzt sofort wirksam, ohne dass ein Seiten-Refresh erforderlich ist
- Screenshot-Stabilität: Handhabung der Anhangs-ID korrigiert, um zu verhindern, dass Screenshot-Daten verloren gehen oder beschädigt werden
- Tab-Gruppierung: Absturz behoben, wenn der Browser nicht-normale Fenster (z. B. Devtools, Popups) enthielt
- Konsolen-Rauschen: Unnötiges llms.txt-Probing entfernt, das 404-Fehler verursachte
- Tool-Timeouts: Fragile Keepalive-Workarounds entfernt, die lang laufende Tool-Aufrufe wie die 4k-Bilderzeugung mit Gemini stören konnten
- Prompt-Caching: Fehler behoben, bei dem multimodale Inhalte (Bilder/Screenshots) während der Prompt-Cache-Optimierung verworfen wurden
Intern
- Signifikante Verbesserungen der Codebasis-Qualität in Bezug auf Fehlerbehandlung, Typsicherheit und architektonische Schichtung
- Kern-Dokument-Parser in fokussierte, wartbare Module modularisiert
Version 0.9.641 (14. Februar 2025) - Alles Gute zum Valentinstag!
Verbesserungen
- Modell-Selector Tier-Medaillen: Hardcodierte Empfehlungs-Badges durch 5 API-gesteuerte Tier-Medaillen ersetzt (Best for Caiioo, Qualität, Zuverlässigkeit, Geschwindigkeit, Preis-Leistung), die Gold/Silber/Bronze-Rankings direkt aus Benchmark-Daten anzeigen
- Skills-System: Skills haben jetzt eine Schaltfläche zum Wiederherstellen der Standardwerte, um integrierte Skills wieder hinzuzufügen
- Prompt-Caching: Prompt-Caching zur Kosteneinsparung weiter optimiert
Fehlerbehebungen
- Browser-Kompatibilität: OAuth-Login und automatische Verbindung funktionieren jetzt in Vivaldi und anderen Nicht-Chrome-Browsern
- Kostenverfolgung: Race-Condition behoben, bei der das Abbrechen eines Laufs Kosten- und Nutzungsdaten überschreiben konnte; Kosten-/Nutzungsdaten bleiben nun bei abgebrochenen und fehlerhaften Läufen erhalten
- Private Sync: purgeAllStorage für eine radikale Löschung neu geschrieben, Sync-Listener-Race behoben, private Sync-UI konsolidiert
- i18n: Fehlende Übersetzungsinitialisierung zur conversation.html Popup-Seite hinzugefügt
- Sicherheit: Abhängigkeits-Schwachstellen gepatcht (qs, @casl/ability, axios, markdown-it)
- Benchmarks-Seite: Backend der Benchmarks-Seite auf Cloudflare-Auth migriert
Version 0.9.65 (13. Februar 2025)
Verbesserungen
- MiniMax M2.5 Benchmarks: Vollständige Benchmark-Suite abgeschlossen — Tool-Genauigkeit 91 %, Vertrauenswürdigkeit 95 % (Rang #2), Gesamtrang #5 mit Gold-Wertstufe
- Model Intelligence API: Standard-Antwortlimit von 100 auf 500 erhöht, um sicherzustellen, dass alle Modelle mit verdienten Abzeichen für Clients sichtbar sind
Fehlerbehebungen
- Fehlende Modell-Abzeichen: 35 Modelle mit verdienten Stufen-Abzeichen (Gold/Silber/Bronze), die nicht in der Erweiterungs-Modellliste erschienen, wurden korrigiert — einschließlich Claude Opus 4.6 (Gold-Verbund), Claude Sonnet 4.5 (Silber-Verbund) und Claude Haiku 4.5 (Bronze-Verbund). Ursache: Die API gab standardmäßig nur die 100 nach Vertrauenswürdigkeit sortierten Modelle zurück, aber die Stufen wurden aus allen 367 Modellen berechnet. Bei Modellen außerhalb der Top 100 nach Vertrauenswürdigkeit wurden die Abzeichen stillschweigend entfernt.
Version 0.9.64 (12. Februar 2025)
Verbesserungen
- Ollama Provider Parity: Vollständige Funktionsparität mit OpenRouter — Unterstützung für Abort-Signale, Fehlerbehandlung, Reasoning-Details, aufgelöste Modell-IDs und Verarbeitung von Think-Tags via Streaming-Mixin
- AbortSignal Propagation: Subprocess SIGTERM/SIGINT bricht nun laufende LLM API-Aufrufe ab
- Build-Time Schema Validation: Die Validierung des Einstellungs-Schemas zur Build-Zeit erkennt fehlende
SETTING_METADATA-Einträge - Platform Capabilities Caching: Zwischenspeicherung zur Leistungsoptimierung, anstatt bei jedem Zugriff neu zu berechnen
- Website i18n: Übersetzungen für die Trust-Seite und die Preisgestaltung wurden über alle 22 Sprachversionen hinweg synchronisiert
Fehlerbehebungen
- Website Authentication: Ersetzung der veralteten Supabase-Authentifizierung durch direkte Cloudflare Worker API-Aufrufe für Google-Anmeldung, E-Mail-Login, Registrierung und Passwort-Zurücksetzung
- Stripe Checkout Locale: Fehler „Invalid locale“ beim Checkout und im Portal behoben, indem
navigator.language(z. B.en-US) auf von Stripe unterstützte Locales gemappt wird, mit Fallback aufauto - Password Minimum Length: Synchronisierung der Mindestlänge von 12 Zeichen über Server-Registrierung, Passwort-Zurücksetzung und die Website-Seite zum Zurücksetzen
- Private Sync Profile Dedup: Der Login erkennt und entfernt nun doppelte Profile, die durch frühere Sync-Fehler entstanden sind
- State Manager Init Race: Race Condition bei der Initialisierung im state-manager behoben
- Agent Subprocess Cleanup: Bereinigung von Zombie-Subprozessen bei Agenten-Beendigung
- Tab Group/Storage API Guards: Korrekte Guards für Tab-Gruppen- und Storage-APIs über alle Plattformen hinweg
- Geolocation Error Handling: Fehlerbehandlung bei Geolocation-Berechtigungsfehlern verbessert
- OAuth Refresh Locking: Verhindert gleichzeitige Versuche zur Aktualisierung von OAuth-Tokens
- Settings Save Mutex: Gleichzeitige Speichervorgänge von Einstellungen überschreiben sich nicht mehr gegenseitig
- Agent JSON Parse Isolation: Fehlerhafte Agenten-Ausgaben führen nicht mehr zum Absturz des Parsers
- Thread Search Race: Race Condition bei Thread-Suchergebnissen behoben
- Streaming Version Staleness: Überprüfung auf veraltete Versionen während Streaming-Antworten
- Content Script Timeouts: Timeouts für das Message-Passing von Content-Skripten hinzugefügt
- Context Pruning for Multimodal: Verbessertes Context-Pruning bei Vorhandensein von multimodalem Inhalt
Version 0.9.63 (12. Februar 2025)
Fehlerbehebungen
- Private Sync Modus-Variablen: Migration veralteter Einstellungen behoben, die bei jedem Sync-Zyklus lief und lokale Änderungen (z. B. Modus-Variablen-Änderungen) stillschweigend mit veralteten Drive-Daten überschrieb
Version 0.9.62 (12. Februar 2025)
Neue Funktionen
OpenRouter OAuth One-Click Setup
- PKCE Key Erstellung: Der neue One-Click OpenRouter OAuth Flow ermöglicht es Nutzern, einen API Key zu erstellen und zu verknüpfen, ohne Caiioo zu verlassen.
- Überarbeitetes Onboarding: Optimierte Onboarding- und Upgrade-Flows mit OpenRouter OAuth Integration.
- Datenschutz-Warnung: Die Onboarding-Option für kostenlose Modelle zeigt nun eine klare Warnung bezüglich Datenschutz und Trainingsdaten an.
Granulare Private Sync
- Synchronisierung pro Element: MCP Server, Tool-Freigaben, Profile, Skills, Modi, Overrides und Erinnerungen werden jetzt auf Ebene einzelner Elemente synchronisiert, anstatt ganze Sammlungen zu überschreiben.
- Synchronisierung der Einstellungen pro Key: Einstellungen werden granular pro Key synchronisiert, was verhindert, dass remote durchgeführte Änderungen nicht zusammenhängende lokale Änderungen überschreiben.
- Deduplizierte Lesevorgänge: Laufende WebSocket-Speicherlesevorgänge werden dedupliziert, um unnötigen Netzwerkverkehr zu reduzieren.
Verbesserungen
- Modus-Einstellungen UX: Overrides werden jetzt automatisch gespeichert, und "Standardeinstellungen wiederherstellen" stellt gelöschte Modus-Variablen korrekt wieder her.
- Responsiver Composer: Der Skills-Button wird bei geringer Breite auf ein reines Icon reduziert; der Layout-Abstandshalter im Skills-Bereich wurde entfernt.
- Support-Tickets: Build-Version und Zeitstempel werden nun automatisch beigefügt.
- Slate Suche: Neue Aktion
search_documentzum Slate Tool hinzugefügt.
Fehlerbehebungen
- Google Slides/Sheets OAuth: Wirft nun einen korrekten
OAuthAuthorizationRequiredErroranstatt Setup-Text zurückzugeben, was Just-in-Time-Autorisierung ermöglicht. - Configuration Tool UI Refresh: Agent-Mutationen über das Configuration Tool senden nun
STORAGE_CHANGED, sodass die UI sofort aktualisiert wird. - Tool-Freigabe-Modal: Verletzung der React-Hooks-Reihenfolge behoben (useMemo vor Early Return).
- Localhost HTTPS: Das API Integration Tool unterstützt nun selbstsignierte Zertifikate für lokale HTTPS Server.
- Persistenz von Modus-Variablen: Fehler bei i18n-Getter-Eigenschaften behoben, die vor der Speicherung nicht materialisierten, was dazu führte, dass Variablen beim Neuladen verschwanden.
- Slate Thread-Sicherheit: Race Condition in Slate Tools behoben, die bei parallelen AI-Zügen zu doppelten Slates führte.
- Slate DOCX: Sichtbarkeit von Löschungen und Baseline-Fehler in den Änderungshistorien korrigiert.
- Private Sync Stabilität: "Bouncing" und verschwindende Bearbeitungen durch Synchronisationskonflikte eliminiert.
Version 0.9.61 (10. Februar 2025)
Verbesserungen
Slate Editor i18n
- Übersetzte Symbolleiste & Menüs: Alle Schaltflächen der Slate-Editor-Symbolleiste, Kontextmenüs und Dialog-Strings sind jetzt vollständig übersetzt
Fehlerbehebungen
- OAuth-Fetch-Timeouts: Alle OAuth-Token-Austausch- und Aktualisierungsanfragen haben jetzt ein 15-Sekunden-Timeout, um endlose Hänger bei Netzwerkproblemen zu verhindern
- GitHub Private E-Mail: Fehler bei der GitHub-Verbindung behoben, wenn die Profil-E-Mail des Benutzers privat ist (wird jetzt über die
/user/emailsAPI abgerufen) - OAuth-Verbindungsdialog: OAuth-Verbindungsdialog generalisiert und mehrere Token-/Verbindungsfehler behoben
- Konsistenz der Passwortlänge: 12-Zeichen-Mindestpasswortanforderung über alle Anmelde- und Zurücksetzungsflächen hinweg synchronisiert
Version 0.9.6 (8. Februar 2025)
Neue Funktionen
Internationalisierung (20+ Sprachen)
- Vollständiger i18n-Support: Caiioo ist jetzt in über 20 Sprachen verfügbar, darunter Englisch, Spanisch, Französisch, Deutsch, Japanisch, Koreanisch, Chinesisch, Arabisch, Hebräisch, Hindi und weitere.
- RTL-Sprachunterstützung: Vollständiges Right-to-Left-Layout für Arabisch, Hebräisch und Urdu.
- UI-Spracheinstellung: Wählen Sie Ihre bevorzugte Sprache in den Settings — alle UI-Elemente, Tool-Labels und Statusmeldungen sind übersetzt.
Verbesserungen
Performance des Settings-Panels
- Lazy-Loaded Sections: Abschnitte des Settings-Panels werden jetzt bei Bedarf geladen, was die initiale Render-Zeit verkürzt.
- Modularer Speicher: Settings werden in granularen Schlüsseln pro Abschnitt anstatt in einem einzigen monolithischen Blob gespeichert, was die Lese- und Schreibperformance verbessert.
- Typisierte Getter: Der interne Zugriff auf Settings erfolgt über streng typisierte Getter mit Verfolgung der Änderungsgranularität.
Zuverlässigkeit der Slate-Änderungsverfolgung
- 17 Fixes für den Revision Manager: Umfassende Härtung des Systems zur Änderungsverfolgung in den Bereichen Diff-Berechnung, Annahme, Ablehnung und Persistenz.
- Plain Text Diffing: Redline-Änderungen vergleichen nun Plain Text anstelle von rohem Markdown, was sauberere und präzisere Änderungshervorhebungen erzeugt.
- Persistente Benutzeränderungen: Vom Benutzer vorgenommene nachverfolgte Änderungen bleiben nun auch nach einem Seiten-Refresh erhalten.
- Race Condition Fix: Erzwungenes "Baking" von nachverfolgten Änderungen vor dem Speichern, um Datenverlust zu verhindern.
Fehlerbehebungen
- Service Worker Abstürze: Über 112 dynamische
import()-Aufrufe wurden durch statische Imports ersetzt, um Chrome Service Worker Abstürze zu verhindern. - Mode-Willkommensnachrichten: Probleme mit der Sprache, der Erkennung bereitgestellter Keys und der Persistenz in Mode-Willkommensnachrichten wurden behoben.
- Google Tool Account-Auswahl: Der Account-Picker spiegelt nun dynamisch die tatsächlich verbundenen Accounts wider.
- DOCX Verschachtelte Listen: Anzeige-Marker und Export-Fehler bei Round-Trips von verschachtelten Listen wurden korrigiert.
- LaTeX Math Rendering: Fehler behoben, bei dem das Escaping von Währungs-Dollarzeichen LaTeX-Mathematikausdrücke unterbrach, die mit Zahlen begannen.
- Tab-Gruppen-Erstellung: Die Lazy-Erstellung von Tab-Gruppen wurde verzögert, bis das Web-Browsing-Tool tatsächlich verwendet wird.
- Agenda OAuth: OAuth-Fehler werden nun erneut geworfen (re-throw), damit die Just-in-Time-Autorisierung korrekt ausgelöst wird.
- Settings-Persistenz: Fehlende Metadaten-Einträge für 6 Settings hinzugefügt, bei denen das Speichern lautlos fehlschlug.
Version 0.9.5 (6. Februar 2025)
Sicherheits-Härtung
- Validierung des Content-Script-Ursprungs: Nachrichten von Webseiten an die Erweiterung sind jetzt nur noch auf caiioo.ai-Ursprünge beschränkt, mit strengen Same-Origin-Prüfungen, die Cross-Origin-Message-Injection verhindern
- CSP verschärft: Nur für die Entwicklung gedachte Localhost-Skriptquellen wurden aus der Content Security Policy der Erweiterungsseiten entfernt
- Auth-Response-Scoping: Authentifizierungsantworten der Erweiterung werden jetzt an den spezifischen Seitenursprung gesendet, anstatt an alle Frames übertragen zu werden
Version 0.9.4 (4. Februar 2025)
Neue Funktionen
Mehrsprachige Spracherkennung (Speech-to-Text)
- Sprachauswahl: Wählen Sie Ihre STT-Sprache in den Einstellungen für eine präzise nicht-englische Spracheingabe
- 90+ Sprachen unterstützt: Funktioniert mit Whisper und ElevenLabs für umfassende Sprachabdeckung
Echtzeit-Sprachaktivitätserkennung (VAD)
- VAD mit geringer Latenz: Neue Silero VAD v5-Integration erkennt Sprache in Echtzeit mit minimaler Verzögerung
- Intelligentere Aufnahme: Die Aufnahme startet und stoppt automatisch basierend auf der Sprachaktivität
- Reduzierte Fehlalarme: Bessere Unterscheidung zwischen Sprache und Hintergrundgeräuschen
Umschalter für Vorschlags-Sichtbarkeit
- Vorschläge ausblenden/einblenden: Neuer Umschalter, um KI-Folgevorschläge auszublenden, wenn Sie eine sauberere Oberfläche wünschen
- Persistenter Status: Ihre Präferenz wird gespeichert und sitzungsübergreifend erinnert
Verbesserungen
Track Changes Auto-Bake
- Diff-basiertes Tracking: Effizienteres Änderungs-Tracking unter Verwendung von Diff-Algorithmen
- Auto-Speichern: Änderungen werden regelmäßig gespeichert, um Datenverlust bei langen Bearbeitungssitzungen zu verhindern
- Snapshot beim Beenden: Das Beenden des Track-Changes-Modus übernimmt automatisch alle ausstehenden Änderungen
Erweitertes Provider-Streaming
- Gemini-Verbesserungen: Bessere Streaming- und Reasoning-Fähigkeiten für Google Gemini-Modelle
- Konsistentes Verhalten: Vereinheitlichtes Streaming-Verhalten über OpenRouter und native Provider hinweg
Version 0.9.3 (31. Januar 2025)
Neue Funktionen
Geführte Onboarding-Tour
- Interaktive UI-Tour: Eine neue Schritt-für-Schritt-Anleitung führt neue Benutzer nach Eingabe ihres API-Schlüssels durch alle Teile der Benutzeroberfläche
- Drei Phasen: Deckt den Composer (11 Schritte), das Einstellungs-Panel (7 Schritte) und das Modus-System (5 Schritte) ab
- Spotlight-Effekt: Jeder Schritt hebt das relevante UI-Element mit einem fokussierten Spotlight hervor
- Konversations-Onboarding: KI-gestützter Profilaufbau, um Ihr Erlebnis von Anfang an zu personalisieren
Prompt-Verlauf
- Zugriff auf vorherige Prompts: Ihre letzten Prompts werden gespeichert und können im Composer aufgerufen werden
- Schnelle Wiederverwendung: Vorherige Nachrichten einfach wiederverwenden oder ändern
Ad-Blocker-Stufen
- Granulare Kontrolle: Werbeblockierung unterstützt jetzt mehrere Stufen statt nur Ein/Aus
- Wählen Sie Ihren Schutz: Wählen Sie die Blockierungsstufe, die für Ihre Browsing-Bedürfnisse am besten geeignet ist
DOCX-Review-Toolbar
- Änderungen nachverfolgen: Neue Toolbar beim Anzeigen von Word-Dokumenten mit nachverfolgten Änderungen
- Annehmen/Ablehnen: Dokumentbearbeitungen einfach überprüfen und auflösen
Verbesserungen
Thread-Aufbewahrungseinstellungen
- Konfigurierbare Bereinigung: Legen Sie fest, wie lange alte Threads vor der automatischen Bereinigung aufbewahrt werden sollen
- Speicherverwaltung: Bessere Kontrolle über Ihren Gesprächsverlauf
Caiioo-Animation
- Leistungsoptimierungen: Glattere Animationen mit verbessertem Rendering
- Nässe-Effekte: Neue visuelle Überlagerung, die Wassersättigung anzeigt
- Direktes Partikel-Rendering: Sauberere Optik mit optimierter Partikelzeichnung
Profilwechsel
- Verbesserte Statusverwaltung: Zuverlässigerer Profilwechsel mit verbesserter Protokollhandhabung
- Bessere Synchronisierung: Profiländerungen werden korrekt über die Erweiterung hinweg synchronisiert
Google Calendar
- Token-Management: Verbesserte Handhabung von Zugriffstoken für Kalenderoperationen
- Zuverlässigere Synchronisierung: Besserer OAuth-Flow für die Kalenderintegration
Version 0.9.2 (26. Januar 2025)
Neue Funktionen
Werbe- & Tracker-Blockierung
- Integrierter Ad-Blocker: Blockieren Sie Werbung und Tracker mit der Ghostery-Engine über MV3-kompatibles declarativeNetRequest
- Umschalten in den Einstellungen: Aktivieren oder deaktivieren Sie die Werbeblockierung im Einstellungs-Panel
- Filterlisten-Updates: Automatisches Caching von Filterlisten für zuverlässiges Blockieren
Just-in-Time Google-Berechtigungen
- Inkrementelle Autorisierung: Berechtigungen für Google-Tools werden jetzt nur bei Bedarf angefordert, nicht im Voraus
- Klareres Scope-Management: Fehlende Scopes lösen hilfreiche Fehlermeldungen mit Optionen zur Zugriffsgewährung aus
- Besserer Datenschutz: Fordern Sie nur die spezifischen Google-Scopes an, die für jedes Tool erforderlich sind
Verbesserungen
Caiioo-Animation
- Verbesserte Physik: Optimierte Partikeldynamik mit besseren Höhen-, Geschwindigkeits- und Dichtekräften
- Flüssigerer Fluss: Partikel folgen beim Erscheinen der Kanalrichtung, was Klumpenbildung reduziert
- Realistisches Stapeln: Partikel stapeln sich natürlich, wenn sie durch Kieselsteine oder Dämme blockiert werden
Google OAuth-Flow
- Schnellere Anmeldung: Priorisiert jetzt den Abruf von ID-Token für eine schnellere Authentifizierung
- Verbesserte Zuverlässigkeit: Bessere Token-Handhabung reduziert Authentifizierungsfehler in Nicht-Chrome-Browsern
Onboarding & Einstellungen
- Vorschau-Modus: Testen Sie Onboarding-Flows, ohne Benutzerdaten zu löschen
- Sauberer Free-Tier: Veraltete UI zur Wiederherstellung bereitgestellter API-Schlüssel entfernt
Internes
- Minispiel-System: Neue MinigameContainer-Infrastruktur für interaktive Intro-Erlebnisse
- Verstecktes Easter Egg: Sichtbarkeitsstatus des Minispiels bleibt über Sitzungen hinweg erhalten
Version 0.9.1 (25. Januar 2025)
Neue Funktionen
Interaktive Wassersimulation
- Caiioo Intro: Neue interaktive Fluidsimulation auf dem Ladebildschirm – beobachten Sie, wie Wasser durch einen dynamischen S-förmigen Kanal fließt
- Ziehbare Kieselsteine: Bewegen Sie Kieselsteine, um den Wasserfluss umzuleiten und Dämme zu bauen
- Sedimentdynamik: Realistische Erosion und Ablagerung – schnelles Wasser nimmt Sedimente auf, langsames Wasser lagert sie ab
- Theme-Adaptiv: Die Wasserfarben passen sich automatisch dem Farbton Ihres gewählten Themes an
Unterstützung für Vega/Vega-Lite Diagramme
- Interaktive Visualisierungen: Anzeigen und Bearbeiten von Vega und Vega-Lite Diagrammen direkt in Slate
- Datenvisualisierung: Erstellen Sie Balkendiagramme, Liniendiagramme, Streudiagramme und komplexe mehrschichtige Visualisierungen
- Spec-Bearbeitung: Bearbeiten Sie die JSON-Spezifikation und sehen Sie Änderungen in Echtzeit gerendert
Unterstützung für Mermaid Diagramme
- Diagrammtypen: Erstellen Sie Flussdiagramme, Sequenzdiagramme, Klassendiagramme, Zustandsdiagramme und mehr
- Live-Vorschau: Bearbeiten Sie die Mermaid-Syntax mit sofortiger visueller Vorschau
- Export-Optionen: Diagramme werden als SVG gerendert für eine gestochen scharfe Ausgabe in jeder Größe
Vorlagen für die Dateierstellung
- Schnellerstellungs-Menü: Neues Dropdown-Menü beim Erstellen von Dateien in Slate mit Vorlagen für gängige Dateitypen
- Vorlagen-Kategorien: Markdown, Code-Dateien, Datenformate, Diagramme und mehr
- Ein-Klick-Start: Starten Sie direkt in ein neues Dokument mit der richtigen Struktur
Verbesserungen
API-Fehlerbehandlung
- Visuelle Benachrichtigungen: API-Fehler werden jetzt als schließbare Toast-Benachrichtigungen angezeigt
- Automatisches Schließen: Nicht-kritische Fehler (wie Abbrüche) werden nach einigen Sekunden automatisch ausgeblendet
- Klarere Meldungen: Bessere Fehlermeldungen helfen dabei, Probleme schneller zu identifizieren und zu lösen
Plattform-Funktionen
- Intelligente Feature-Erkennung: Funktionen, die spezifische Plattformen erfordern (wie Apple Calendar auf macOS), werden jetzt automatisch erkannt
- Sichere Fallbacks: Tools passen sich an Ihre Umgebung an, anstatt lautlos fehlzuschlagen
- Verbesserungen der Apple-Tools: Apple Reminders unterstützt jetzt Aktionen zum Aufheben der Erledigung und Listen-Aktionen
Safari & Nicht-Chrome Browser
- Besserer OAuth-Flow: Verbesserte Browser-Erkennung für den Google-Login
- Fallback-Mechanismus: Nicht-Chrome Browser verfügen nun über einen zuverlässigeren Authentifizierungspfad
Version 0.9.0 (22. Januar 2025)
Neue Funktionen
Automatische Datenbereinigung
- Speicherverwaltung: Alte Threads und Anhänge werden automatisch basierend auf Ihren Aufbewahrungspräferenzen bereinigt
- Konfigurierbare Richtlinien: Legen Sie fest, wie lange Daten vor der automatischen Bereinigung aufbewahrt werden
GitHub-Sync
- Backup auf GitHub: Synchronisieren Sie Ihre Caiioo-Daten mit einem GitHub-Repository für Backups und geräteübergreifenden Zugriff
- Intelligente Konfliktlösung: Änderungen von mehreren Geräten werden automatisch ohne Datenverlust zusammengeführt
- Selektive Synchronisierung: Steuern Sie mit Mustern im
.gitignore-Stil, welche Daten synchronisiert werden
GitHub-Tool
- KI-GitHub-Integration: Die KI kann jetzt in Ihrem Namen mit GitHub interagieren – Issues erstellen, Repositories durchsuchen, Pull-Requests verwalten und mehr
- Repository-Browsing: Lassen Sie die KI Codebasen erkunden, Dateien finden und Projektstrukturen verstehen
Verbesserungen
Browser-Automatisierung
- Verbesserte Seiteninteraktion: Zuverlässigeres Klicken, Scrollen und Ausfüllen von Formularen auf komplexen Webseiten
- Intelligentere Tool-Auswahl: Die KI wählt jetzt präziser die richtigen Tools für jede Aufgabe aus
Dokumentenhandhabung
- Bessere Word-Dokumente: Verbesserte Handhabung von Tabellen, Listen und Formatierungen in DOCX-Dateien
- Google Slides: Mehr Kontrolle über Folienformatierung, Formen und Layouts
Einstellungen & UI
- Erweitertes Einstellungs-Panel: Mehr Konfigurationsoptionen mit besserer Organisation
- Verbesserte Thread-Liste: Besseres Sortieren und Filtern Ihrer Gespräche
- Standortberechtigung: Klarerer Ablauf bei der Gewährung des Standortzugriffs für standortbasierte Abfragen
Version 0.8.9 (19. Januar 2025)
Neue Funktionen
Google Slides-Integration
- KI-gestützte Präsentationen: Das neue Google Slides-Tool ermöglicht es der KI, Folienpräsentationen zu erstellen, zu lesen und zu bearbeiten
- Volle Folienkontrolle: Erstellen Sie Folien, fügen Sie Textfelder, Bilder, Formen und Tabellen hinzu
- Vorlagenunterstützung: Verwenden Sie integrierte Vorlagen oder arbeiten Sie mit leeren Präsentationen
- Kollaborative Bearbeitung: Funktioniert mit Ihrer bestehenden Google-Konto-Verbindung
Verbesserungen
Code-Qualität
- TypeScript-Korrekturen: Typfehler und ungenutzte Importe in der gesamten Codebasis bereinigt
- Testabdeckung: Test-Fixtures aktualisiert, um den aktuellen Typdefinitionen zu entsprechen
Version 0.8.8 (17. Januar 2025)
Neue Funktionen
Resemble.ai Text-to-Speech
- Professionelle Sprachsynthese: Neue Resemble.ai-Integration für hochwertige KI-Sprachgenerierung
- Streaming-Audio: Echtzeit-Audio-Streaming für reaktionsschnelle Sprachausgabe
- Konfigurierbare Stimmen: Wählen Sie aus mehreren professionellen Sprachoptionen
- Kürzungswarnungen: Klares Feedback, wenn langer Text für die Synthese gekürzt wird
Kalender-Synchronisierungsdienst
- Hintergrund-Synchronisierung: Automatische Kalendersynchronisierung mit Google Kalender
- Inkrementelle Updates: Nur geänderte Ereignisse werden zur Effizienzsteigerung synchronisiert
- Alarm-basierte Planung: Zuverlässige Synchronisierungsplanung mit Chrome-Alarmen
Verbesserungen
Desktop-App (Electron)
- Wake-Erkennung: Das System erkennt jetzt, wenn Ihr Mac aus dem Ruhezustand aufwacht und aktualisiert OAuth-Tokens automatisch
- Verbesserte Zuverlässigkeit: OAuth-Verbindungen bleiben auch nach längerem Ruhezustand frisch
Rich-Composer-Eingabe
- Erweiterte Komposition: Verbesserte Nachrichteneingabe mit besserer Formatierungsunterstützung
- Tab-Autovervollständigung: Reaktionsschnellere Tab-Referenzvorschläge
Version 0.8.71 (15. Januar 2025)
Neue Funktionen
Thread-Suche
- Durchsuchen Sie Ihre Konversationen: Neues Suchfeld in der Thread-Liste, um Threads schnell anhand von Titel oder Inhalt zu finden
- Sofortige Filterung: Geben Sie Text ein, um zu filtern – passende Threads erscheinen sofort mit Suchhervorhebung
- Smart Debouncing: Die Suche ist optimiert, um auch bei Hunderten von Threads nicht zu verzögern
Physik-Simulations-Tool
- KI-gestützte Physik: Neues Physik-Tool ermöglicht es der KI, physikalische Berechnungen und Simulationen durchzuführen
- Wurfbewegungen: Berechnen Sie Flugbahnen, sagen Sie Kollisionen voraus und lösen Sie Bewegungsprobleme
- Strukturanalyse: Analysieren Sie Spannungen, Balkenbiegung, Knicken und die Stabilität von Strukturen
- Materialeigenschaften: Integrierte Datenbank gängiger technischer Materialien (Stahl, Aluminium, Holz, Beton usw.)
- Physikalische Formeln: Berechnungen zu kinetischer Energie, Impuls, Kraft und Stoß
Verbesserungen am Cairn World Builder
- Physik-Engine: Vollständige Rapier3D-Physik-Integration für realistische Simulationen
- Gelenke & Einschränkungen: Erstellen Sie Scharniere, Schieberegler, Kugelgelenke und feste Verbindungen zwischen Körpern
- Sensoren & Trigger: Definieren Sie Sensorbereiche, die erkennen, wenn Objekte eintreten oder austreten
- Character Controller: First-Person-Charakter mit Schwerkraft, Springen und Kollisionsreaktion
- Spielmodus: Echtzeit-Physik mit festem Zeitschritt für interaktive Erkundungen
Verbesserungen
Private Sync v2
- Inkrementelle Synchronisierung: Jeder Thread und Anhang wird jetzt einzeln synchronisiert, anstatt als eine große Datei
- Schnellere Synchronisierung: Nur geänderte Elemente werden hochgeladen, was die Synchronisierungszeit für große Bibliotheken drastisch reduziert
- Bessere Konfliktlösung: Vektorkuhren pro Element ermöglichen eine präzisere Zusammenführungsauflösung
- Reduzierte API-Aufrufe: Intelligentes Diffing bedeutet weniger Google Drive API-Anfragen
Synchronisierungszuverlässigkeit
- Parität zwischen Erweiterung und Server: Speicherung von Anhängen korrigiert, um Vektorkuhren auf beiden Plattformen korrekt nachzuverfolgen
- Tombstone-Filterung: Gelöschte Profile werden jetzt sowohl in der Erweiterung als auch auf dem Server korrekt ausgeblendet
Version 0.8.70 (14. Januar 2025)
Neue Funktionen
Private Sync (GRATIS-Stufe)
- Geräteübergreifende Synchronisierung: Synchronisiere deine Threads, Einstellungen und Anhänge über alle deine Geräte via Google Drive
- Ende-zu-Ende-Verschlüsselung: Alle synchronisierten Daten werden mit deiner Passphrase verschlüsselt, bevor sie dein Gerät verlassen
- Automatische Hintergrund-Synchronisierung: Änderungen werden alle 30 Sekunden mit intelligentem Debouncing synchronisiert
- Konfliktlösung: CRDT-basierte Vektorkuhren stellen sicher, dass Änderungen geräteübergreifend korrekt zusammengeführt werden
Verbesserungen
Private Sync Effizienz
- Reduziertes Polling: Sync-Intervall von 3s auf 30s erhöht, um API-Aufrufe zu reduzieren
- Intelligentes Debouncing: Wartet 10 Sekunden nach Abschluss der Änderungen vor der Synchronisierung
- In-Flight-Schutz: Threads, die aktiv von der KI verarbeitet werden, sind bis zum Abschluss von der Synchronisierung ausgeschlossen
Version 0.8.69 (14. Januar 2025)
Neue Funktionen
Slate-Revisionsnavigation
- Zwischen Änderungen navigieren: Neue Navigationstasten, um im Editor zwischen ausstehenden Revisionsabschnitten zu springen
- Änderungszähler: Visuelle Anzeige der aktuellen Position (z. B. „2 von 5“) innerhalb der ausstehenden Revisionen
- Tastaturkürzel: Verwenden Sie Alt+Pfeil hoch/runter, um schnell zwischen Abschnitten zu navigieren, ohne die Tastatur zu verlassen
Verbesserungen
Dokumentenverarbeitung
- Remote-OCR-Fallback: Wenn die lokale PDF-Textextraktion fehlschlägt oder schlechte Ergebnisse liefert, werden Dokumente für eine verbesserte Genauigkeit automatisch per Cloud-OCR verarbeitet
- Verarbeitungsstatus: Echtzeit-Feedback zeigt an, wenn Dokumente remote verarbeitet werden
Unterstützung für Reasoning-Modelle
- Multi-Turn Reasoning: Besseres Caching von Reasoning-Details über Konversationsverläufe hinweg, was die Kontinuität bei Modellen mit erweitertem Denken verbessert
- Sauberere Nachrichten: Interne Systemnotizen werden jetzt aus gerenderten Nachrichten entfernt, um Instruction Leakage zu verhindern
Version 0.8.68 (11. Januar 2025)
Neue Funktionen
Langzeitgedächtnis
- Kontext-Persistenz: Die KI behält nun ein Langzeitgedächtnis über Konversationen hinweg bei und merkt sich wichtigen Kontext zu Ihren Präferenzen und Workflows
- Nutzungsverfolgung: Verbesserte Nachverfolgung von Token-Nutzung und Kosten mit detaillierter Protokollierung
Modellintelligenz
- Intelligente Modellauswahl: Neue Funktionen zur Modellintelligenz helfen dabei, optimale Modelle basierend auf Ihren Nutzungsmustern zu identifizieren
- Ranking-System: Modelle werden nach Leistungs- und Wertmetriken bewertet
Verbesserungen
Speicherzuverlässigkeit
- Plattformübergreifender Speicher: Modell-Cache, Tool-Freigaben und gelernte Seiten funktionieren jetzt zuverlässig über Erweiterungs-, Server- und LAN-Modi hinweg
- Authentifizierungs-Timeout: Behobener potenzieller Hänger bei der Verbindung zum Relay-Server – bricht nun nach 5 Sekunden sauber ab, anstatt unbegrenzt zu warten
- Ladegeschwindigkeit der Einstellungen: Einstellungen und Modellauswahl laden nach einem Neuladen der Erweiterung schneller
Inhalts-Paginierung
- Korrekte Seitengröße: Webseiteninhalte werden jetzt basierend auf dem tatsächlichen Kontextfenster des Modells (z. B. 131k Token) aufgeteilt, nicht mehr nach einem fest codierten Standard. Das bedeutet, Sie sehen größere Seitenabschnitte und weniger Seiten bei Modellen mit hohem Kontext.
Fehlerbehebungen
- API-Key-Persistenz: Problem behoben, bei dem der OpenRouter API-Key nach kurzem Aktivieren und anschließendem Deaktivieren des LAN-Modus „vergessen“ wurde
Version 0.8.67 (7. Januar 2025)
Neue Funktionen
Kokoro TTS – Lokale neuronale Text-to-Speech
- Hochwertige Stimmen: Kokoro ist ein lokales neuronales TTS-Modell mit natürlich klingender Sprache in mehreren Stimmen
- Kein API-Key erforderlich: Läuft vollständig auf dem Gerät mittels WebGPU/WASM – keine Cloud-Dienste oder API-Keys nötig
- Mehrere Stimmen: Wählen Sie aus amerikanischen, britischen und anderen Akzentoptionen mit männlichen/weiblichen Varianten
- Unterstützung für lange Texte: Verarbeitet lange Texte korrekt durch Streaming-Synthese – keine Abbrüche mehr nach 30 Sekunden
- Saubere Sprache: Entfernt automatisch Markdown-Formatierungen (fett, kursiv usw.) vor der Sprachausgabe
Verbesserungen
Spracheinstellungen
- Vereinigter Sprachbereich: TTS- und STT-Einstellungen in einem übersichtlicheren Layout zusammengefasst
- Sprachvorschau: Ausgewählte Stimme vor der Verwendung testen
Version 0.8.66 (7. Januar 2025)
Verbesserungen
Suche im Einstellungsbereich
- Filtersuche: Neues Suchfeld oben in den Einstellungen, um Bereiche schnell nach Schlüsselwörtern zu filtern
- Sofortige Ergebnisse: Tippen zum Filtern – passende Bereiche erscheinen sofort
- Tastaturfreundlich: Die Suche erhält beim Öffnen der Einstellungen automatisch den Fokus
MCP-Server-Zuverlässigkeit
- Start-Verifizierung: MCP-Server werden jetzt vor der Erfolgsmeldung auf ihre Ausführung geprüft
- Bessere Fehlermeldungen: Wenn MCP-Server beim Start abstürzen, wird der tatsächliche Fehler anstelle eines allgemeinen Fehlers angezeigt
- Korrigierte Beispiele: Beispiel-Paketnamen korrigiert, um
@modelcontextprotocol/server-*(nicht@anthropic/mcp-server-*) zu verwenden
macOS App-Authentifizierung
- Selbstvalidierende Tokens: 401-Fehler beim Hinzufügen von MCP-Servern vor der WebSocket-Status-Synchronisierung behoben
- Schnellere Authentifizierung: HTTP-Endpunkte erfordern kein Warten mehr auf die WebSocket-Verbindung
Version 0.8.65 (6. Januar 2025)
Neue Funktionen
ElevenLabs Sprachintegration (BYOK)
- Cloud TTS: Hochwertige Text-zu-Sprache mit ElevenLabs – wählen Sie aus mehreren Stimmen und Modellen
- Cloud STT: Scribe-Transkription mit Echtzeit-Streaming (~150ms Latenz) und Unterstützung für über 90 Sprachen
- Sprachauswahl: Durchsuchen und wählen Sie Stimmen aus der ElevenLabs-Bibliothek direkt in den Einstellungen
- Modelloptionen: Wählen Sie zwischen Flash v2.5 (ultraschnell ~75ms), Turbo v2.5 oder Multilingual v2 (beste Qualität)
- Eigener Schlüssel: Verwendet Ihren ElevenLabs-API-Schlüssel – keine zusätzlichen Kosten durch Caiioo
Mehrsprachiges Whisper-Modell
- Whisper Tiny Multilingual: Neue lokale STT-Option, die 99 Sprachen unterstützt (~39MB Download)
- Gleiche Größe wie Englisch: Dieselbe kompakte Größe von 39MB wie Whisper Tiny English
- Spracherkennung: Erkennt automatisch die gesprochene Sprache
Google Docs Verbessertes Lesen & Schreiben
- Markdown als Standard: Text wird beim Schreiben jetzt standardmäßig als Markdown formatiert. Verwenden Sie
useMarkdown: falsefür Nur-Text-Einfügungen, die bestehende Formatierungen beibehalten. - Reichhaltige Formatierung: Konvertiert Markdown-Überschriften, Fett, Kursiv, Durchgestrichen und Links in native Google Docs-Stile
- Listen & Tabellen: Unterstützt geordnete/ungeordnete Listen mit Verschachtelung und Markdown-Tabellen
- Vorschlagsverfolgung: Ausstehende Vorschläge werden mit semantischen Tags angezeigt:
<ins>hinzugefügter Text</ins>für Einfügungen,<del>entfernter Text</del>für Löschungen. Benachbarte Tags zeigen Ersetzungen an. - Inline-Kommentare: Kommentare erscheinen inline mit Autorenangabe:
<comment author=\"Name\" on=\"zitierter Text\">Inhalt</comment>mit verschachtelten<reply>-Tags für Threads
Verbesserungen
Gemini Extended Thinking
- Verbesserte Thought-Signatures: Bessere Handhabung von Geminis thought_signature über Streaming-Chunks hinweg, was die Kontinuität beim erweiterten Denken mit mehrstufiger Tool-Nutzung verbessert
Version 0.8.64 (5. Januar 2025)
Neue Funktionen
Google Sheets Zell-Metadaten
- Hyperlinks & Notizen lesen: Verwenden Sie
includeMetadata: true, um Hyperlinks, Notizen und Datenvalidierungsregeln aus Zellen abzurufen - Hyperlinks hinzufügen: Neue
update_cell_metadata-Aktion zum Hinzufügen anklickbarer Hyperlinks mit benutzerdefiniertem Anzeigetext - Notizen hinzufügen: Programmgesteuertes Anhängen von Notizen/Kommentaren an Zellen
- Datenvalidierung: Erstellen Sie Dropdowns, Zahlenbereiche, Textvalidierungen und benutzerdefinierte Formelregeln für Zellen
Safari Tiling (macOS)
- Intelligente Fensterpositionierung: Beim Öffnen von Links aus dem Seitenpanel positionieren sich Safari-Fenster automatisch neben dem Seitenpanel für einfaches Browsen nebeneinander
- Bildschirmplatz-Optimierung: Die Tiling-Logik berechnet die optimale Safari-Platzierung basierend auf dem verfügbaren Bildschirmplatz
- Neuanordnung bei Moduswechsel: Safari-Fenster positionieren sich automatisch neu, wenn das Seitenpanel den Modus wechselt
Kopieren/Einfügen im macOS-Seitenpanel
- Vollständige Unterstützung für Kopieren/Einfügen: Kopieren und Einfügen funktioniert jetzt zuverlässig in der macOS-Seitenpanel-App
- System-Tastaturkürzel: Standardmäßige ⌘C/⌘V-Kürzel funktionieren wie erwartet
Verbesserungen
macOS Server-Zuverlässigkeit
- Signalverarbeitung: Verbesserte Verarbeitung von Pipe-Signalen, um unerwartete App-Beendigungen zu verhindern
- Neustart-Zuverlässigkeit: Server-Stopp- und Neustartvorgänge sind jetzt zuverlässiger mit ordnungsgemäßer Bereinigung
- Verbindungsstabilität: Bessere Handhabung der OAuth-Token-Aktualisierung mit Wiederholungslogik und exponentiellem Backoff
Safari Extension
- Stabile Browser-IDs: Die Safari Extension generiert jetzt stabile Browser-IDs, um doppelte Einträge bei Wiederverbindungen zu verhindern
- Sauberere Wiederverbindung: Die serverseitige Browser-Registrierung verwendet vom Client bereitgestellte stabile IDs für eine sauberere Handhabung der Wiederverbindung
Modellauswahl
- Zum Ausgewählten scrollen: Beim Öffnen des Modell-Dropdowns wird jetzt automatisch zum aktuell ausgewählten Modell gescrollt
Tab-Referenzen in der macOS App
- Funktioniert im Seitenpanel: Tab-Referenzen und Kontext funktionieren jetzt im nativen macOS-Seitenpanel, nicht nur in der Chrome Extension
Version 0.8.63 (31. Dezember 2025)
Neue Funktionen
Sprachausgabe (Text-to-Speech)
- Vorlesen: KI-Antworten können jetzt mit Microsoft Edge TTS vorgelesen werden
- Auto-Play-Option: Automatisches Vorlesen neuer KI-Antworten in den Einstellungen aktivieren
- Geschwindigkeitsregelung: Wiedergabegeschwindigkeit von 0,5x bis 2x anpassen
- Pause/Fortsetzen: Steuerung der Wiedergabe über Pause- und Fortsetzen-Schaltflächen bei jeder Nachricht
Lokale Spracherkennung (Whisper)
- Whisper-Upgrade: Nutzen Sie die lokale Whisper-Transkription für präzisere Spracheingaben
- Modell-Download: Laden Sie das Whisper Tiny-Modell (~40MB) für die Offline-Nutzung herunter
- Datenschutz: Audio wird lokal verarbeitet und niemals an externe Server gesendet
- Fallback: Rückfall auf die Web Speech API, falls Whisper nicht verfügbar ist
Einheitliches Agenda-Tool
- Einzelnes Tool: Das neue
agenda-Tool bündelt Kalender- und Erinnerungsfunktionen - Multi-Provider: Funktioniert mit Google Calendar, Apple Calendar, Apple Reminders und caiioo-Erinnerungen
- Einfacher für Agents: Eine einheitliche Tool-Schnittstelle für alle Planungsanforderungen
Verbesserungen
Einstellungsmenü
- Permanenter Status: Der Status (offen/geschlossen) von Abschnitten wird jetzt über Sitzungen hinweg gespeichert
- Spracheinstellungen: Neuer Bereich zur Konfiguration von TTS- und STT-Präferenzen
Version 0.8.62 (31. Dezember 2025)
Neue Funktionen
DOCX-Listenunterstützung
- Nummerierte Listen: Word-Dokumente mit nummerierten Listen werden jetzt korrekt mit der richtigen Formatierung gerendert
- Aufzählungslisten: Aufzählungspunkte bleiben erhalten und werden präzise angezeigt
- Verschachtelte Listen: Die Einrückung mehrstufiger Listen bleibt in der HTML-Vorschau erhalten
CSV-Export für Tabellenkalkulationen
- Export als CSV: XLSX-Dateien können jetzt zur einfachen Datenextraktion als CSV exportiert werden
- Formatwahl: Wählen Sie beim Herunterladen von Tabellenanhängen zwischen XLSX oder CSV
Version 0.8.61 (30. Dezember 2025)
Neue Funktionen
Tool-Genehmigungsworkflow
- Interaktive Genehmigung: Bestimmte Tools erfordern nun vor der Ausführung eine Benutzergenehmigung – Sie sehen ein modales Fenster, in dem Sie die Aktion genehmigen oder ablehnen können
- Statusverfolgung: Tool-Ausführungen zeigen nun in der Zeitleiste die Zustände „ausstehende Genehmigung“ und „abgelehnt“ an
- Standardmäßig sicher: Sensible Vorgänge warten auf die ausdrückliche Zustimmung des Benutzers, bevor sie fortfahren
Variable für den aktuellen Standort
- {{currentLocation}}: Neue Variable zum Hinzufügen Ihres aktuellen Standortkontexts zu Prompts
- Geolokalisierungsberechtigung: Erfordert bei der ersten Verwendung die Geolokalisierungsberechtigung des Browsers
- Kontextbezogen: Ideal für standortbezogene Anfragen wie „Restaurants in meiner Nähe“ oder Reiseplanung
Batch-Thread-Verwaltung
- Mehrfachauswahl-Modus: Aktivieren Sie den Auswahlmodus, um mehrere Threads gleichzeitig auszuwählen
- Batch-Löschung: Löschen Sie ausgewählte Threads mit einer einzigen Aktion
- Batch-Archivierung/Export: Archivieren oder exportieren Sie mehrere Threads gleichzeitig
Bildbetrachter in Slate
- Dedizierter Betrachter: Bilder öffnen sich nun in einem Vollbild-Betrachter innerhalb von Slate
- Zoom-Steuerung: Vergrößern/Verkleinern und Verschieben bei großen Bildern
- Download-Option: Schnelle Download-Schaltfläche zum lokalen Speichern von Bildern
Verbesserungen
Anzeige von Überlegungen (Reasoning)
- Bessere Aggregation: Denk-/Überlegungsblöcke von Modellen werden nun korrekt und ohne Duplizierung zusammengeführt
- Sauberere Anzeige: Überlegungsinhalte von Modellen mit erweitertem Denken werden zuverlässiger angezeigt
Ollama-Integration
- Streaming von Überlegungen: Echtzeit-Streaming von Überlegungs-/Denkinhalten von lokalen Ollama-Modellen
- Bessere Modellhandhabung: Verbesserte Kompatibilität mit Mistral-Modellen und strikten Anforderungen an die Nachrichtenreihenfolge
Anhangsverwaltung
- Bereinigung verwaister Dateien: Neuer Dialog in den Einstellungen zur Verwaltung verwaister Anhänge, die mit keinem Thread verknüpft sind
- Thread zuweisen: Verschieben Sie verwaiste Anhänge in bestehende Threads
- Massenlöschung: Bereinigen Sie verwaiste Dateien, um Speicherplatz freizugeben
Slate-Standardeinstellungen
- Standardmäßig Markdown: Beim Erstellen eines neuen Slate ohne Angabe des Typs ist Markdown (.md) nun das Standardformat
Version 0.8.6 (19. Dezember 2025)
Neue Funktionen
Warte-Aktion für Browser-Automatisierung
- Diskrete Warte-Typen: Neue
wait-Aktion in der Browser-Automatisierung mit 4 spezialisierten Warte-Modi:timeout- Einfache Verzögerung (Standard 1000ms, max 30000ms) für grundlegendes Timingselector- Warten, bis ein Element erscheint oder verschwindet (nützlich für Spinner/Lader)network_idle- Warten, bis Fetch/XHR-Anfragen abgeschlossen sind (nur Erweiterung)animation- Warten, bis CSS-Animationen und Übergänge abgeschlossen sind
- Intelligente Element-Sichtbarkeit: Die Selektor-Wartefunktion prüft Anzeige, Sichtbarkeit, Deckkraft und offsetParent für eine genaue Sichtbarkeitserkennung
Verbesserungen
Architektur der Browser-Automatisierung
- Einheitliche Skriptausführung: Neue
executeInPage-Abstraktion stellt konsistentes Verhalten über Chrome-Erweiterungs- und Relay/Server-Kontexte hinweg sicher - MAIN World-Ausführung: Korrekte MAIN-World-Skriptausführung für Operationen, die JavaScript auf Seitenebene abfangen müssen (fetch, XHR)
- Graceful Degradation: Funktionen, die nur in der Erweiterung verfügbar sind, bieten jetzt hilfreiche Fehlermeldungen mit Alternativen, wenn sie im Relay-Modus verwendet werden
Fehlerbehebungen
OAuth-Token-Aktualisierung
- Chrome-Erweiterung Token-Aktualisierung: Problem mit veralteten Tokens behoben, bei dem die zwischengespeicherten OAuth-Tokens von Chrome nicht ordnungsgemäß aktualisiert wurden. Tokens werden jetzt verifiziert und veraltete Tokens vor einem erneuten Versuch gelöscht.
- PKCE-Autorisierungsfluss: Das OAuth-Popup verwendet jetzt den Autorisierungscode-Fluss mit PKCE anstelle des impliziten Flusses, was eine ordnungsgemäße Unterstützung von Refresh-Tokens ermöglicht, ohne ein Client-Secret zu erfordern.
- Direkte Token-Aktualisierung: Verbindungen mit Refresh-Tokens können jetzt direkt über den Token-Endpunkt von Google aktualisiert werden, ohne einen Backend-Server zu erfordern.
- Token-Validierung: Schritt zur Token-Verifizierung hinzugefügt, um widerrufene/ungültige Tokens frühzeitig zu erkennen und eine automatische erneute Authentifizierung auszulösen.
Version 0.8.5 (19. Dezember 2025)
Neue Funktionen
Apple Calendar Integration
- Nativer Kalenderzugriff: Das neue Apple Calendar-Tool bietet schnellen, nativen Zugriff auf Ihre macOS-Kalender via EventKit
- Einheitliche Agenda: Kombinierte Ansicht von Erinnerungen und Kalenderereignissen aller verknüpften Konten (Google Calendar + Apple Calendar)
- Multi-Account-Unterstützung: Ereignisse aus mehreren Google Calendar-Konten und Apple-Kalendern gleichzeitig abrufen
Gelernte Seiten
- Intelligentes Seitenlernen: Bringen Sie Caiioo die Struktur spezifischer Websites bei
- URL-Mustererkennung: Gelernte Muster werden automatisch auf ähnliche Seiten derselben Website angewendet
- DOM-Snapshot-Speicherung: Erfasste Seitenstrukturen helfen der KI, komplexe Web-Apps besser zu verstehen und mit ihnen zu interagieren
RTF-Dokumentunterstützung
- Rich-Text-Bearbeitung: RTF-Dokumente (Rich Text Format) direkt in Slate hochladen und bearbeiten
- Bidirektionale Konvertierung: Konvertierung zwischen RTF und HTML unter Beibehaltung der Formatierung
- Export-Optionen: Bearbeitete Dokumente als RTF für die Verwendung in Pages, Word oder anderen Textverarbeitungsprogrammen herunterladen
Verbesserungen
Sicherheit der Desktop-App
- Relay-Authentifizierung: Sichere HMAC-SHA256-Authentifizierung zwischen Erweiterung und Desktop-Server
- Benutzerspezifische Token: Authentifizierungs-Token sind jetzt für Multi-User-Sicherheit an die Benutzeridentität gebunden
- Geschützte Endpunkte: Alle sensiblen API-Endpunkte erfordern nun eine Authentifizierung
Leistung
- Swift-Helfer: Native Swift-Binärdateien für Apple Reminders, Calendar und Notes bieten 10x schnelleren Zugriff als AppleScript
- Direktaufrufe: Im Desktop-Kontext umgehen Apple-Tools das HTTP-Relay für geringere Latenz
- Gemeinsame Utilities: Ein konsolidierter Relay-API-Client eliminiert Code-Duplizierung
Fehlerbehebungen
- Kalender-Deduplizierung: Ereignisse, die in mehreren Kalendern erscheinen, werden in der einheitlichen Ansicht nun korrekt zusammengeführt
- Prompt-Caching: Fehler behoben, bei dem Cache-Control-Marker während der Token-Schätzung entfernt wurden
Version 0.8.45 (18. Dezember 2025)
Neue Funktionen
- Bild-Deduplizierung: Wenn Sie dasselbe Bild mehrfach in einer Unterhaltung hochladen, erkennt die KI es nun als Duplikat und verweist auf das Original, anstatt es erneut zu verarbeiten. Dies spart Kontext-Tokens und hilft der KI zu verstehen, dass Sie sich auf dasselbe Bild beziehen.
Verbesserungen
- Dokument-Deduplizierung: Verbesserter dokumentübergreifender Abgleich – derselbe Dokumentinhalt wird nun erkannt, egal ob er aus einem Benutzer-Upload, einem Gmail-Anhang oder einer Webseiten-Erfassung stammt.
Fehlerbehebungen
- PDF-Auth-Fehler: Problem behoben, bei dem Authentifizierungsfehler (401, 403) beim Abrufen geschützter PDFs als allgemeine Extraktionsfehler maskiert wurden. Der tatsächliche Auth-Fehler wird nun korrekt mit hilfreichen Hinweisen angezeigt.
Version 0.8.44 (18. Dezember 2025)
Fehlerbehebungen
- Neu laden/Generieren-Schaltfläche: Problem behoben, bei dem das Klicken auf „Neu laden“ bei einer Assistenten-Nachricht die alte Antwort anzeigte, anstatt die neue, die gerade generiert wurde. Die UI wechselt nun während des Streamings korrekt zum neuen Zweig.
Verbesserungen
- Kontextfenster-Management: Konservativere Token-Schätzung (3 Zeichen/Token) wird nun konsistent über alle Paginierungs- und Kontextberechnungen hinweg verwendet, was die Wahrscheinlichkeit von Kontext-Überlauffehlern bei großen Webseiten verringert.
Version 0.8.43 (17. Dezember 2025)
Verbesserungen
Zeitstrahl & Begründungsanzeige
- Automatisches Einklappen bei Abschluss: Begründungsblöcke und Prozess-Zeitstrahl klappen jetzt automatisch ein, wenn die Generierung abgeschlossen ist, was die Unterhaltung sauber hält und dennoch zugänglich macht
- Zwischengedanken sichtbar: Das „laute Nachdenken“ des Agenten zwischen Tool-Aufrufen wird nun inline im Zeitstrahl angezeigt, was einen besseren Einblick in den Entscheidungsprozess des Agenten gibt
- Tool-Aktionsbeschriftungen: Tool-Aufrufe zeigen nun die spezifische Aktion in der Beschriftung an (z. B. „Web Browse → click“ statt nur „Web Browse“)
Tool-Ergebnisse
- Screenshot-Anzeige-Fix: Screenshots und Bilder werden in Tool-Ergebnissen nicht mehr automatisch erweitert – nur gerenderter Textinhalt (wie Suchergebnisse) wird automatisch erweitert
Fehlerbehebungen
- Ollama CORS: Verbindungsprobleme bei der Verwendung von Ollama über die Chrome-Erweiterung behoben – CORS-Header werden nun automatisch verarbeitet
Version 0.8.41 (15. Dezember 2025)
Verbesserungen
- Typsicherheit: Der Server-Speicheradapter verwendet jetzt korrekte TypeScript-Typen anstelle von
anyfür Threads, Skills, Profile, MCP-Server und Lizenzinformationen - Build-System: Das Backup-Verzeichnis ist jetzt über die Umgebungsvariable
caiioo_BACKUP_DIRoptional (nicht mehr fest im Code)
Version 0.8.4 (15. Dezember 2025)
Neue Funktionen
DNG/RAW-Bildunterstützung
- Kamera-RAW-Dateien: Laden Sie DNG-Dateien (Digital Negative) direkt von Ihrer Kamera oder Fotobibliothek hoch
- Automatische Vorschau-Extraktion: Eingebettete JPEG-Vorschauen werden für eine schnelle Verarbeitung aus RAW-Dateien extrahiert
- Erhalt der Originalqualität: Die ursprünglichen RAW-Daten bleiben erhalten, während die KI mit der hochwertigen Vorschau arbeitet
Verbesserte Bildverarbeitung
- Serverseitige Komprimierung: Große Bilder, die lokale Komprimierungsgrenzen überschreiten, werden jetzt vom Desktop-Server verarbeitet
- Besseres Fehler-Feedback: Visuelle Fehlerindikatoren (roter Rahmen, Warnsymbol), wenn die Bildverarbeitung fehlschlägt
- Graceful Fallbacks: Die Komprimierung greift automatisch auf den Server zurück, wenn das Offscreen-Dokument nicht verfügbar ist
Verbesserungen
- Shared Agent Architecture: Einheitlicher Agent-Runner, der zwischen Erweiterung und Desktop-Server geteilt wird, für konsistentes Verhalten
- Konsolidierung der Protokoll-Handler: Speicher- und Nachrichtenverarbeitung nutzen jetzt gemeinsame Protokoll-Handler
Version 0.8.3 (13. Dezember 2025)
Neue Funktionen
Native Mobile Apps
- Android App: Native Kotlin-App (
android-app/) mit WebView + nativen Bridge-Kanälen (CalendarContract, SAF/Foto-Picker, AlarmManager, OkHttp-Streaming) - Geteiltes UI: Mobile Apps nutzen dasselbe React-UI wie die Web-Extension für ein konsistentes Erlebnis
- iOS + Android: Natives Swift (iOS) und natives Kotlin (Android) mit passenden Bridge-APIs
Verbesserungen
- Identitäts-Synchronisierung: Verbesserte Synchronisierung von Lizenz- und Profildaten zwischen Extension und Desktop-Server
- Anhang-Verwaltung: Bessere Handhabung von Anhängen im LAN/Relay-Modus
- Extension-Client-Tracking: Desktop-Server verfolgt jetzt verbundene Extension-Clients mit Zeitstempeln
Entfernt
- Swift Relay App: macOS-Relay-Funktionalität wird nun vollständig vom nativen App-Server übernommen (eingeführt in 0.8.2)
Version 0.8.2 (12. Dezember 2025)
Neue Funktionen
Plattformübergreifender Desktop-Server
- Caiioo Server: Neue Electron-basierte Desktop-Anwendung ersetzt die macOS-exklusive Swift-Relay-App
- Windows-Unterstützung: Nativer Windows-Installer (NSIS) und portable ausführbare Datei
- Linux-Unterstützung: AppImage und .deb-Pakete für Linux-Distributionen
- Menüleisten-Integration: System-Tray/Menüleisten-App mit Statusanzeigen und Schnellsteuerung
Plattformspezifische Skriptausführung
- Einheitliche Skript-API: Neuer
/api/script-Endpunkt erkennt automatisch die Plattform und nutzt die entsprechende Skript-Engine - PowerShell unter Windows: Ausführung von PowerShell-Skripten zur Systemautomatisierung unter Windows
- Bash unter Linux: Ausführung von Shell-Skripten (bash/sh/zsh) auf Linux-Systemen
- AppleScript unter macOS: Bestehende AppleScript/JXA-Unterstützung bleibt erhalten
Plattformübergreifende Helfer
- Desktop-Benachrichtigungen: Anzeige von Benachrichtigungen über native APIs auf allen Plattformen
- Zwischenablage-Zugriff: Plattformübergreifendes Lesen und Schreiben von Inhalten der Zwischenablage
- Erkennung des aktiven Fensters: Abrufen der Vordergrundanwendung/des Fenstertitels
- System-Info: Abrufen von OS-, CPU- und Speicherinformationen
Verbesserungen
- Automatisierte Build-Pipeline: Version, Icons und Lizenzen werden während des Builds vom Hauptprojekt synchronisiert
- Kleinere Distribution: Redundante Codebasen der mobilen App zur Vorbereitung auf einheitliche Builds entfernt
Version 0.8.1 (11. Dezember 2025)
Neue Funktionen
Flexible Anmeldeoptionen
- Mehrere Authentifizierungsmethoden: Melden Sie sich mit Google OAuth, E-Mail/Passwort oder Lizenzschlüssel an – wählen Sie, was für Sie am besten funktioniert
- Kontoverknüpfung: Verknüpfen Sie Ihr Google-Konto mit einem bestehenden E-Mail/Passwort-Konto für nahtlosen Zugriff über verschiedene Methoden hinweg
Benutzerdefiniertes OAuth für MCP-Server
- Eigene OAuth-Anmeldedaten: Für MCP-Server, die vorregistrierte OAuth-Clients erfordern, können Sie jetzt Ihre eigene Client-ID und Ihr eigenes Secret angeben
- Dynamische Token-Aktualisierung: OAuth-Token werden automatisch aktualisiert, um unterbrechungsfreie Verbindungen zu MCP-Servern zu gewährleisten
Verbesserungen
- Indikatoren für die Dokumentenverarbeitung: Klare visuelle Anzeigen bei der Verarbeitung von PDFs, Word-Dokumenten und Excel-Tabellen
- Einstellungen-Navigation nach Stufe: Das Einstellungsmenü zeigt jetzt intelligent relevante Optionen basierend auf Ihrem Abonnement-Tarif an
- Bessere OAuth-Fehlerbehandlung: Verbesserte Fehlermeldungen, wenn die OAuth-Erkennung des MCP-Servers fehlschlägt
Version 0.8.0 (10. Dezember 2025)
Neue Funktionen
MCP Server Browser & Management
- MCP Server durchsuchen: Suchen und installieren Sie MCP Server sowohl aus der MCP Registry als auch von npm direkt in den Settings.
- Lokale MCP Server: Führen Sie MCP Server lokal auf Ihrem Rechner über die Relay-App aus, um mehr Privatsphäre und Kontrolle zu erhalten.
- Credential Resolution: MCP Server können nun Anmeldedaten aus dem Credentials Vault für eine sichere Authentifizierung abrufen.
- Health Monitoring: Automatische Integritätsprüfungen für verbundene MCP Server mit Statusanzeigen.
Profil-Management
- Mehrere Profile: Erstellen und wechseln Sie zwischen mehreren Benutzerprofilen.
- Profil-Switcher: Leicht zugängliches Dropdown-Menü zum Wechseln von Profilen im Composer.
- Profil-Löschung: Entfernen Sie Profile, die Sie nicht mehr benötigen.
Google Account Auswahl
- Konto-Auswahldialog: Wählen Sie beim Verbinden von Google-Diensten zwischen Ihrem Chrome-Profilkonto oder fügen Sie ein anderes Google-Konto hinzu.
- Web OAuth Flow: Option zur Authentifizierung über den Webbrowser für Konten, die nicht in Chrome angemeldet sind.
Verbesserter Browser Agent
- Go Back Aktion: Der Agent kann nun in der Browser-Historie zurücknavigieren.
- ARIA Snapshot: Erfassung von Snapshots des Accessibility Trees für eine effizientere Seitenanalyse mit weniger Token.
Mobile Apps
- iOS App: Nativer iOS-Client für den Zugriff auf Caiioo in Ihrem lokalen Netzwerk.
- Android App: Nativer Android-Client mit Server-Discovery und WebView-Caching.
Multi-Device Sync
- Device Identity: Jedes verbundene Gerät bzw. jede Extension wird mit einer eigenen Identität verfolgt.
- State Synchronization: Echtzeit-Statussynchronisierung über mehrere verbundene Extensions hinweg.
- Web Client Authentication: Sichere Authentifizierung für Web-Clients, die eine Verbindung zum Relay herstellen.
Verbesserungen
- LLM Provider Key Management: Verwalten Sie API-Keys für verschiedene LLM-Provider direkt im Credentials Vault.
- MCP Tool Images: MCP-Tools, die Bilder zurückgeben, werden nun inline in der Konversation angezeigt.
- PDF Text Detection: Verbesserte Erkennung von verstümmeltem oder weit auseinander stehendem Text bei der PDF-Extraktion mit Konfidenzbewertung.
- CORS Bypass für Bilder: Bilder werden nun über ein Offscreen-Dokument abgerufen, um CORS-Beschränkungen zu umgehen.
Fehlerbehebungen
- Generation State Tracking: Verbesserte Erfassung des Final State, um sicherzustellen, dass der Abschluss der Generierung präzise erkannt wird.
Version 0.7.8 (7. Dezember 2025)
Neue Funktionen
Excel-Unterstützung
- XLSX-Import: Laden Sie Excel-Tabellen (.xlsx) direkt in Ihre Konversationen hoch
- Datenextraktion: Tabelleninhalte werden analysiert und der KI für Analysen zur Verfügung gestellt
- Round-Trip-Bearbeitung: Bearbeiten Sie Tabellen in Slate und exportieren Sie diese zurück in das XLSX-Format
"Was ist neu"-Dialog
- Update-Benachrichtigungen: Nach einem Update von Caiioo zeigt ein Dialog automatisch die Versionshinweise der neuen Version an
- Versionsspezifische Hinweise: Sehen Sie genau, was sich geändert hat, mit formatierten Feature-Listen und Verbesserungen
- Dezent: Der Dialog erscheint nur einmal pro Update und wird bei der Erstinstallation nicht angezeigt
Version 0.7.6 (3. Dezember 2025)
Neue Funktionen
Word-Dokumentunterstützung mit nachverfolgten Änderungen
- DOCX-Import: Laden Sie Word-Dokumente (.docx) direkt in Ihre Unterhaltungen hoch
- Nachverfolgte Änderungen sichtbar: Sehen Sie Einfügungen (grün) und Löschungen (rote Durchstreichung) mit Autor und Datum beim Überfahren mit der Maus
- Kommentarunterstützung: Kommentare werden gelb hervorgehoben, mit Tooltips, die den Kommentartext und den Autor anzeigen
- Slate-Bearbeitung: Anzeigen und Bearbeiten von DOCX-Inhalten in Slate mit vollständigem Styling für nachverfolgte Änderungen
- Dark Mode-Unterstützung: Alle Stile für nachverfolgte Änderungen und Kommentare funktionieren sowohl im hellen als auch im dunklen Design
Version 0.7.4 (2. Dezember 2025)
Neue Funktionen
FLUX-Bildgenerator
- KI-Bilderzeugung: Generieren Sie Bilder aus Textbeschreibungen mithilfe von FLUX-KI-Modellen über OpenRouter
- Bildbearbeitung: Bearbeiten Sie vorhandene Bilder in Ihrer Unterhaltung durch Angabe der Anhangs-ID und Bearbeitungsanweisungen
- Multi-Referenz-Unterstützung: Kombinieren Sie Elemente aus bis zu 10 Bildern mit dem flux.2-flex-Modell
- Mehrere Modelle: Wählen Sie zwischen flux.2-pro (schnell, Standard) oder flux.2-flex (maximale Qualität)
- Automatische Speicherung: Generierte Bilder werden in Ihrer Unterhaltung gespeichert und inline angezeigt
- Kostenverfolgung: Die Kosten für die Bilderzeugung werden separat erfasst und zu den Thread-Summen addiert
Version 0.7.3 (1. Dezember 2025)
Neue Funktionen
Verbesserte Modellauswahl
- Einheitliche Modellauswahl: Konsistente Modellauswahl in Composer und Einstellungen
- Datenschutzindikatoren: Das Schild-Symbol zeigt Modelle mit Zero Data Retention (ZDR) an – Ihre Prompts werden nicht zum Training verwendet
- Vision-Unterstützung: Das Augen-Symbol zeigt Modelle an, die Bilder analysieren können
- Empfohlene Modelle: Das Stern-Symbol hebt empfohlene Optionen hervor (Claude Haiku 4.5, Claude Sonnet 4.5)
- Kostentransparenz: Sehen Sie die Preise pro Million Token direkt in der Modellliste – finden Sie leicht GRATIS-Modelle
- Icon-Legende: Ein kurzer Verweis in den Einstellungen erklärt die Bedeutung jedes Indikators
Version 0.7.2 (1. Dezember 2025)
Neue Funktionen
PDF-Dokument-Ingestion
- PDFs direkt hochladen: Hängen Sie PDF-Dokumente an Ihre Nachrichten an – sie werden automatisch per Mistral OCR verarbeitet
- Hochwertige Textextraktion: Tabellen, Abbildungen, Gleichungen und Formatierungen bleiben als Markdown erhalten
- Agent-Dokument-Ingestion: Agenten können PDF-URLs, auf die sie beim Browsen stoßen, mithilfe der neuen
ingest_document-Aktion verarbeiten - Persistente Speicherung: Extrahierte Inhalte werden für zukünftige Referenzzwecke gespeichert, ohne erneute Verarbeitungskosten
Fehlerbehebungen
- Große Bildanhänge: Bilder über 5 MB werden jetzt vor dem Senden an LLM-APIs automatisch komprimiert, wodurch Fehler wie „Bild überschreitet das Maximum von 5 MB“ bei Anbietern wie Google/Gemini behoben werden
Version 0.7.0 (1. Dezember 2025)
Neue Funktionen
Multi-Thread-Unterstützung
- Mehrere Agenten gleichzeitig ausführen: Sie können jetzt bis zu 3 Threads gleichzeitig laufen lassen
- Visuelle Laufanzeigen: Animierte Punkte erscheinen neben Thread-Titeln in der Seitenleiste, wenn dieser Thread aktiv generiert
- Hintergrundverarbeitung: Agenten arbeiten im Hintergrund, ohne den Fokus zu stehlen – surfen Sie frei, während sie arbeiten
- Thread-Isolierung: Jeder Thread verfolgt seine eigenen Tabs und seinen Status unabhängig
Agent-Nicht-Interferenz
- Behalten Sie die Kontrolle: Wenn ein Agent Tabs öffnet oder Seiten navigiert, stiehlt er Ihnen nicht den Fokus, wenn Sie zu einem anderen Tab gewechselt haben
- Intelligentes Tab-Bewusstsein: Agenten arbeiten nur mit Tabs, die sie erstellt haben oder mit denen sie begonnen haben, und folgen Ihnen nie mitten im Lauf zu neuen Tabs
Apple-Integration (macOS)
- Apple Notizen: Lesen, erstellen, suchen und organisieren Sie Notizen in Ordnern – die KI kann beim Entwerfen und Bearbeiten von Notizen direkt helfen
- Apple Erinnerungen: Verwalten Sie Aufgabenlisten und Erinnerungen – erstellen, erledigen und organisieren Sie Aufgaben mit KI-Unterstützung
Version 0.6.5 (30. November 2025)
Neue Funktionen
KI-Follow-up-Vorschläge
- Smart Prompts: Nachdem der Assistent geantwortet hat, erscheinen KI-generierte Follow-up-Vorschläge, um die Unterhaltung fortzusetzen
- Kontextbewusst: Vorschläge basieren auf dem Unterhaltungskontext und darauf, was Sie als Nächstes tun möchten
Verbesserungen
LAN-Relay-Einstellungen
- Netzwerkadresse anzeigen: Wenn eine Verbindung zum Relay-Server besteht, zeigen die Einstellungen jetzt die tatsächliche IP-Adresse und den
.local-Hostnamen für eine einfache Verbindung mit Mobilgeräten an - Vereinfachte Anweisungen: Verbindungsinformationen erscheinen automatisch, sobald der Server läuft – kein Überprüfen des Terminals erforderlich
Version 0.6.4 (29. November 2025)
Fehlerbehebungen
Slate-Revisionssystem
- Wortweises Akzeptieren/Ablehnen: Einzelne Wortänderungen können jetzt zuverlässig akzeptiert oder abgelehnt werden, ohne nachfolgende Änderungen zu unterbrechen
- Stabile Änderungsverfolgung: Problem behoben, bei dem das Akzeptieren einer Änderung dazu führte, dass andere ausstehende Änderungen nicht mehr anklickbar waren
- Markdown-Rendering in der Vorschau: Änderungsvorschauen rendern jetzt Markdown-Formatierungen (fett, kursiv usw.), anstatt rohe Sternchen anzuzeigen
- Endlosschleifen-Fix: Browser-Hänger beim Akzeptieren reiner Textzusätze behoben
- Vollständige Diff-Anzeige: Die Änderungsvorschau zeigt jetzt alle gelöschten und hinzugefügten Wörter an, nicht nur minimale Unterschiede
Version 0.6.3 (26. November 2025)
Neue Funktionen
- Standard-Benutzererfahrung: Neue Benutzer starten jetzt als Basis-Benutzer statt als Admin
- Lizenzschlüssel-Upgrade: „Upgrade auf Pro“-Button in den Einstellungen hinzugefügt, um Admin-Funktionen mit einem Lizenzschlüssel freizuschalten
- Vereinfachtes Onboarding: Sauberere Benutzererfahrung für Erstbenutzer, fokussiert auf Kernfunktionen
Version 0.6.2 (26. November 2025)
Fehlerbehebungen
- Wiederherstellung bei Generierungs-Timeout: Stumme Fehler bei langen Slate-Operationen behoben, bei denen die UI unendlich „generiert“ anzeigte
- Das Backend verfolgt jetzt die Aktivität während der Generierung und bricht nach 2 Minuten ohne Fortschritt ab
- Streaming-Chunks, Tool-Ausführung und Agenten-Entscheidungen setzen das Timeout zurück
- Automatische Wiederherstellung, wenn der Service Worker mitten in der Generierung neu startet (Erkennung verwaister Zustände)
- Fehlermeldung wird dem Benutzer bei Timeout angezeigt, anstatt eines stummen Hängers
Version 0.6.1 (26. November 2025)
Neue Funktionen
Thread-Import/Export
- Ausgewählte Threads exportieren: Auswahlmodus umschalten, um spezifische Threads für den Export zu wählen
- Alle Threads exportieren: Ein-Klick-Export aller Konversationen inklusive Anhängen
- Aus Datei importieren: Threads aus exportierten JSON-Dateien importieren
- Selektiver Import: Auswählen, welche Threads aus einer Datei importiert werden sollen
- Duplikaterkennung: Erkennt automatisch bereits existierende Threads mit der Option, diese zu überspringen oder zu überschreiben
- Unterstützung für Anhänge: Alle Bilder, PDFs und Dateien sind in den Exporten enthalten
- Unterstützung für archivierte Threads: Sowohl aktive als auch archivierte Threads können exportiert/importiert werden
Verbessertes Prompt Caching
- Bessere Cache-Trefferraten für lange Konversationen mit Claude-Modellen
- Dynamische Caching-Strategie passt sich der Konversationslänge an
Google Workspace Integration
- Google Drive: Suchen, Erstellen, Kopieren, Verschieben und Freigeben von Dateien und Ordnern
- Gmail: E-Mails lesen, Labels verwalten, Entwürfe erstellen (Sicherheit geht vor: nur Entwürfe, kein automatischer Versand)
- Google Calendar: Kalender auflisten, Termine abfragen, Termine erstellen/aktualisieren/löschen, freie Zeitfenster finden
- Inline-Autorisierung: Google-Zugriff direkt aus dem Chat autorisieren, ohne die Settings aufzurufen
Verbesserungen beim Web Browsing
- Neue
click_coordinates-Aktion zum Klicken auf Elemente nach Bildschirmposition - URLs öffnen sich jetzt standardmäßig in neuen Tabs (verhindert das Überschreiben von Tabs)
- Tabs werden automatisch pro Konversations-Thread gruppiert
- Bessere CSS-Selector-Erkennung für zuverlässiges Klicken auf Elemente
Modellauswahl
- Modellauswahl in den Composer-Bereich verschoben für schnelles Umschalten
- Modell bleibt global über Modus-Wechsel hinweg bestehen
- Vision-fähige Modelle sind mit einem Augen-Icon markiert
Streaming-UI
- Tool-Parameter werden während des Streamings angezeigt
- Progressive Anzeige von Reasoning/Thinking-Blöcken
- „Generiert...“-Statusanzeige während der Antwort
Token-Nutzung & Kosten-Tracking
- Anzeige von Input-, Output-, Reasoning- und Cached-Tokens
- Anzeige der Kosten pro Nachricht und der kumulierten Thread-Kosten
UI-Verbesserungen
- Modus-Auswahl für alle Benutzer verfügbar: Nicht-Admin-Benutzer können nun in den Settings zwischen Modi wechseln
- Einklappbare Settings-Abschnitte: Abschnitte im Settings-Panel können zur besseren Navigation ein- und ausgeklappt werden
- AI & Model Configuration (LLM Provider, API Key, Modell, Temperature, Max Iterations)
- Personalization (Personal Instructions, Profile Variables)
- Agent Mode Configuration (Mode Selector, Variables, Instructions, Branding, Tools, MCP Servers)
- Appearance settings
- Backup & Restore
- Documentation
- Modus-spezifische Theme-Farben: Jeder integrierte Modus hat nun ein Standard-Farbschema
- Shopping Agent: Grün
- Travel Agent: Blau
- Helper Agent: Pink
- Caiioo (Allgemein): Lila
- Chromatischer Modus: Aktivieren Sie die Farbrotation, um schrittweise durch das Farbspektrum zu wechseln
- Theme-Override-Management:
- Visuelle Anzeige, wenn das Theme angepasst wurde (geht beim Modus-Wechsel nicht verloren)
- „Save as Mode Defaults“-Button (Admin) speichert das Theme als neuen Standard des Modus
- „Reset to Mode Defaults“ stellt die ursprünglichen Theme-Farben des Modus wieder her
- Neues Caiioo Branding und Icon
- Modus-Auswahl in den Composer-Bereich verschoben
- Neuer Thread-Button zeigt Modus-Auswahl-Dropdown
- Thread-Listen-Umschalter in der oberen Leiste des Composers
- Vignette-Randeffekt bei gesteuerten Browser-Tabs
- Schwebender Stop-Button in gesteuerten Tabs
- Dropdown-Menüs positionieren sich korrekt in der Nähe von Bildschirmrändern
Fehlerbehebungen
- Modellauswahl aktualisiert sich sofort nach Änderungen in den Settings
- Onboarding für neue Benutzer startet nun korrekt den Helper Agent
- Settings-Panel stürzt bei fehlerhaften benutzerdefinierten Variablen nicht mehr ab
- Tab-Gruppennamen aktualisieren sich, wenn sich der Thread-Titel ändert
- Slate Accept/Reject-Widgets korrekt positioniert
- Extended Thinking funktioniert mit mehr Modellen (Haiku 4.5, Gemini, etc.)
- Fehler „maximum 4 cache_control blocks“ behoben
Version 0.3.4 (24. November 2025)
Neue Funktionen
Textauswahl-Kontext
- Schaltfläche "Zum Prompt hinzufügen" erscheint beim Markieren von Text auf Webseiten
- Markierter Text wird als Chip im Composer mit Seitenkontext angezeigt
- DOM-Position wird für präzise Agent-Interaktion erfasst
Google Calendar Integration
- Vollständige Kalenderverwaltung (Ereignisse auflisten, erstellen, aktualisieren, löschen)
- Intelligente Verfügbarkeitssuche über alle Kalender hinweg
- Zeitverarbeitung in natürlicher Sprache ("morgen", "nächste Woche")
Fehlerbehebungen
Slate-Modus
- Akzeptieren/Ablehnen-Schaltflächen werden nicht mehr vom Editor-Inhalt verdeckt
- Diff-Hervorhebung auf Wortebene (nicht mehr ganze Zeilen)
- Mehrere
propose_change-Aufrufe werden nun korrekt akkumuliert - Ansichtsumschalter springt nicht mehr unerwartet zurück
Rebranding
- Umbenannt von "ContextFlow" zu "Caiioo"
Version 0.3.0 (22. November 2025)
Neue Funktionen
Mobiler & LAN-Zugriff
- LAN-Server: Greifen Sie von jedem Gerät in Ihrem lokalen Netzwerk auf Caiioo zu
- Konversations-Sidebar: Öffnen Sie Konversationen in einem Browser-Tab für mehr Bildschirmfläche
- Mobiler Export: Exportieren Sie Konversationen als eigenständiges HTML zur Offline-Ansicht
Fehlerbehebungen
- Kritischer Fehler in der Logik der Nachrichtenverzweigung behoben
- Operationen für archivierte Threads korrigiert
Version 0.2.0 (21. November 2025)
Neue Funktionen
Erweiterte Thinking-Unterstützung
- Claude-Modelle unterstützen jetzt erweiterte Thinking-/Reasoning-Blöcke
- Einklappbare Reasoning-Benutzeroberfläche zur Ansicht des Denkprozesses des Modells
- Reasoning-Details werden für die Kontinuität über mehrere Nachrichten hinweg zwischengespeichert
Neue LLM-Anbieter
- Ollama-Integration: Lokale LLMs über Ollama ausführen
- Anbieterauswahl im Einstellungsbereich
Unterstützung von Bildformaten
- HEIC/HEIF-Unterstützung: Apple-Bildformate werden automatisch für die Kompatibilität konvertiert
UI-Verbesserungen
- Das Tools-Menü wird beim Schließen automatisch gespeichert
- Bessere Organisation des Einstellungsbereichs
Fehlerbehebungen
- Positionierung der Variablen-Autovervollständigung verbessert
Version 0.1.x (Vorherige Versionen)
Kernfunktionen
- Multi-Modell-KI-Chat (OpenRouter, Anthropic, OpenAI, Ollama)
- Browser-Automatisierung und Web-Scraping
- Slate für die Bearbeitung von Code und Dokumenten
- MCP-Server-Integration
- Screenshot- und Vision-Funktionen
- Spracheingabe
- Thread-Verwaltung und Verzweigung
- Profil- und Modus-System