Dies ist eine maschinelle Übersetzung des englischen Originaldokuments. Im Falle von Widersprüchen zwischen dieser Übersetzung und der englischen Originalversion ist die englische Version maßgeblich. Englische Originalversion lesen


Version 0.9.720 (1. Mai 2026)

Marke

  • Allgemein: PebbleFlow heißt jetzt Caiioo: Das Produkt wurde in Caiioo umbenannt — dasselbe Tier, dieselbe App, die Sie bisher genutzt haben. Sie werden den neuen Namen überall in der Seitenleiste, den Einstellungen, auf der Website, im Menü der macOS-Host-App und in der Safari-Host-App sehen. Bestehende Daten, Konten, Logins und die Synchronisierung bleiben unverändert — nur der Anzeigename ändert sich. Die Marketing-Website ist vorerst unter pebbleflow.ai erreichbar und zeigt bereits die neue Marke an; das kanonische Routing über caiioo.ai folgt in einem späteren Release.

Neue Funktionen

  • Allgemein: Simple Mode ist für neue Benutzer standardmäßig aktiviert: Erstinstallationen starten nun im Simple Mode — einem ruhigeren Composer, der Token- und Kostendetails pro Nachricht, das Dropdown für verlustfreie Kompression und Tab-Kontext-Indikatoren ausblendet. Die Modellauswahl bleibt sichtbar, da die Wahl eines Modells eine Kernaktion ist. Bestehende Benutzer behalten ihre jeweilige Simple Mode-Einstellung bei. Ein neues Augen-Symbol im Composer ermöglicht es, die vollständigen Details mit einem Klick ein- oder auszublenden.
  • Allgemein: Kontolöschung: Sie können Ihr Caiioo-Konto jetzt auf der Account-Seite der Website löschen (auch verlinkt in der iOS-App, gemäß Apples Anforderungen zur Kontolöschung). Die Löschung entfernt Ihr Profil, Ihre Anmeldedaten, Ihr AI-Guthaben und die verschlüsselte Kopie Ihres bereitgestellten OpenRouter-Keys; minimale Compliance-Audit-Logs ohne Account-ID werden gesetzlich vorgeschrieben aufbewahrt. Ein neuer Abschnitt in der Datenschutzrichtlinie erläutert genau, was entfernt und was einbehalten wird.
  • iOS: Natives On-Device Text-to-Speech (Kokoro 82M): Die Kokoro-Sprachsynthese läuft nun im iOS-Host-Prozess via OnnxRuntime statt innerhalb der WKWebView, analog zur e5-embeddings-Architektur aus Version 0.9.719. Das Modell nutzt das erhöhte Speicher-Budget des Host-Prozesses, anstatt mit der UI der Seitenleiste um das pro-Prozess-Limit von WebKit zu konkurrieren. Dadurch bringt On-Device TTS die WebView auf dem iPhone 13/14 unter Last nicht mehr zum Absturz.

Verbesserungen

  • Allgemein: Bildgenerator funktioniert mit langsamen Streaming-Modellen: Das Bildgenerierungstool nutzt nun Streaming für OpenRouter-Bildmodelle. Dies behebt den Fehler "Network error: Unable to connect to OpenRouter" bei langsamen Modellen wie gpt-5.4-image-2 (~167 s End-to-End). Der bisherige gepufferte Pfad wartete auf ca. 1,8 MB Keepalive-Padding, bevor das eigentliche JSON eintraf, wodurch das Timeout der Verbindungsebene zuerst auslöste.
  • Allgemein: Free-Tier-Modellauswahl wählt Modelle dynamisch: Der bisherige openrouter/free Meta-Router leitete Anfragen innerhalb von OpenRouter weiter, ohne zu wissen, welche nachgelagerten Modelle Tools oder Vision unterstützten — Android-Nutzer, die ein Bild zusammen mit einem Tool-Aufruf sendeten, erhielten die Fehlermeldung "No endpoints found that support tool use". Caiioo routet nun selbst: Onboarding, Einstellungen und der "Free-Modelle nutzen"-CTA im Upgrade-Modal wählen ein echtes kostenloses Modell, das Tools (und Bildeingabe, falls verfügbar) unterstützt, und wechseln bei Rate-Limits oder Kapazitätsfehlern automatisch. Bestehende Nutzer auf openrouter/free werden beim nächsten Start schrittweise migriert.
  • Allgemein: Personal Intuition findet den richtigen Kontext bei langen Nachrichten: Die Retrieval-Abfrage wurde bisher auf die letzten 500 Zeichen Ihrer Nachricht begrenzt und als einzelner Vektor eingebettet. Bei langen, kopierten Nachrichten oder Themenwechseln führte dies dazu, dass entweder vor der eigentlichen Frage abgeschnitten wurde oder alles zu einem unscharfen Themen-Schwerpunkt verschwamm, der schlecht bewertet wurde. Caiioo extrahiert nun eine prägnante Abfrage — behält den wortgetreuen Anfang bei und fügt eine deduplizierte Sammlung inhaltstragender Token aus den nächsten 3000 Zeichen hinzu — so bleibt das Retrieval thematisch relevant, selbst wenn Ihr Prompt lang ist.
  • Allgemein: Einstellungen → "Minimal settings"-Schalter ändert nicht mehr den eigenen Titel: Der Schalter wechselte seine Beschriftung zwischen "Minimal settings" (ein) und "Advanced settings" (aus). Dadurch las sich der Aus-Zustand so, als würde das Aktivieren des Kontrollkästchens zu den erweiterten Einstellungen führen — das Gegenteil von dem, was passiert. Der Titel bleibt nun konstant; die Beschreibung stellt "On — " / "Off — " voran, um den aktuellen Zustand eindeutig zu machen.
  • Allgemein: Download-Dialog für Sprachmodelle verarbeitet unbestimmten Fortschritt: Die Modell-Infokarte während des Downloads konnte in der schmalen Seitenleiste überlaufen; das Layout ist nun fixiert. Wenn der Server keine Content-Length zurückgibt, zeigt der Fortschrittsbalken einen unbestimmten Spinner anstelle eines eingefrorenen 0%-Balkens.
  • Allgemein: Simple Mode zeigt kompakte Statistik-Leiste statt alles auszublenden: Zuvor blendete der Simple Mode die gesamte Thread-Statistik aus. Jetzt wird eine schmale Leiste angezeigt — Kontext-Fenster-Ring, kompakte Gesamtzahl der Token (z. B. "1k"), Kosten und verbleibendes Guthaben — und das Augen-Symbol im Composer erweitert dies mit einem Klick auf die vollen Details.
  • Allgemein: Subagent-Kosten werden korrekt zusammengefasst: In der Kostenaufstellung pro Thread fehlten bisher Ausgaben für Subagenten wie Perplexity / Web-Suche, Helper-Kosten, Bild-/Video-/Musikgenerierung, PDF-OCR und Sprachkosten. Alle Kategorien werden nun in der Zeile sub_agent_cost des übergeordneten Elements zusammengefasst.
  • Allgemein: Einstellungen → Tools-Auswahl überschreibt versteckte, standardmäßig deaktivierte Tools: Die Wahl von "Always" oder "Auto" bei einem Tool, das standardmäßig deaktiviert ausgeliefert wird, wurde bisher stillschweigend ignoriert. Ihre dynamische Tool-Konfiguration überschreibt nun den Standardwert.
  • Allgemein: Lokaler Sidecar in "Desktop app" umbenannt: Alle für Benutzer sichtbaren Verweise auf "PebbleFlow Relay" — den Sidecar, der lokale stdio MCP-Server und Desktop-exklusive Tools unterstützt — lauten nun "Desktop app", da dies das ist, was Benutzer tatsächlich installieren.
  • Allgemein: Datenschutz-Texte gestrafft: Redundante Formulierungen zu "Telemetrie" wurden in den rechtlichen Richtlinien, Store-Einträgen, der Datenschutzseite der Website und dem In-App-Guide entfernt. "Keine Analysen" deckt dies bereits ab; es gibt keine faktische Änderung an dem, was die Apps sammeln oder nicht sammeln.
  • Allgemein: Provider-Kontoansicht kennzeichnet Guthaben-Quelle: Das Panel für Provider-Konten gibt nun an, für welchen Key das jeweilige Guthaben gemeldet wird (Ihr BYOK-Key vs. der von Caiioo bereitgestellte Key), sodass Guthaben und Restbetrag auf den ersten Blick nicht mehr falsch zugeordnet werden können.

Fehlerbehebungen

  • Allgemein: Apple Sign-In nach der Markenumstellung: Apple Sign-In schlug bei neuen Anmeldungen fehl, da die OAuth Services ID noch auf das alte com.sixcailloux.PebbleFlow.web verwies. Dies wurde auf com.sixcailloux.Caiioo.web umgestellt, sodass "Anmelden mit Apple" auf iOS, macOS und der Web-Account-Seite wieder funktioniert.
  • Allgemein: "Sign in"-Button bei OAuth-erforderlichen MCP-Servern: Die Installation eines remote OAuth-erforderlichen MCP-Servers (z. B. Notion) schreibt den Server in den Speicher, selbst wenn die initiale Verbindung fehlschlägt, weil OAuth erforderlich ist, aber kein Client registriert wurde. Der "Sign in"-Button sendete dann eine Refresh-Anfrage, die einen rohen "MCP server not found"-Fehler zurückgab, anstatt den OAuth-Dialog zu öffnen. Der Refresh greift nun auf einen neuen addServer-Aufruf zurück, wenn der Client nicht registriert ist, sodass der OAuth/DCR-Prozess eingeleitet und der Anmeldedialog tatsächlich geöffnet wird.
  • Allgemein: Von nativen Apps gesendete Bug-Reports erfassen jetzt die korrekte App-Version: Die Shells für iOS, macOS und Android injizieren nun beim Start die installierte App-Version in die WebView. So identifizieren eingereichte Bug-Reports, von welchem Build sie stammen, anstatt das Feld leer zu lassen oder die Version der gebündelten Seitenleiste auszugeben.
  • Android: Absturz beim Start nach dem Rebranding: Eine zu eifrige Umbenennung von PebbleFlow zu Caiioo hatte die Application-Klasse und JNI-Symbole auf der Kotlin-Seite umbenannt, ohne die entsprechenden nativen Exporte umzubenennen. Die App stürzte beim Start ab, da Symbole nicht aufgelöst werden konnten. Die Umbenennungen wurden rückgängig gemacht; die App startet wieder sauber.
  • Allgemein: Google Workspace Re-Autorisierungsschleife: Benutzer mussten Google Workspace etwa jede Stunde neu autorisieren, da ihre gespeicherte OAuth-Verbindung keinen refresh_token enthielt. Sechs zusammenhängende Fixes garantieren nun einen Refresh-Token bei jeder Gewährung und bewahren diesen durch Cloud-Sync, sodass Google-Verbindungen die 1-stündige Access-Token-TTL überstehen, ohne den Consent-Screen erneut aufzurufen.
  • Allgemein: Wiederherstellung bei "User not found" auf OpenRouter: OpenRouter gibt HTTP 401 "User not found" zurück, wenn der zugrunde liegende Benutzerdatensatz eines bereitgestellten Sub-Keys gelöscht wurde, die Key-Entität aber noch existiert. Caiioo zeigte dies bisher als defekte Erweiterung an, was nur durch Logout+Login behoben werden konnte. Der Provider repariert sich nun selbst, indem er einen frischen bereitgestellten Key einsetzt und die Anfrage einmal wiederholt.
  • Allgemein: Google Docs insert_component gab irreführende Fehler zurück: Das Einfügen einer Komponente nach einer zuvor eingefügten Tabelle meldete "Document not found", da die eingefügte Tabelle nie an ihren componentName gebunden wurde. Tabellen erhalten nun in derselben Einfügephase einen benannten Bereich, der Positions-Resolver berücksichtigt Nicht-Standard-tabId, und Fehler auf App-Ebene werden nicht mehr fälschlicherweise als 404 klassifiziert.
  • Allgemein: Neu veröffentlichte OpenRouter-Modelle verloren ZDR-Routing: Wenn ein Modell noch nicht in der Intelligence-Datenbank von Caiioo enthalten war, markierte der synthetische Fallback-Datensatz es als nicht ZDR-fähig, selbst wenn ZDR-exklusive Provider es tatsächlich unterstützten. Das ZDR-Routing nutzt nun denselben Provider-Listen-Fallback wie der reguläre Pfad.
  • Allgemein: API /v1/runs ignorierte Anhänge beim allerersten Aufruf: Wenn der API-Endpunkt einen Agenten in einem frischen Thread startete, ging die Liste der Anhänge in der Benutzernachricht verloren, da der Zweig für leere Threads nur Text übertrug. Anhänge werden nun korrekt durchgereicht.
  • Allgemein: Native Apps konnten veraltete Einstellungen direkt nach einem Modellwechsel lesen: Auf Android-Geräten mit wenig Speicher konnte das Wechseln des Modells und das sofortige Senden einer Nachricht dazu führen, dass der Agent das vorherige Modell von der Festplatte las, da der 500 ms verzögerte (debounced) Schreibvorgang noch nicht ausgelöst worden war. Der Sendepfad erzwingt nun einen State-Flush, bevor der Agent gestartet wird.
  • Allgemein: Tester-Bug-Triage (PF-260429 / PF-260430): Fünf Korrekturen — Benutzer mit verwalteten Keys (Free-Tier) können Dokumente nun über PDF OCR einlesen, ohne einen eigenen Key einzugeben; macOS fixiert die Zeitzone des Node-Sidecars auf den Host, damit Daten in der Sandbox korrekt aufgelöst werden; geplante Aufgaben bleiben nun auf iOS/macOS/Tauri-Shells bestehen (der WebView-Speicher-Stub verwarf Schreibvorgänge stillschweigend); das Konfigurations-Tool zeigt einmalige und manuelle Zeitpläne als reguläre Optionen an; und Tool-Aufrufstellen nutzen denselben OpenRouter 401 Self-Heal wie der Agent-Runner.
  • Allgemein: Upgrade-Modal trennt Tier-Abonnement strikter von Credits/BYOK: "Add Credits" öffnete tatsächlich das Abonnement-Portal — die Beschriftung war falsch. Das Modal konzentriert sich nun ausschließlich auf das Tier-Abonnement; iOS blendet zudem gemäß Apple §3.1.1 alle Oberflächen zum Credit-Kauf aus.
  • Web: Abschnitt "Konto löschen" an das Ende der Account-Seite verschoben: Der destruktive Block zum Löschen des Kontos wurde bisher inline zwischen der Identitätskarte und der Abonnement-/Abrechnungs-UI angezeigt. Er befindet sich nun ganz unten auf der Seite, nach den FAQ. Das iOS-Deep-Link-Verhalten in die reine Löschansicht bleibt unverändert.
  • iOS: "Manage Plan" öffnet jetzt das Apple-Abonnement-Fenster: "Manage Plan" auf iOS leitete bisher bei Free-, Trial-, Stripe- und Benutzern unbekannter Herkunft auf die Web-Account-Seite weiter, wo Google OAuth in der WKWebView fehlschlug. Das Tippen auf "Manage Plan" unter iOS öffnet nun immer das StoreKit-Fenster showManageSubscriptions von Apple.
  • iOS: Webansicht zur Kontolöschung reduziert auf Löschseite: Wenn der Button "Konto löschen" in iOS die Website öffnet, blendet die Seite nun alle Abrechnungsbereiche (Abonnement, Pläne, Credits, Stripe-Portal, FAQ) aus und zeigt nur den Löschabschnitt an, um §3.1.1 zu erfüllen.
  • iOS: ITMS-90208 Framework-Version Validierungs-Fix: Die Info.plist des onnxruntime-Frameworks wird nun beim Archivieren angepasst, um dem Deployment-Target der Host-App zu entsprechen. So lehnt App Store Connect Builds nicht mehr mit der Meldung ab, dass das Framework die in der Info.plist angegebene Mindest-OS-Version nicht unterstützt.
  • Android: Externe Links öffnen in einem Custom Tab, damit Google OAuth funktioniert: Das Tippen auf Links wie "pebbleflow.ai/account öffnen" erfolgte bisher innerhalb der Android WebView, wo Google OAuth mit disallowed_useragent (Fehler 403) blockiert. Externe Links werden nun über die native Bridge in einen Chrome Custom Tab geleitet, dem Google vertraut.
  • Android: Kopieren-Buttons unter Nachrichten kopieren jetzt tatsächlich: Das Kopier-Icon nutzte direkt navigator.clipboard.writeText, was in der Android WebView stillschweigend fehlschlägt, wenn die Benutzeraktivierung über die asynchrone Grenze hinweg abläuft. Das Kopieren erfolgt nun über die native Clipboard-Bridge.

Version 0.9.719 (25. April 2026)

Sicherheit

  • Common: protobufjs CVE-2026-41242 behoben (CVSS 9.8): protobufjs >= 7.5.5 (aufgelöst zu 8.0.1) fixiert, um eine kritische Sicherheitslücke für Arbitrary-Code-Execution in Root.fromJSON zu schließen. Caiioo importiert protobufjs nicht direkt — es ist eine transitive Abhängigkeit von onnxruntime-web — und das praktische Risiko war gering, da wir nur gebündelte Modelle und keine vom Benutzer bereitgestellten Schemas einspeisen. Dennoch behoben, da der Fix trivial ist.
  • Common: @xmldom/xmldom — 4 High-Severity CVEs behoben: @xmldom/xmldom >= 0.9.10 fixiert. XML-Parsing wird in DOCX/XLSX-Redline-Pipelines und verschiedenen Erweiterungs-Codepfaden verwendet.
  • Server: undici — 3 High-Severity CVEs behoben: undici >= 7.24.0 in cloud/relay fixiert. Betrifft nur den HTTP-Client des Relay-Servers.
  • Desktop: rustls-webpki + quinn-proto — 2 High-Severity CVEs behoben: Diese Tauri Rust-Abhängigkeiten aktualisiert. Betrifft die Windows + Linux Desktop-Builds, die über die Tauri-Shell laufen.

Neue Funktionen

  • Common: Videogenerierung (Pro): Erstellen oder animieren Sie kurze Videos mit Google Veo 3.1, OpenAI Sora 2 Pro und ByteDance Seedance via OpenRouter. Das Tool wählt gültige Dauern und Auflösungen pro Modell aus, pollt bis zum Abschluss des Auftrags und speichert das Ergebnis als Thread-Anhang.
  • Common: Musikgenerierung (Pro): Erzeugen Sie Songs und Instrumental-Clips mit Googles Lyria 3 Pro Preview via OpenRouter. Die Ausgabe wird als Audio-Anhang gespeichert, der inline abgespielt werden kann.
  • Common: Dynamischer Video-Modellkatalog: Der Videogenerator ruft die aktuelle Liste der videofähigen OpenRouter-Modelle zur Laufzeit ab, sodass neue Anbieter und Modelle ohne ein caiioo-Update erscheinen. Ein gebündelter Snapshot stellt die Offline-Funktionalität sicher.
  • Common: Dynamischer Musik-Modellkatalog: Dasselbe für die Musikgenerierung — das Tool erkennt neue Musikmodelle, sobald OpenRouter sie veröffentlicht, mit Offline-Fallback.
  • Common: Benutzerdefiniertes OAuth für Pro: Bring-Your-Own-Auth — der Google Workspace-Assistent, der Microsoft 365-Assistent und der generische Flow "Benutzerdefinierten Anbieter hinzufügen" — ist jetzt für alle Pro-, Platform-, Teams- und Enterprise-Benutzer unter Einstellungen → Custom OAuth sichtbar. Zuvor waren der Tab und die Schaltflächen hinter Tester-Flags versteckt, sodass zahlende Benutzer das BYOA-Setup nicht erreichen konnten.
  • Common: Physik + Strukturanalyse (Pro): Das Physik-Simulations-Tool (Wurfbewegung, Kollisionen, kinetische/potenzielle Energie, Impuls, Kraft, Geschwindigkeit-zum-Ziel) und die Strukturanalyse (Balkenbelastung, Knicken von Säulen, Materialeigenschaften) sind jetzt für Pro-Nutzer neben den anderen Kreativ- und Hilfswerkzeugen verfügbar.
  • Common: Seeing-Eye Dog — Vision-Fallback für reine Text-LLMs: Reine Textmodelle wie DeepSeek V4 Pro, Kimi K2.6, MiMo V2.5 Pro und lokale Ollama-Modelle können jetzt Bildanhänge verarbeiten, indem sie diese über ein konfiguriertes günstiges Vision-Modell leiten (Standard: Gemini 3.1 Flash Lite). Die automatische Bildbeschreibung erfolgt zum Zeitpunkt der Nachrichtenerstellung und wird pro Anhang zwischengespeichert, sodass für nachfolgende Runden keine Kosten anfallen; ein dediziertes vision({action: "inspect"}) Tool gibt dem Modell gezielten Follow-up-Zugriff. Unter Einstellungen → Tools → Vision Fallback Model kann der Helfer ausgewählt werden.
  • Common: XLSX-Änderungsnachverfolgung auf Zellenebene: Tabellenkalkulations-Artefakte unterstützen jetzt dieselbe Redlining-UX wie DOCX. KI-Vorschläge via propose_change(editMode: 'xlsx_cell') erzeugen lokalisierte Änderungen, die an cellRef + sheetName verankert sind; manuelle Bearbeitungen im Änderungsmodus erstellen Diffs auf Zellenebene; Zellen mit ausstehenden Änderungen werden inline als <del>alt</del><ins>neu</ins> gerendert; die vorhandene Toolbar (Nächste/Vorherige/Annehmen/Ablehnen) funktioniert nun auch für Zellenänderungen; gleichzeitige KI- und Benutzer-Edits werden Zelle für Zelle zusammengeführt, wobei bei Konflikten in derselben Zelle die Benutzeränderung Vorrang hat.
  • Common: Kostenverfolgung für Video- und Musikgeneratoren: Generierte Videos (via OpenRouter /api/v1/videos) und Musik (via chat-completions) werden nun wie die Bildgenerierung in die Thread-Gesamtkosten eingerechnet, mit neuen Aufschlüsselungszeilen für video_gen_cost und music_gen_cost im Kosten-Dropdown der Seitenleiste.

Verbesserungen

  • Common: Stabilität der GPT-5 Serie: OpenAIs gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro und gpt-5.3-codex produzieren bei tool-intensiven agentischen Konversationen keine lautlosen leeren Antworten mehr. Eine Interaktion im Funktions-Tool-Schema führte dazu, dass das Backend von OpenAI Streams beendete, ohne eine Ausgabe zu erzeugen; Caiioo serialisiert Tools nun in dem Format, das diese Modelle erfordern.
  • Common: Besseres Verhalten bei langen Konversationen auf GPT-5.4+: Multi-Turn-Konversationen mit gpt-5.4, gpt-5.4-pro und gpt-5.3-codex brechen bei langen Tool-Aufrufsequenzen nicht mehr vorzeitig ab — der Phasenmarker, den OpenAI verwendet, um Zwischenkommentare von finalen Antworten zu unterscheiden, bleibt nun über Turns hinweg erhalten.
  • Common: GPT-5.x Reasoning im Thinking-Panel sichtbar: gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro und gpt-5.3-codex streamen nun ihre Reasoning-Zusammenfassung während des Denkprozesses in das Thinking-Panel im Chat, analog zum Verhalten von Gemini. Zuvor blieb das Thinking-Panel für diese Modelle leer, obwohl OpenRouter Reasoning-Text streamte.
  • Common: Transparente Wiederherstellung bei vorübergehenden Upstream-Ausfällen: Wenn OpenRouter eine Anfrage an einen Upstream leitet, der einen vorübergehenden 5xx-Fehler zurückgibt, bevor Inhalte gestreamt werden, versucht Caiioo den Aufruf stillschweigend über einen anderen Upstream erneut, anstatt eine leere Antwort anzuzeigen.
  • Common: Klarere Fehlermeldungen bei Stream-Abbruch: Abstürze auf Anbieterseite, Ablehnungen durch Inhaltsfilter und andere Fehler mitten im Stream werden nun mit einer spezifischen Fehlermeldung angezeigt, anstatt dass die Konversation ohne Erklärung einfach "stoppt".
  • Common: Generierte Videos und Musik werden inline gerendert: Generierte Videos und Musik erscheinen nun wie generierte Bilder direkt in der Konversation — ein Video- oder Audioplayer wird über der finalen Antwort mit einem kleinen Badge des erzeugenden Modells angezeigt, anstatt im eingeklappten Tool-Bereich versteckt zu sein.
  • Common: Standardmodell-Auswahl für Video- und Musik-Tools: Einstellungen → Tools enthält nun ein Dropdown-Menü für das Standardmodell der Video- und Musikgeneratoren, analog zur vorhandenen Bildgenerator-Auswahl. Der Agent verwendet standardmäßig Ihr ausgewähltes Modell; Sie können dies pro Anfrage weiterhin überschreiben, indem Sie ein anderes Modell nennen.
  • Common: Personal Intuition Indexierungsstatus-Anzeige: Das Einstellungsmenü für Personalisierung zeigt nun eine Live-Zeile "Indiziert: N Threads · M Chunks · K Token · zuletzt indiziert vor Xm" an, damit Sie bestätigen können, dass der Memory-Indexer ordnungsgemäß arbeitet. Die Zusammenfassung des letzten Backfills bleibt nach Abschluss des Laufs sichtbar, anstatt zu verschwinden.
  • iOS: Native On-Device Embeddings (schneller, weniger Speicher): Die Multilingual-e5-small Inferenz läuft nun im iOS-Host-Prozess via Apples onnxruntime-objc anstatt innerhalb der WKWebView. Dies löst ein Speicherlimit pro Prozess, das die WebView ca. 7 Sekunden nach dem Laden des Modells zum Absturz brachte (der Crash nach dem Login). Nach der ersten Encodierung des Tool-Katalogs werden nachfolgende Tool-Auswahl-Aufrufe über einen In-Memory-Cache pro Text in ca. 10 ms statt ca. 5 s abgeschlossen. Das Refactoring der gemeinsamen Pipeline verhindert zudem, dass Personal Intuition und die On-Device Tool-Auswahl jeweils eine eigene ~115 MB Kopie des Modells laden.
  • Common: Personal Intuition + On-Device Tool-Auswahl teilen sich eine e5-Pipeline: Beide Funktionen instanziierten zuvor ihren eigenen Multilingual-e5-small Loader (jeweils ~115 MB, insgesamt ~230 MB im Renderer). Sie delegieren nun an eine einzige gemeinsame Pipeline, die gleichzeitige Ladevorgänge dedupliziert und die Kaltstartkosten halbiert.

Fehlerbehebungen

  • Common: Browser-Session-Cookies leaken nicht mehr in API-Aufrufe: Wenn Sie openrouter.ai in einem Browser-Tab besucht hatten, hängte die Erweiterung unbeabsichtigt Ihre OpenRouter-Browser-Sitzung (Clerk / Stripe / Analytics-Cookies) an jeden API-Aufruf an. API-Aufrufe sind nun strikt Bearer-authentifiziert.
  • Common: GPT-5.4 Antworten erscheinen nicht mehr doppelt: Ein Fehler wurde behoben, bei dem gpt-5.4, gpt-5.4-pro und gpt-5.3-codex Antworten denselben Text doppelt anzeigten — der Payload der finalen Antwort wurde zusätzlich zum Token-Stream akkumuliert, der ihn bereits gerendert hatte.
  • Common: Modell-Auswahl aktualisiert sich nach Neuladen: Die Modellliste wird nun bei Versions-Upgrades ungültig gemacht und berücksichtigt eine kurze In-Memory-TTL, sodass neu veröffentlichte OpenRouter-Modelle nach einem Neuladen erscheinen, anstatt hinter einem veralteten Cache verborgen zu bleiben. Langlebige Service Worker behalten keinen eingefrorenen Katalog mehr bei.
  • Common: Kurzlinks für generierte Medien öffnen den Player: Wenn ein Modell nach der Generierung von Audio/Bild/Video einen Kurzlink wie [Anhören](audio-…) schreibt, öffnet ein Klick darauf nun den Slate-Player, anstatt als fehlerhafte externe URL fehlzuschlagen. Derselbe Fix gilt für Bild- und Videolinks.
  • Common: Generierte Medien als Markdown-Bildeinbettungen wurden fehlerhaft gerendert: Wenn das Modell einen Video- oder Audioanhang als ![Video 1](video-…) statt [Video 1](video-…) schrieb, wurde er als fehlerhaftes <img> gerendert, anstatt den Player zu öffnen. Das führende ! wird nun entfernt, damit der Link den Slate-Viewer öffnet.
  • Extension: Seitenleiste "Standortberechtigung verweigert" Sackgasse: Ein Fehler wurde behoben, bei dem jede Standortanfrage in der Seitenleiste "Standortberechtigung verweigert. Bitte erlauben Sie den Standortzugriff in den Browsereinstellungen" zurückgab, unabhängig davon, was der Benutzer klickte. Ein Versuch, über das Offscreen-Dokument zu routen, führte sofort zu PERMISSION_DENIED, da der Offscreen-Kontext keine Berechtigungsaufforderung anzeigen kann und das Manifest geolocation nicht deklariert. Die Seitenleiste verwendet nun wieder die ursprüngliche Kette aus Content-Script und anschließender IP-Geolokalisierung.
  • Common: Vollständiger Neuaufbau von Personal Intuition hinterließ veraltete Indizierungszahlen: Ein Fehler wurde behoben, bei dem der Backfill beim vollständigen Neuaufbau das Update des Index pro Thread übersprang, sodass unter Einstellungen → Personalisierung nach einem Neuaufbau überhöhte Summen von vor dem Neuaufbau angezeigt wurden. Threads, die beim vollständigen Neuaufbau gescannt, aber zuvor nicht indiziert wurden, sind nun auch für den Abruf sichtbar.
  • iOS: WKWebView-Absturzschleife nach dem Login: Drei kombinierte Fixes für den Absturz nach dem Login. (1) Native e5-Embeddings laufen nun in Batches von 8 Chunks, wobei die ORT-Memory-Arena so eingestellt ist, dass sie zwischen den Durchläufen schrumpft — der maximale Arbeitsspeicher bleibt unter ~100 MB, anstatt auf ~3 GB anzusteigen und den iOS-Prozess-Kill auszulösen. (2) Der On-Device-Retriever wird nun während requestIdleCallback aufgewärmt statt direkt beim Booten, sodass er nicht mehr mit Lizenz-Sync, Identitätswiederherstellung, UI-Rendering und Cloud-Sync-Initialisierung konkurriert. (3) Der On-Device-Retriever wird bei Identitäts- oder Tier-Wechsel neu bereitgestellt, sodass Neuinstallationen nicht mehr stillschweigend auf Cloud-Helfer zurückgreifen, weil das Tier bei der ersten Registrierung undefiniert war.
  • iOS: Fehlerhafte "Path Traversal Blocked" 403-Fehler: LocalFileSchemeHandler markierte fälschlicherweise jeden 404-Fehler als Path-Traversal-Versuch, da NSString.standardizingPath nur für Dateien auf der Festplatte /var/private/var auflöst. Legitime Pfade zu nicht existierenden Ressourcen (das iOS-Bundle schließt *.wasm aus, plus Chrome-Extension-API-Pfade wie api/active-tab-context) gaben 403 statt 404 zurück, was den wasm-Pre-Fetch-Fallback von transformers.js unterbrach. Ersetzt durch eine stringbasierte .. / NUL-Prüfung analog zum Android-Handler.
  • Common: In PDF eingebettete Bilder brachten reine Textmodelle zum Absturz: Das Senden eines PDFs mit eingebetteten Bildern an ein reines Textmodell von OpenRouter (DeepSeek V4 Pro, Kimi K2.6, etc.) führte zur Fehlermeldung "Keine Endpunkte gefunden, die Bildeingabe unterstützen" — genau die Warnung, die das neue Seeing-Eye Dog Routing eliminieren sollte. Der PDF-Übertragungspfad berücksichtigt nun dasselbe supportsVision-Flag pro Modell wie die Bildblock-Übertragung, sodass reine Textmodelle ein reines Text-PDF erhalten und der Agent bei Bedarf einen Vision-Subagenten starten kann.
  • Common: Umschalten der Ad-Blocker-Stufe wurde nicht wirksam: Das Umschalten der Ad-Blocker-Stufe (Aus / Standard / Aggressiv) änderte nur den gespeicherten Wert, während die aktiven DNR-Regeln + das statische Regelset in Kraft blieben, bis der Service Worker zufällig neu startete — so blieben Seiten wie ads.google.com auch nach dem Ausschalten blockiert. Der Storage-Listener überwacht nun den globalSharedSettings-Bucket, in den die Einstellung tatsächlich geschrieben wird, und das veraltete adBlockerEnabled-Flag wird über denselben Bucket geleitet.
  • Extension: Zu große Bilder wurden stillschweigend verworfen: Wenn ein Bildanhang das API-Limit überschritt, hatte der Extension Service Worker keine Komprimierungsimplementierung registriert (nur die serverbasierte sharp-Implementierung war vorhanden) — daher fing die Sicherung in pushImageBlock den Fehler ab und verwarf das Bild vollständig. Der SW prüft nun die natürlichen Dimensionen via createImageBitmap und leitet die Encodierung über das vorhandene Offscreen-Dokument, sodass Aufrufer im Extension-Kontext das komprimierte Bild anstelle eines verworfenen Platzhalters erhalten.
  • Common: Generierte Bilder und Screenshots von Anbietern abgelehnt: Anthropic begrenzt base64-Bilder auf 5 MB; andere Anbieter haben ähnliche Limits. Generierte Bilder von FLUX / Gemini / Seedream und große Screenshots wurden in voller Größe weitergegeben, was zu 4xx-Fehlern führte, die den gesamten Agent-Turn abbrachen. Drei Schutzebenen: Der Bildgenerator komprimiert die Ausgabe vor der Speicherung; ein neuer pushImageBlock-Helfer leitet jede image_url-Emission durch compress-or-drop; und sowohl der Screenshot-Rebuild als auch die Live-Screenshot-Injektion nutzen denselben Helfer. Ein konservatives 4 MB Limit sorgt nun für Kompatibilität mit allen Anbietern.

Version 0.9.718 (22. April 2026)

Neue Funktionen

  • Common: Personal Intuition — assoziatives thread-übergreifendes Gedächtnis: Caiioo merkt sich im Hintergrund, worüber Sie zuvor gesprochen haben – über jede Konversation hinweg, nicht nur in der aktuellen. Relevante Erinnerungen werden während des Chats abgerufen; Ihr Agent kann diese direkt nutzen oder sie einfach in die Antwort einfließen lassen. Ähnlich wie ein Duft einen an einen Ort erinnern kann. Sie finden die Funktion unter Personalisierung → Personal Intuition; standardmäßig deaktiviert. Enthält Full-rebuild und Incremental backfill, damit Sie Ihre bestehenden Threads indizieren können. Private Konversationen werden niemals Teil des thread-übergreifenden Speichers.
  • Common: Personal Intuition Backup & Restore: Sie können einen Snapshot des gesamten Gedächtniskorpus in einer JSON-Datei unter Backup & Restore → Personal Intuition speichern und später wiederherstellen, falls etwas schiefgeht oder Sie die Daten auf ein anderes Gerät übertragen möchten. Private Konversationen sind niemals enthalten.
  • Common: Instant Tool Chooser Standard für jeden Tier: Der semantische Tool-Chooser läuft jetzt lokal auf jedem Gerät und in jedem Tier – inklusive der kostenlosen Version. Er wählt die richtigen Tools für jeden Turn in ca. 10 ms aus, vollständig auf Ihrem Gerät. Die Picker-UI in Settings → Tools verdeutlicht die Auswahl als „Instant Tool Chooser“ vs. „Quick Tasks LLM“ (welches das Modell verwendet, das Sie im Modell-Picker mit dem Blitzsymbol markiert haben).
  • iOS / Android: Instant Tool Chooser in den nativen Apps: Derselbe On-Device Tool-Chooser ist nun innerhalb der WebView der iOS- und Android-Apps verfügbar, nicht mehr nur in der Browser-Erweiterung und auf dem Desktop.

Verbesserungen

  • Common: Slate Sandbox erlaubt HTTPS Script CDNs: HTML Slate-Artifacts können jetzt gängige Bibliotheken wie Chart.js oder D3 von vertrauenswürdigen HTTPS CDNs (jsdelivr, unpkg, etc.) laden. Der Datenabruf ist weiterhin auf Same-Origin beschränkt; verwenden Sie daher bind_data, um Attachment-Daten in ein Slate zu leiten.
  • Common: Klarerer Personal Intuition Fortschritt: Der Backfill zeigt nun während der Ausführung den Fortschritt pro Thread im Einstellungsbereich an (z. B. „47/75 Threads · 2.134 Chunks“), anstatt bis zum Abschluss keine Rückmeldung zu geben.
  • Common: Schnellere Tool-Auswahl nach Gedächtnis-Indizierung: Die Indizierung eines großen Gedächtniskorpus löscht nicht mehr den Tool-Katalog-Cache im On-Device Retriever – der nächste Tool-Aufruf bleibt „warm“, anstatt Kosten für eine erneute Encodierung zu verursachen.

Fehlerbehebungen

  • Common: Gleichzeitige Sub-Agents verursachten fälschlicherweise Tier-Upgrade-Fehler: Ein Race-Condition-Fehler wurde behoben, bei dem zwei parallel laufende Sub-Agents den Kontext des jeweils anderen aktiven Threads überschreiben konnten. Dies führte dazu, dass Pro-exklusive Aktionen (update_slate, etc.) für den falschen Sub-Agent abgelehnt wurden. Die Tier-Prüfung ist nun auf den spezifischen Thread des auslösenden Aufrufs beschränkt.
  • Common: Slate CSV-Datenbindungen unterbrachen forEach: Es wurde ein Fehler behoben, bei dem CSV-gebundene Daten in der Sandbox als nicht-iterierbares Objekt ankamen – data.forEach(...) innerhalb des Sandbox-JavaScript funktioniert nun wie erwartet.

Version 0.9.717 (17. April 2026)

Neue Funktionen

  • Common: Einheitlicher Pro-Tier über alle Apps: Pro ist jetzt ein einziges Abonnement für 9 $/Monat, das jede caiioo-App freischaltet — Chrome, Desktop und Mobile — anstatt separater App-Tier-Kontingente. Platform (14 $/Monat) wird als „Pro + Infrastruktur“ neu positioniert (lokaler Server, API-Zugriffsvorschau, Messaging).
  • Common: Pro Mobile Tier: Ein rein mobiles Pro-Abo ist für 2,99 $/Monat erhältlich und wird direkt im App Store und Play Store verkauft. Der In-App-Kauf selbst stellt die Berechtigung dar — es ist keine separate Lizenz erforderlich.
  • Common: Ask-User-Tool für Human-in-the-Loop: Der Agent kann nun während eines Durchlaufs pausieren und einen vierstufigen Entscheidungsdialog anzeigen (Genehmigen, Genehmigen mit Anmerkungen, Ablehnen, Ablehnen mit Anmerkungen). Ihre Anmerkungen fließen als Anweisungen in einfachem Englisch an das Modell zurück, die den vorgeschlagenen Plan überschreiben — es wird kein neuer Zyklus gestartet, der Agent fährt an Ort und Stelle fort.
  • Common: In-App-Suche für den Guide: Durchsuchen Sie das Benutzerhandbuch direkt über das Dokument-Menü. Ergebnisse verlinken direkt auf caiioo.ai/guide, wobei der bestehende Redirect-Flow beibehalten wird.
  • iOS: Monatlicher/Jährlicher Paywall-Umschalter: Das iOS-Abonnement-Fenster ermöglicht es nun, vor dem Kauf zwischen monatlicher und jährlicher Abrechnung zu wechseln.
  • Desktop: Auto-Updates unter Windows und Linux: Die Tauri-Desktop-App wird jetzt mit aktiviertem Updater ausgeliefert, sodass Windows- und Linux-Builds Updates direkt empfangen können, anstatt eine manuelle Neuinstallation zu erfordern.
  • Web: Tab-Suche über Guide und Blog: Die Guide- und Blog-Layouts der Marketing-Website enthalten jetzt eine Suchleiste mit Tab-basierter Bereichsumschaltung — Titel-Treffer werden höher eingestuft als Text-Treffer, und der aktive Tab wechselt automatisch dorthin, wo die Ergebnisse liegen.
  • Web: Dedizierte Linux-Installationsseite: Die Installationsseite leitet Linux-Nutzer zu /install/linux weiter, wo AppImage, .deb und .rpm Optionen mit befehlsspezifischen Anweisungen pro Distribution aufgeführt sind.
  • Web: Stabile Download-Routen: /download/macos, /download/linux und /download/windows sind jetzt stabile, durch Edge-Worker unterstützte URLs, die immer auf das neueste Release verweisen — kein Website-Rebuild pro Release erforderlich.

Verbesserungen

  • Common: In-App-Support-Ticketing: Support-Anfragen werden nun primär über den In-App-Ticket-Flow geleitet, mit klareren Fehlermeldungen zu Credits, die Sie an die richtige Stelle führen, wenn etwas schiefgeht.
  • Common: Intelligenteres Google OAuth Re-Auth: Google-Tools verifizieren nun die tatsächlich von Google gewährten Scopes und lösen eine Just-in-Time-Aufforderung zur erneuten Autorisierung aus, wenn ein 403-Fehler auf einen fehlenden Scope hinweist, anstatt lautlos fehlzuschlagen.
  • Common: Voller Drive-Scope für Google-Schreibvorgänge: Schreibaktionen in Google Drive fordern nun den vollen Drive-Scope an, damit Bearbeitungen an Dokumenten, die Sie nicht selbst erstellt haben, erfolgreich sind, anstatt auf Berechtigungsfehler zu stoßen.
  • Common: Modellbeschreibungen für den Bildgenerator: Das Tool zur Bildgenerierung zeigt nun eine Beschreibung für jedes verfügbare Modell an, um die Auswahl des richtigen Modells für die jeweilige Aufgabe zu erleichtern.
  • Common: Präzisere Slate-Artifact-Meldungen: Wenn ein Tool ein Slate-Artifact erstellt oder aktualisiert, behauptet das Modell nicht mehr, dass das Artifact „im Editor angezeigt wird“ — die Formulierung spiegelt nun das tatsächliche Geschehen wider.
  • Common: Bessere dynamische Tool-Auswahl aus Tabs: Der Tab-Kontext-Hinweis gibt nun Tool-IDs aus, sodass der dynamische Tool-Selektor kontextbasierte Auswahlregeln anwenden kann, die davon abhängen, welche Tools verfügbar sind.
  • Common: Sprachkosten den Threads zugeordnet: Die Nutzung von Streaming-TTS (ElevenLabs, Resemble) und STT (ElevenLabs Scribe) wird nun als Sprachkosten in der Konversation abgerechnet, in der sie angefallen sind, analog zum bestehenden One-Shot-Synthese-Pfad.
  • Extension: Login-Untertitel betont lokale Agenten: Kleine Textaktualisierung auf dem Login-Bildschirm.

Fehlerbehebungen

  • Desktop: Linux-Dateiauswahl wiederhergestellt: Fehler behoben, bei dem die Dateiauswahl unter Linux in der Tauri-Desktop-App fehlschlug.
  • Desktop: Falsche Versionsanzeige: Fehler behoben, bei dem die Tauri-Desktop-App einen falschen Versionsstring in der UI und Telemetrie meldete.
  • Desktop: Leiseres Linux-Audio und klarere Fehler: PipeWire-Log-Rauschen unter Linux unterdrückt, OpenRouter-Fehler angezeigt statt verschluckt, den API-Umschalter-Pfad wiederhergestellt und ein fehlerhaftes Paritäts-Banner korrigiert.
  • Common: Gmail-Textextraktion verlor Links: Die Priorität der Gmail-Extraktion wurde umgekehrt, um zuerst Link-erhaltendes Markdown zu versuchen und erst dann auf Plain Text zurückzugreifen, wenn die Markdown-Ausgabe leer ist — E-Mails verlieren im Regelfall keine Links mehr.
  • Common: Öffentliche API-Einstellungen wurden nicht gespeichert: Fehler behoben, bei dem der Public API-Umschalter und das Access Token auf einigen Systemen nicht gespeichert wurden; es wurde sichergestellt, dass diese Einstellungen strikt lokal bleiben und nicht in die Cloud synchronisiert werden.
  • Common: Archivieren und Umbenennen fühlten sich verzögert an: Löschen, Archivieren, Dearchivieren und Umbenennen aktualisieren die UI nun optimistisch, sodass die Liste die Änderung sofort widerspiegelt, anstatt auf eine Server-Antwort zu warten.
  • Common: Archiv-Löschungen wurden nicht synchronisiert: Fehler behoben, bei dem Archiv-Löschungen direkt auf den Speicher angewendet wurden und den Protokollpfad umgingen — sie werden nun wie jede andere Thread-Aktion über alle Clients hinweg propagiert.
  • Common: Agenda zeigte fälschlicherweise „Fehlende Scopes“: Fehler behoben, bei dem das Erinnerungs-/Agenda-Widget direkt nach der Gewährung von Google Calendar-Scopes ein veraltetes Tool-Kontext-Profil las und fehlende Scopes meldete, obwohl die Tools funktionierten. Die UI liest nun das aktuelle Profil, und ein Refresh führt den Flow zur Zustimmung für inkrementelle Scopes nacheinander für alle verbundenen Google-Konten aus, die dies noch benötigen — das Öffnen des Sync-Dialogs zur Suche nach „Zugriff gewähren“ entfällt.
  • Common: Google-Tool-Aufrufe mit „Unknown name exclusiveMinimum“ abgelehnt: Fehler behoben, bei dem Gemini Tool-Aufrufe ablehnte, deren Parameter-Schemas numerische exclusiveMinimum / exclusiveMaximum Grenzen verwendeten — diese werden nun entfernt, bevor sie an Googles eingeschränktes OpenAPI-Subset gesendet werden.
  • Common: Remote MCP-Server ohne DCR konnten nicht verbunden werden: Fehler beim Hinzufügen von Remote-MCP-Servern behoben, die keine Dynamic Client Registration unterstützen (z. B. Slack): Der Client respektiert nun RFC 9728 protected-resource-metadata, folgt authorization_servers zum AS-Host, wenn dieser vom Resource-Host abweicht, und versucht nicht mehr, einen nicht existierenden /register-Endpunkt anzusprechen.
  • Server: Tester-Tier-Nutzer von Gated Endpoints abgelehnt: Fehler behoben, bei dem Endpunkte für Organisationen, Hub, Admin und Provisioned-Keys Nutzer ablehnten, deren effektiver Tier (aus Lizenzen) höher war als der veraltete Tier-Snapshot in ihrem Auth-Token. Gated Endpoints bewerten den effektiven Tier nun konsistent mit /api/auth/me.
  • Extension: Identity-Sync Ping-Pong-Schleife: Konfliktbehaftete Identitäten zwischen der Extension und dem Relay-Server, die eine Endlosschleife bei IDENTITY_SYNC verursachten, wurden behoben. Die Extension bestätigt nun einmalig gegenüber demselben konfliktbehafteten Remote-Server, warnt, dass man sich auf einer Seite abmelden muss, und setzt bei Trennung / Übereinstimmung / Remote-Übernahme zurück.
  • Common: Gemini Flash TTS konnte nicht ausgewählt oder konfiguriert werden: Fehler behoben, durch den Gemini Flash TTS (Voice) durchgehend unbrauchbar war — die Auswahl wurde beim Schließen der Einstellungen zurückgesetzt, und das API-Key-Feld schien keine Eingaben zu akzeptieren. Der Provider ist nun eine vollwertige TTS-Option: Die Auswahl bleibt bestehen, API-Key + Voice-Picker speichern korrekt, und die Synthese nutzt einen SSE-Streaming-Endpunkt, sodass die Audiowiedergabe beginnen kann, bevor die vollständige Äußerung fertig generiert ist.
  • iOS: UI für neue Threads wechselte nicht: Fehler behoben, bei dem die iOS-App die aktive Ansicht nicht auf einen neu erstellten Thread umschaltete, sowie ein damit verbundener modelName ReferenceError, der den Composer zum Absturz bringen konnte.
  • iOS: Startup-Crash bei optionalem Storage-Hook: Ein iOS-Absturz wurde behoben, wenn storage.primeSettingsCache während des Starts nicht verfügbar war — der Aufruf ist nun abgesichert.
  • Common: Tier-Audit-Diskrepanzen nach Preisänderung: Sechs Unstimmigkeiten bei Preisen und Funktionen wurden behoben, die durch das Tier-Audit aufgedeckt wurden, sodass Berechtigungsprüfungen, Upgrade-Aufforderungen und Feature-Flags nun über Extension, Website und mobile Apps hinweg übereinstimmen.

iOS App Store Compliance

  • iOS: Externe Signup-CTAs im Onboarding ausgeblendet: Das Onboarding zeigt keine Handlungsaufforderungen (CTAs) mehr an, die Nutzer für die Kontoerstellung oder kostenpflichtige Upgrades von der App wegführen.
  • iOS: UI für Credit-Käufe ausgeblendet: Oberflächen für den Kauf von Credits sind auf iOS gemäß Apples §3.1.1-Regeln ausgeblendet; Abonnements werden stattdessen über StoreKit abgewickelt.
  • iOS: Support- und Credit-Fehler-Formulierungen aktualisiert: Die /support-Seite und Fehlermeldungen zu Credits wurden auf iOS umformuliert, um Apples Richtlinien bezüglich Verweisen auf externe Käufe zu entsprechen.

Version 0.9.716 (12. April 2026)

Neue Funktionen

  • Common: Gemini 3.1 Flash TTS: Neue Sprachausgabe-Option, unterstützt durch Google's Gemini 3.1 Flash TTS. 30 vordefinierte Stimmen, über 70 Sprachen und Inline-Audio-Tags wie [whispers] und [sighs] für expressive Synthese. Nutzen Sie Ihren eigenen Gemini API-Key; einen kostenlosen erhalten Sie unter aistudio.google.com. Audio ist mit SynthID wassergezeichnet.
  • Common: Sprachkosten in der Konversationssumme: Die API-Nutzung für Text-to-speech und Speech-to-text (Gemini, ElevenLabs, Resemble) wird jetzt in der Kostenzusammenfassung pro Thread neben Chat-, Bildgenerierungs-, Helper- und OCR-Kosten aufgeführt – damit die angezeigte Zahl der tatsächlichen entspricht.
  • Common: SQL Database Tool: Fügen Sie SQLite-Datenbanken zu Konversationen hinzu und fragen Sie diese mit SQL ab. Ergebnisse können als Live-Dashboards in Slate-Artifacts gerendert werden.
  • Common: Kalendereinladungen und Google Meet: Das Erstellen von Kalenderereignissen sendet jetzt Einladungs-E-Mails an Teilnehmer und kann automatisch einen Google Meet-Videolink hinzufügen.
  • Common: Per-Tool Provider Routing: Leiten Sie einzelne Tools (Bildgenerierung, Suche, PDF OCR, etc.) über die Settings an spezifische Provider weiter, anstatt alles über das Standardmodell laufen zu lassen.
  • Common: Conversation Sharing: Teilen Sie Konversationen als Markdown oder Klartext.
  • Common: 14-tägige Platform-Testversion: Starten Sie eine 14-tägige Testversion der Platform-Stufe über die Extension-UI oder die Website-Account-Seite. Pro-Abonnenten sind ebenfalls berechtigt.
  • Common: ZDR Quick-Filter im Model Picker: Neue Schaltfläche im Modell-Auswahlmenü, um schnell nach Zero-Data-Retention-Modellen (ZDR) zu filtern.
  • Common: Vereinfachte Settings: Die Settings öffnen sich standardmäßig in einer optimierten Simple-Ansicht, die nur das Wesentliche zeigt. Wechseln Sie jederzeit in den Advanced-Modus, um alles zu sehen.
  • Common: Kostenloser Google Gemini Zugriff: Nutzen Sie Ihren eigenen Google AI Studio Key, um Gemini 2.5 Flash kostenlos zu verwenden – die kostenlose Stufe von Google ist jetzt für alle Nutzer verfügbar, kein kostenpflichtiger Plan erforderlich.
  • Common: Baseten Self-Hosted Models: Verbinden Sie Ihre eigenen Baseten-Deployments, um selbstgehostete Modelle direkt in Caiioo zu nutzen.
  • iOS: WhisperKit On-Device Speech-to-Text: Die Diktierfunktion läuft jetzt vollständig lokal auf dem Gerät via WhisperKit – Audio verlässt das Telefon nie.
  • Android: On-Device Whisper STT: Speech-to-text via whisper.cpp läuft vollständig lokal auf Android-Geräten mit Mikrofon-Berechtigungs-Flow.
  • Android: GPU-beschleunigtes Moonshine STT: Auf GPU-fähigen Android-Geräten kann die Diktierfunktion auf Moonshine mit Inferenzzeiten im Sub-Sekunden-Bereich laufen. Nur Englisch; whisper.cpp bleibt der mehrsprachige Fallback.
  • Web: Sign in with Apple auf Account- & Hub-Seiten: Apple Sign-In ist jetzt auf den Account- und Hub-Seiten der Website verfügbar.

Verbesserungen

  • Common: Besserer PDF-Export: Der Export eines PDFs aus Slate erzeugt nun eine echte PDF-Datei, anstatt den Druckdialog zu öffnen, sodass Sie jedes Mal ein sauberes Dokument erhalten.
  • Common: Google Slides Volltext: Das Anfordern von Folientext ohne Angabe einer Seite gibt nun den Text aller Folien der Präsentation zurück.
  • Common: Intelligentere Web-Suche: Google-Suchergebnisse werden jetzt mit besserer Struktur extrahiert, wobei Titel, Snippets und Links nach den jüngsten Layout-Änderungen von Google zuverlässiger erfasst werden.
  • Common: Kokoro Text-to-Speech auf allen Plattformen: Die Kokoro-Sprachoption erscheint nun auf iOS, macOS und Android – zuvor war sie in nativen Apps ausgeblendet.
  • Common: Klarere Anzeige des Credit-Guthabens: Das Kontoguthaben für Prepaid- und BYOK-Setups zeigt nun Ihr tatsächliches Guthaben ohne verwirrende "Limit"-Formulierung an.
  • Common: Hochwertigere PDF-zu-Word-Konvertierung: Der PDF→DOCX-Export nutzt jetzt eine dedizierte Document-Ansicht in Slate und erzeugt Word-Dateien, die Layout und Struktur des Quell-PDFs originalgetreuer bewahren.
  • Web: Ruhigere Account- und Auth-Seiten: Google Analytics und das Cookie-Consent-Banner werden auf Account- und Auth-Seiten unterdrückt, um einen saubereren Anmelde-Flow zu ermöglichen.

Fehlerbehebungen

  • Common: Settings-Suche navigierte nicht: Das Dropdown-Menü der Settings-Suche und Deep-Links sprangen bei mehreren Abschnitten (API Access, Private Sync, Backup & Restore, Voice und andere) nicht an die richtige Stelle – die Zielkategorie blieb eingeklappt, sodass nichts in den Sichtbereich scrollte.
  • Common: OAuth-Prompts in Sub-Agents: Fehler behoben, bei dem OAuth-Autorisierungen und Upgrade-Aufforderungen lautlos verworfen wurden, wenn sie von einem Sub-Agent ausgelöst wurden, was Verbindungs-Flows mitten im Prozess unterbrach.
  • Common: Ollama-Modell nach Onboarding nicht gespeichert: Fehler behoben, bei dem das während des Onboardings ausgewählte Ollama-Modell anschließend nicht dauerhaft gespeichert wurde.
  • Common: UI-Chunks luden nicht während Rate Limiting: Fehler behoben, bei dem statische UI-Assets zusammen mit API-Anfragen ratenlimitiert wurden, was zu leeren Bildschirmen oder fehlenden Panels bis zum Refresh führte.
  • Common: Metadaten von Composer-vorverarbeiteten Anhängen verloren: Fehler behoben, bei dem Anhang-Metadaten auf dem Server für Dokumente verloren gingen, die im Composer vorverarbeitet wurden, bevor sie an das Modell gesendet wurden.
  • Common: "Free Time" zählte besuchte Termine als besetzt: Fehler in der Agenda-Freizeitberechnung behoben, der Sie während Terminen, an denen Sie nur teilgenommen haben, als besetzt markierte – nur Termine im eigenen Kalender werden jetzt gezählt.
  • Common: Google-Suchergebnisse fehlerhaft: Fehler behoben, bei dem die Web-Suche leere Ergebnisse lieferte, nachdem Google das Layout der Suchseite geändert hatte.
  • Desktop: Windows/Linux Login nicht synchron mit anderen Plattformen: Der Tauri-Desktop-Login-Flow wurde korrigiert, der von Chrome/macOS/iOS abwich – einschließlich fehlerhafter Stufenerkennung und der Unfähigkeit, sich nach dem Abmelden wieder anzumelden.
  • Desktop: Public API blockierte die Desktop-UI: Fehler behoben, bei dem die eigene UI der Desktop-App durch die API-Authentifizierung blockiert wurde, wenn die Public API-Einstellung aktiviert war.
  • Common: Google Docs OAuth-Fehler ausgeblendet: Fehler behoben, bei dem Google Docs-Operationen bei abgelaufener Authentifizierung lautlos fehlschlugen, anstatt einen klaren Fehler anzuzeigen.
  • Common: Settings-Panel Absturz: Absturz des Settings-Panels beim Wiederherstellen eines bereitgestellten API-Keys behoben.
  • Common: Google Drive Sync duplizierte Dokumente: Fehler behoben, bei dem Google Docs bei jedem Synchronisierungslauf dupliziert wurden, anstatt sie direkt zu aktualisieren.
  • Common: Google Drive Sync Inline-Code verloren: Fehler behoben, bei dem die Formatierung von Inline-Code beim Synchronisieren von Dokumenten mit Google Docs verloren ging.
  • Common: Gemini Thinking Extraktion: Fehler behoben, bei dem Thinking/Reasoning-Inhalte aus Gemini-Modellantworten nicht korrekt erfasst wurden.
  • Common: Veraltete Daten bei Profilwechsel: Fehler behoben, bei dem beim Wechsel zwischen Profilen manchmal Konversationen des vorherigen Profils bis zu einem manuellen Refresh angezeigt wurden.
  • Common: Task Scheduler "Method Not Found" Fehler: Fehler behoben, bei dem geplante Tasks in bestimmten Setups alle 60 Sekunden Fehler verursachten.
  • Common: Zeilenumbrüche bei Texteinfügung in Google Docs: Fehler behoben, bei dem literale bei Texteinfügungen anstelle von tatsächlichen Zeilenumbrüchen erschienen.
  • Common: Google Account Hint bei Tools: Fehler behoben, bei dem Google-Tools manchmal das falsche Google-Konto für API-Aufrufe verwendeten.
  • Common: Settings- und Thread-Import Round-Trip: Fehler behoben, bei dem Settings- und Thread-Exporte nicht korrekt wieder importiert wurden.
  • Common: Sub-Agent Token-Nutzung: Fehler behoben, bei dem die Token-Nutzung von Sub-Agents nicht in der übergeordneten Konversation gezählt wurde.
  • Common: Messaging Bridge Antwort während Retry: Fehler behoben, bei dem Antworten der Messaging Bridge fehlschlugen, wenn der Assistant eine Antwort erneut versuchte.
  • Common: Slate Redline Positionierung: Fehler behoben, bei dem Redline-Löschungen an der falschen Position landeten, wenn Markdown vorhanden war.
  • Common: Browser-Verbindung übersteht Sleep/Wake: Fehler "No browser connected" nach dem Ruhezustand des Computers oder längerer Inaktivität behoben.
  • Common: Geplante Tasks überstehen Service Worker Sleep: Fehler behoben, bei dem wiederkehrende Tasks nach langen Inaktivitätsphasen stoppten.
  • macOS: Safari Google Suche Fehler: Fehler behoben, bei dem die Google-Suche in der Safari-Extension auf macOS nicht funktionierte.
  • iOS: Mobile App Zugriff: Fehler behoben, bei dem die iOS-App fälschlicherweise einen kostenpflichtigen Plan erforderte – die mobile App ist jetzt für alle Nutzer verfügbar.

Version 0.9.715 (3. April 2026)

Neue Funktionen

  • Common: Hub Delivery System: First-Party-Tool-Definitionen, Modus-Konfigurationen und der MCP-Katalog werden nun über den Cloud-Hub bereitgestellt, anstatt fest im Bundle kodiert zu sein. Dies beinhaltet lokales Caching und einen Offline-Fallback zur Vorbereitung auf den Community-Launch.
  • Common: Single-Tab-Modus für Browser-Tools: Eine neue Browser-Tab-Richtlinie pro Modus verwendet einen einzigen Tab für die gesamte Navigation innerhalb einer Konversation wieder. Dies verhindert das Ansammeln von Tabs bei nachrichtenintensiven Workflows wie WhatsApp.
  • Common: Binär-Uploads für API-Integrationen: Das api_integration Tool unterstützt jetzt Binärdatei-Uploads und direkte lokale Datei-Uploads über presigned URLs, anstatt Request-Bodys immer als JSON-Strings zu verarbeiten.
  • Common: Anmeldedaten-Verwaltung via Tool: API-Anmeldedaten können nun programmatisch über das api_integration Tool gespeichert, aufgelistet und gelöscht werden – dies war zuvor nur über die Settings UI möglich.
  • macOS: Auswahl des Audio-Eingabegeräts: Wählen Sie aus, welches Mikrofon für die Spracheingabe verwendet werden soll – listet alle verfügbaren Audiogeräte auf und speichert Ihre Auswahl dauerhaft.
  • Android: OAuth-Wiederherstellung bei geringem Speicher: Android OAuth-Flows überstehen nun die Neuerstellung der Activity, wenn das System die App aufgrund von Speichermangel beendet, und stellen die Auth-Sitzung nahtlos wieder her.
  • Common: 3-Layer Mobile CSS-Architektur: Neues Mobile-Responsive CSS-System mit Plattform-, Layout- und Komponenten-Layern, das eine konsistente UI über Phone-, Tablet- und Desktop-Viewports hinweg gewährleistet.

Verbesserungen

  • Extension: Inkrementelles OAuth via Tab: Inkrementelle Scope-Anfragen öffnen nun einen vollständigen Browser-Tab anstelle eines Popups, was Hänger bei Konten behebt, die eine interaktive Zustimmung erfordern.
  • Common: MCP Tool Schema-Qualität: Alle MCP-Tools bestehen nun einen Qualitäts-Lint-Test, der vollständige Schemas, korrekte Beschreibungen und konsistente Parameterdefinitionen verifiziert.
  • Extension: Automatisches Schließen von Browser-Tabs bei Stopp: Vom Assistenten geöffnete Browser-Tabs werden nun geschlossen, wenn ein Run gestoppt wird; zudem werden OAuth Safari-Fenster unter macOS geschlossen.
  • Android: Toolchain-Upgrade: Android-Build auf AGP 9.1, Kotlin 2.2.10 und Gradle 9.3.1 aktualisiert.

Fehlerbehebungen

  • Common: Google Docs Tabellen-Positionierung: Fehler behoben, bei dem Mutationen an falschen Positionen landeten, wenn Tabellen dem Zieltext in Google Docs vorangestellt waren.
  • Common: Entfernen von Page Content Footern: Fehler bei der Extraktion von Seiteninhalten behoben, bei dem Footer-Elemente fälschlicherweise von den erfassten Seiten entfernt wurden.
  • Common: Web-Browsing Pagination: Fehler in der Pagination für Seite 2+ behoben, wenn kein explizites maxLength angegeben war.
  • Common: Content Script Fallback: Fehler behoben, bei dem die Extraktion von Seiteninhalten lautlos fehlschlug; nun erfolgt ein Fallback auf executeScript, wenn das Content Script nicht verfügbar ist.
  • Common: PDF-Rendering für über URL aufgenommene Dokumente: Fehler beim nativen PDF-Rendering für Dokumente behoben, die via URL aufgenommen wurden.
  • Common: Gemini Tool Call Parsing: Fehler behoben, bei dem Keys in doppelten Anführungszeichen in LLM-Tool-Call-Argumenten zu Parsing-Fehlern bei Gemini-Modellen führten.
  • Common: Amazon Nova Kompatibilität: Fehler behoben, bei dem tool_call-Nachrichten von Amazon Nova aufgrund leerer Textfelder abgelehnt wurden.
  • Common: Agent Run terminiert nicht: Fehler behoben, bei dem Agent-Runs endRun im Service-Worker-Kontext nicht zuverlässig aufriefen, wodurch Browser-Tabs und Status nicht bereinigt wurden.
  • macOS: Fortsetzen von Voice Audio: Fehler behoben, bei dem Voice Audio nach dem Ruhezustand der macOS-App oder dem Minimieren im Dock nicht fortgesetzt wurde.
  • macOS: Screenshots erscheinen nicht: Fehler behoben, bei dem macOS-Screenshots aufgrund fehlerhafter Kontexterkennung nicht in der Assistenten-UI erschienen.
  • macOS: Standortbestimmung funktioniert nicht: Fehler in Safari und der nativen macOS-App behoben durch Hinzufügen der CoreLocation-Bridge und Korrektur des IP-Fallbacks.
  • macOS: Fehlende Location Entitlement: Fehlende Berechtigung für die Standortbestimmung korrigiert und Timeout für native Standortbestimmung erhöht.
  • iOS: File Picker defekt: Fehler behoben, bei dem sich der File Picker in iOS WKWebView nicht öffnete, durch Hinzufügen des runOpenPanel-Delegates.
  • Extension: OAuth Scope Over-Granting: include_granted_scopes aus Web-Popup und Post-Login OAuth-Pfaden entfernt, um unbeabsichtigte Scope-Ausweitung zu verhindern.
  • Extension: OAuth Consent Screen übersprungen: Fehler behoben, bei dem die OAuth-Scope-Erhöhung den Consent Screen während inkrementeller Scope-Anfragen übersprang.
  • Desktop: Konsolenfenster unter Windows sichtbar: Fehler behoben, bei dem das Konsolenfenster beim Starten des Tauri-Sidecars unter Windows erschien.
  • Desktop: Windows Build defekt: Auflösung des node-Binärpfads korrigiert und node_modules für Windows Tauri-Builds geglättet.
  • Server: Doppelte Webhook-Verarbeitung: Fehler behoben, bei dem Webhooks mehrfach verarbeitet wurden, wenn mehrere Clients verbunden waren.
  • Server: Promotion-Codes bei Credit-Käufen: Promotion-Codes für Credit-Käufe im Stripe-Checkout deaktiviert.

Version 0.9.714 (29. März 2026)

Neue Funktionen

  • Common: Überarbeitetes Onboarding: Der neue Onboarding-Bildschirm präsentiert 6 klare AI-Zugangspfade, was es neuen Benutzern erleichtert, ihre Optionen für die Verbindung mit AI-Providern zu verstehen.
  • Common: PDF aus Markdown: Neu erstellte Dokumente können jetzt als PDF exportiert werden, wobei Markdown-Inhalte in ein formatiertes PDF-Ausgabeformat umgewandelt werden.
  • Common: Einheitliches Google OAuth: Die Verbindung zum Google-Konto nutzt nun eine einzige verifizierte OAuth-App mit allen Scopes und ersetzt das bisherige Multi-App-Setup. Einfacherer Verbindungsfluss mit weniger Abfragen.
  • Common: Save to Slate Meta-Parameter: Tools können Ergebnisse jetzt über den Parameter _save_to_slate direkt in ein Slate-Dokument ausgeben und so strukturierte Ergebnisse ohne Copy-Paste erfassen.
  • Common: Slate Anker-Links: Chat-Nachrichten mit Slate-Referenzen enthalten jetzt anklickbare Anker-Links, die zum relevanten Abschnitt innerhalb des Dokuments scrollen.
  • Common: Sandbox Data Bridge: HTML-Artifact-Sandboxes können jetzt über eine postMessage-Bridge dynamisch auf Slate-Daten zugreifen, was Live-Dashboards und interaktive Visualisierungen ermöglicht.
  • Common: Tier-Badges: Einstellungen, Tools und Automatisierungsfunktionen zeigen jetzt Tier-Badges an, die das erforderliche Zugriffslevel markieren und Benutzern mit erweitertem Zugriff Sichtbarkeit über Gating-Beschränkungen geben.
  • macOS: Native Spracherkennung (WhisperKit): On-Device-Spracherkennung via WhisperKit und CoreML ersetzt browserbasiertes STT durch eine schnellere, private und native Implementierung.
  • macOS: Sparkle Auto-Update: Produktionsreife automatische Updates für die macOS-App und die Safari-Erweiterung via Sparkle, mit Appcast-Feed und Delta-Updates.
  • macOS: Nativer Tab-Kontext: AppleScript-basierte Extraktion des Tab-Kontexts ermöglicht der macOS-App die Erkennung der im Vordergrund befindlichen Browser-Tabs.
  • macOS: Voice Hotkey Streaming: Der Voice-Hotkey zeigt nun während der Aufnahme ein Echtzeit-Streaming-Overlay mit automatischem Laden des WhisperKit-Modells an.
  • Safari: Native Messaging: Die Safari-Erweiterung kommuniziert jetzt via Native Messaging statt HTTP-Polling mit der macOS-App, was die Reaktionsfähigkeit und Zuverlässigkeit verbessert.
  • iOS/Android: Native Speicher-Dialoge: Der JSON-Export nutzt jetzt native Speicher-Dialoge (NSSavePanel auf macOS, SAF auf Android) anstelle von fehlerhaften Blob-Downloads.
  • Web: Teams Landing Page: Neue /teams-Seite mit Team- und Enterprise-Messaging für potenzielle Kunden.
  • Web: Blog-Bereich: Neuer Blog-Bereich auf der caiioo-Website.
  • Web: Aktivierung der kostenlosen Testversion: Die Kontoseite unterstützt jetzt die Aktivierung der kostenlosen Testversion mit angepasstem Onboarding-Flow.
  • Common: Unterstützung für geteilte Ablagen: Der Google Picker und alle Drive API-Aufrufe unterstützen jetzt geteilte Ablagen (Shared Drives), was den Zugriff auf teamübergreifende Dokumente ermöglicht.

Verbesserungen

  • Common: Adaptives Greeting: Die adaptive Begrüßung greift nun benutzerdefinierte Willkommensnachrichten auf, anstatt sie zu ignorieren, und bewahrt so den personalisierten Ton des Benutzers.
  • Common: OAuth Callback Bereinigung: OAuth-Callback-Tabs schließen sich jetzt automatisch mit einem Countdown-Timer, anstatt offen zu bleiben.
  • Common: OAuth Anleitung: Wenn ein Tool eine Kontoverbindung benötigt, enthält die Fehlermeldung nun konkrete Hinweise dazu, welches Konto verbunden werden muss.
  • Common: Drive Sync Force-Rewrite: Der Drive Sync-Workflow unterstützt jetzt eine Force-Rewrite-Option zur Neusynchronisierung aller Dateien.
  • macOS: Einheitlicher Debug-Log-Viewer: Die Debug-Log-Ansicht aggregiert jetzt Server-, Swift- und UI-Logs in einem einzigen chronologischen Stream.
  • macOS: Bucketed Settings Storage: Der Server-Storage-Adapter wurde auf eine Bucketed-Architektur umgestellt, inklusive robuster Migration, persistenter Marker, Multi-Profil-Atomizität und First-Writer-Wins-Konfliktlösung.
  • macOS: Notarisierte Safari-Erweiterung: Die Safari-Erweiterung ist jetzt mit Developer ID signiert und verfügt über Notarisierungs-kompatible Entitlements, wodurch die Anforderung "Unsignierte Erweiterungen erlauben" für verteilte Builds entfällt.
  • iOS: Standardmäßig Apple Reminders: iOS und macOS nutzen jetzt standardmäßig Apple Reminders und rufen diese automatisch in der Sync-Ansicht ab.
  • Common: OAuth Scope Elevation: Inkrementelle Scope-Anfragen zeigen nicht mehr alle 22 Scopes an — nur die neu angeforderten Scopes werden eingeblendet, mit übersichtlicheren Eingabeaufforderungen zur Kontenauswahl.
  • Common: Google Account Auto-Retry: Wenn ein Dokument einen 404-Fehler zurückgibt, werden automatisch andere verbundene Google-Konten geprüft, bevor ein Fehler angezeigt wird.
  • Common: Settings Deep-Link Navigation: Alle Einstellungsbereiche sind jetzt ordnungsgemäß für die Suche und Deep-Link-Navigation registriert.

Fehlerbehebungen

  • Common: Tool-Fehlleitung: Fehler behoben, bei dem Tools falsch geleitet wurden, wenn Modelle das Format tool:action (mit Doppelpunkt getrennt) in ihren Antworten verwendeten.
  • Common: Tabellenzellen-Formatierung: Formatierungen und Links in Tabellenzellen bleiben nun erhalten; vererbte Listen-Nummerierungen, die zwischen Zellen auftraten, wurden bereinigt.
  • Common: Slate Highlight Scroll: Das Scrollen zu Highlights im TipTap-Editor für Hintergrund-Tabs, den Vorschaumodus und native Ansichten wurde mittels zuverlässiger ProseMirror-basierter Positionierung korrigiert.
  • Common: Code-Block Textsuche: Fallback zur Textsuche korrigiert, wenn das strukturelle Block-Mapping für Code-Blöcke in Slate-Dokumenten fehlschlägt.
  • macOS: Einstellungsverlust bei Modus-Wechsel: Globale Einstellungen (API-Keys, Verbindungen) werden beim Modus-Wechsel auf macOS/iOS nicht mehr gelöscht — eine explizite Allowlist steuert nun, welche Einstellungen zurückgesetzt werden.
  • macOS: Storage Purge Parität: Das vollständige Löschen des Speichers bereinigt nun konsistent alle Statusfelder, entsprechend dem Verhalten von chrome.storage.local.clear(). Profil-Löschungen und Bereinigungen werden ebenfalls korrekt über Buckets geleitet.
  • macOS: Settings Concurrency: Lesezugriffe auf Einstellungen in applyModeDefaults fordern nun zuerst den Lock an, um Race Conditions zu vermeiden. Storage-Statistiken lesen aus Buckets statt aus veraltetem Flat-Cache.
  • macOS: Migrations-Robustheit: Die Storage-Migration wird bei Fehlern wiederholt, nutzt persistente Abschluss-Marker und bereinigt automatisch veraltete Daten aus der Zeit vor der Migration.
  • macOS: MCP Server Zombie-Prozesse: MCP-Server-Kindprozesse werden nun ordnungsgemäß beendet, wenn die macOS-App geschlossen wird.
  • macOS: Kalender/Erinnerungen in Agenda: Fehler behoben, durch den Apple Kalender-Events und Erinnerungen nicht im Agenda-Modal angezeigt wurden.
  • macOS: Google OAuth Flow: Google-Login-Fehler in macOS WKWebView behoben, indem OAuth über den Relay-Server-Web-Flow geleitet wird.
  • macOS: Abmelde-Navigation: Fehler behoben, bei dem die Abmeldung auf macOS nicht zum Login-Bildschirm zurückführte.
  • macOS: Remote Access Auth: 401-Fehler am set-remote-access Endpunkt durch Entfernen einer fehlerhaften Authentifizierungsanforderung behoben.
  • Server: WhatsApp Antwort-Zustellung: Fehler behoben, bei dem WhatsApp-Antworten nicht an WhatsApp zurückgesendet wurden, sondern nur im PF-Chat-Thread verblieben.
  • Server: WhatsApp Relay-Back Timeout: WhatsApp Relay-Back Timeout von 120s auf 10 Minuten verlängert und Fehlerbehandlung bei Generierungsfehlern korrigiert.
  • Server: Private Sync Reauth: Re-Authentifizierungs-Flow für Private Sync, serverseitiger OAuth-Guard und Abmelde-Bereinigung auf macOS korrigiert.
  • Server: Local Folder Sync Auth: 401-Authentifizierungsfehler bei Synchronisationsvorgängen für lokale/Netzwerk-Ordner behoben.
  • Server: Google Session Re-Auth: Der Unlock-Dialog löst nun bei Ablauf der Google-Sitzung eine Re-Authentifizierung aus, anstatt einen Sackgassen-Fehler anzuzeigen.
  • Safari: Erweiterungs-Signierung: Fehler behoben, bei dem die Safari-Erweiterung als unsigniert angezeigt wurde; Nutzung von Release-Entitlements ohne get-task-allow für Developer ID signierte Builds.
  • Common: OAuth Account Mismatch: Fehler behoben, bei dem OAuth fehlerhafte Verbindungen erzeugte; es werden nun korrekt neue Verbindungen erstellt, statt bestehende mit anderen Konten zu überschreiben.
  • Common: OAuth Scope Inflation: Fehler behoben, bei dem fehlerhafte Verbindungen die Scopes des ursprünglichen Kontos erbten, was zu unbeabsichtigten Scope-Überberechtigungen führte.
  • Common: Thread-Listen-Löschung: Fehler bei STATE_UPDATE Timeout/Retry behoben, der einen falschen Feldnamen verwendete und die Thread-Liste löschen konnte.
  • Common: Tier-Badge Genauigkeit: Fehler behoben, bei dem Tier-Badges fälschlicherweise "Tester" bei Free-Tier-Funktionen anzeigten.
  • Common: Settings Panel Overflow: Flex-Overflow in den Kartenzeilen des Einstellungs-Panels behoben, der Layout-Probleme verursachte.
  • Server: Private Sync API Key Verlust: Fehler behoben, bei dem Private Sync API-Keys während der Synchronisation zwischen Geräten verlor.
  • Server: Messaging Bridge: Archivierte Chats, Stop-Button und Modus-Auswahl in der Messaging Bridge korrigiert.
  • macOS: Verlust von Custom Mode Einstellungen: Fehler behoben, bei dem Einstellungen für benutzerdefinierte Modi auf macOS/iOS aufgrund eines No-Op-Speicherpfads stillschweigend verloren gingen.
  • macOS: OpenRouter Header blockiert: Fehler behoben, bei dem Relay-CORS die OpenRouter-Attributions-Header auf macOS/iOS blockierte.
  • macOS: Tab-Kontext-Wechsel: Fehler behoben, bei dem der Tab-Kontext beim Wechsel zwischen Browser-Tabs nicht aktualisiert wurde.

Version 0.9.713 (28. März 2026)

Neue Funktionen

  • Common: Sub-Agents: Vollständiges Sub-Agent-System mit persistenten benannten Agenten, Konversationsverlauf, paralleler Ausführung (Committee-Muster), sequenziellen und Interjektions-Modi, Abbruch-Kaskade und dediziertem UI-Rendering mit chronologischem Status-Tracking.
  • Common: MCP Tool Approval: Registrierte MCP-Tools erscheinen nun im Tool-Genehmigungssystem, was Benutzern Sichtbarkeit und Kontrolle darüber gibt, welche MCP-Tools von Agenten aufgerufen werden können.
  • macOS: Sidepanel Push Mode: Das Sidepanel unterstützt jetzt neben dem Overlay auch den Push-Modus, mit einer Standardbreite von 425px und persistenter angedockter Breite über Sitzungen hinweg.
  • Server: WhatsApp Rich Messages: Die WhatsApp-Verbindung unterstützt jetzt neben Text und Medien auch Standortfreigabe, Kontakte, Reaktionen und Sticker-Nachrichten.
  • Server: API Key Encryption at Rest: Im Relay-D1-Speicher hinterlegte API-Keys werden nun im Ruhezustand verschlüsselt. Serverseitige OAuth-Keys werden nach der lokalen Speicherung gelöscht.

Verbesserungen

  • Common: Model Alias Display: Argumente von Sub-Agent-Tool-Aufrufen zeigen nun annotierte Modell-Aliase zur einfacheren Identifizierung an.
  • Common: BYOA Connection Priority: OAuth-Anfragen mit erweitertem Umfang bevorzugen nun BYOA-Alternativverbindungen gegenüber Basisverbindungen, was unnötige Re-Authentifizierungsaufforderungen reduziert.
  • Common: Thought Signature Preservation: Thought/Reasoning-Signaturen werden nun sowohl für die OpenAI Responses API als auch für Gemini Multi-Turn-Tool-Calling-Flows korrekt beibehalten.
  • macOS: Debug Log Propagation: Der Schalter für das Debug-Logging wird nun an den Node.js-Server-Subprozess weitergegeben.
  • Common: Bengali Language Support: Plattform und Website unterstützen jetzt Bengalen, zusätzlich wurden der Marken-Haftungsausschluss und die Medienbeiträge auf der Website aktualisiert.

Fehlerbehebungen

  • Common: Safari/WKWebView Streaming: Polyfill für die asynchrone Iteration von ReadableStream für kokoro-js implementiert, wodurch TTS-Streaming-Fehler in Safari und WKWebView behoben wurden.
  • Common: Custom Mode Creation: Fehler in einem veralteten React-Closure behoben, der dazu führte, dass die Erstellung benutzerdefinierter Modi beim ersten Versuch fehlschlug.
  • macOS: Agent Storage Mutations Lost: Speicheränderungen im Agent-Subprozess (Modus-Erstellung, Einstellungen, Skills) gingen unter macOS aufgrund einer fehlenden Persistenz-Bridge lautlos verloren.
  • macOS: Clipboard Copy: Fehler behoben, bei dem das Kopieren in die Zwischenablage in macOS WKWebView lautlos fehlschlug.
  • macOS: WASM/WebGPU in WKWebView: WASM-Backend für TTS/STT und lokale ONNX-Pfade in der nativen macOS-App erzwungen — CDN-Cross-Origin-Importe und WebGPU-JSEP-Modul-Importe schlagen in localhost WKWebView fehl.
  • macOS: Transport Request Collisions: requestId-Kollision behoben, die die Tool-Genehmigung unter macOS unterbrach, sowie verbesserte MCP-Anzeigenamen.
  • macOS: WhatsApp Auto-Reply: End-to-End-Verkabelung für WhatsApp-Auto-Reply auf dem macOS-Relay-Server korrigiert, einschließlich Thread-Sichtbarkeit.
  • iOS: Voice Dictation Stuck: Fehler behoben, bei dem die Sprachdiktat-Funktion im Aufnahmezustand hängen blieb, wenn das stopRecording-Cleanup umgangen wurde.
  • Safari: Browser Commands Timeout: Zeitüberschreitungen bei Safari-Browserbefehlen aufgrund hängender WebExtension-APIs nach der Suspendierung des Service Workers behoben.
  • Safari: Heartbeat Stale Check: Der Heartbeat-Stale-Check für Safari-HTTP-Polling-Browser wird übersprungen, um fälschliche Verbindungsabbrüche zu verhindern.
  • Server: Private Relay Stability: Probleme mit Durable Object Hibernation, Idle-Timeout (1006), Reconnect-Verzögerungen, veralteter Socket-Handhabung und Zombie-readyState behoben. Split-Brain zwischen serverState und ctx.state eliminiert.
  • Server: Webhook Broadcast: Webhooks senden nun nach dem Aufwachen aus der DO-Hibernation an alle Server-Sockets, um den Zombie-readyState zu umgehen.
  • Server: MV3 Messaging Race: Race-Condition in der Lazy-Init-Messaging-Bridge bei Webhook-Eingang behoben, um Abstürze des MV3-Service-Workers zu verhindern.
  • Server: Webhook Verify CORS: Webhook-Verifizierungstest über den Server geroutet, um CORS-Ablehnungen im Browser zu vermeiden.
  • Extension: Logout Cleanup: Die Abmeldung löscht nun korrekt die lokale Relay-Server-Sitzung auf macOS, indem der localhost-Kontext erkannt wird.
  • Common: Security — Thread Isolation: Status-Broadcasts filtern Threads nun nach dem aktuellen Profil, um Datenlecks zwischen Profilen zu verhindern.

Version 0.9.712 (26. März 2026)

Neue Funktionen

  • Common: WhatsApp-Verbindungsdiagnose: Der Verbindungstest für WhatsApp prüft nun zusätzlich zum API-Token auch den Webhook-Abonnementstatus und die Gültigkeit des App-Secrets, um lautlose Zustellungsfehler von Meta abzufangen.
  • macOS: Nativer OAuth-Flow: Die macOS-App nutzt nun ASWebAuthenticationSession für OAuth anstelle von Browser-Weiterleitungen, inklusive automatischem Upgrade veralteter Verbindungen ohne Refresh-Token.

Verbesserungen

  • Common: Robustheit bei DOCX Suchen/Ersetzen: Suchen und Ersetzen in DOCX-Dokumenten verarbeitet nun doppelte Leerzeichen, geschützte Leerzeichen, typografische Anführungszeichen, numerische Entitäten und Groß-/Kleinschreibungsfehler. Enthält einen Fallback für die ignorierte Groß-/Kleinschreibung, wenn eine exakte Übereinstimmung fehlschlägt, sowie Warnungen, wenn mehrere Instanzen ersetzt werden.
  • Common: DOCX-Listen-Nummerierung: Der DOCX-Export generiert nun eine korrekte Word-Listen-Nummerierung (w:numPr) anstelle von literalen Aufzählungszeichen, sodass Word nummerierte und Aufzählungslisten korrekt erkennt.
  • Common: Agent-Startperformance: Verzögerungen beim Agent-Start von 30-50s wurden eliminiert, die durch Ghost-MCP-Server, HTTP-Readiness-Timeouts und redundante Modell-Abrufe verursacht wurden. Der Modell-Cache wird nun an Agent-Subprozesse übergeben.
  • Server: Sicherheits-Härtung: Fix für Command-Injection im URL-Handler, zeitsichere Token-Vergleiche, Content-Security-Policy-Header auf dem Relay-Server, Rate-Limiting am Session-Endpunkt, CORS-Beschränkung auf bekannte Origins und parallele E2E-Broadcast-Verschlüsselung.
  • Server: Webhook-Signatur-Verifizierung: Webhook-Payloads verwenden nun den Base64-kodierten Raw-Body, um JSON-Roundtrip-Korruption zu verhindern, die HMAC-Signaturen ungültig machte.
  • Server: OAuth-Token-Persistenz: Fehlerbehebung für den Split-Brain-Zustand zwischen Server-Statusobjekten, der dazu führte, dass OAuth-Verbindungen (Google Drive etc.) nach einem App-Neustart verloren gingen.
  • macOS: Performance & Stabilität: Menügesteuertes Tray-Polling (zuvor bedingungsloser 3s-Timer), entprellte Speicherung des Fensterstatus, nicht-blockierendes Logging, WKWebView-Crash-Recovery mit exponentiellem Backoff und Behebung von Memory-Leaks bei Script-Message-Handlern.
  • macOS: Zentralisiertes Logging: Relay-Server-Ausgaben und App-Lifecycle-Events werden nun unter ~/Library/Logs/caiioo/ mit automatischer 10MB-Rotation protokolliert, was lautlos verworfene Ausgaben ersetzt.

Fehlerbehebungen

  • Common: Dateiauswahl-Anweisungen: Das pick_files-Tool gibt nun klare Anweisungen für den Benutzer zurück, anstatt eines toten UI-Aktionssignals, das lautlos fehlschlug.
  • Server: Active-Tab-Poll-Spam: Das Polling des aktiven Tabs im Relay-Modus erzeugt keine endlosen Timeout-Fehler mehr, wenn keine Browser-Erweiterung verbunden ist. Verwendet nun exponentiellen Backoff (30s bis 5min) bei aufeinanderfolgenden Fehlern.
  • Server: CORS für native App: Behebung der Blockierung der 127.0.0.1-Origin durch die CORS-Whitelist, die Google OAuth über die WKWebView der nativen macOS-App verhinderte.
  • Server: Verwaiste Agent-Prozesse: Agent-Subprozesse werden nun beim Herunterfahren des Servers und bei nicht abgefangenen Ausnahmen ordnungsgemäß bereinigt.
  • macOS: Browser-Orchestrator Log-Spam: Warnungen bezüglich "Unhandled message type" für Browser-Protokollnachrichten in Erweiterungsverbindungen wurden behoben.

Version 0.9.711 (24. März 2026)

Neue Funktionen

  • Common: Auto-Save für Einstellungen: Einstellungsfelder werden nun während der Bearbeitung dauerhaft gespeichert, mit einem 500ms Debounce für Textfelder und sofortiger Speicherung für Toggles/Selects, um Datenverlust bei Abstürzen oder Navigation zu verhindern.

Verbesserungen

  • Common: Erhalt der DOCX-Nummerierung: Tabulatorzeichen in nummerierten DOCX-Abschnitten (z. B. Rechtsdokumente mit „3.2.3 → Überschrift“) bleiben nun über den gesamten Bearbeitungszyklus erhalten, anstatt stillschweigend entfernt zu werden.
  • Common: Intelligentere Tool-Auswahl: Die dynamische Tool-Auswahl verarbeitet nun auch Sachanfragen (Öffnungszeiten, Preise, Adressen), die eine Web-Verifizierung erfordern, anstatt nur auf strikte Trigger-Wörter zu reagieren.
  • Common: Sprachänderungen durch Agenten: Vom Agenten initiierte Sprachänderungen werden nun sofort angewendet, ohne dass ein manuelles Umschalten in den Einstellungen erforderlich ist.
  • Common: Multi-Account OAuth Fallback: Wenn dem primären Google-Konto erforderliche Scopes fehlen, werden verbundene Sekundärkonten geprüft, bevor eine erneute Authentifizierung angefordert wird. Behebt nicht abgefangene Fehler, wenn Tokens von Sekundärkonten ablaufen.
  • Server: Validierung der Modus-Einstellungen: Der Server validiert nun die Tier-Berechtigungen beim Speichern von Einstellungen, um zu verhindern, dass Nutzer im Free-Tier Einstellungen des Pro-Tiers dauerhaft speichern.
  • Common: Sicherheits-Härtung: DOMPurify-Sanitisierung bei der Reasoning-Vorschau-Ausgabe, eingeschränktes CORS auf bekannte Origins, HTTPS-first IP-Geolocations-Abfrage und verschärfte web_accessible_resources.

Fehlerbehebungen

  • Common: Google-Suchergebnis-URLs: Die Browser-Suche über Google liefert nun strukturierte Links mit tatsächlichen URLs zurück. Zuvor benötigte der Agent 5 Tool-Aufrufe, um URLs zu extrahieren, da AgentMarkdown Link-Hrefs aus dem komplexen verschachtelten HTML von Google verlor — jetzt werden Links direkt aus dem DOM extrahiert und in das erste Suchergebnis aufgenommen.
  • Common: Endlosschleife bei Private Sync: Ein Synchronisationsfehler wurde behoben, bei dem Schreibvorgänge in Manifest-Backup-Dateien kontinuierlich eine erneute Synchronisation auslösten. Leere Einstellungsobjekte werden nun korrekt über alle Geräte hinweg propagiert.
  • Common: Messaging Bridge Updates: Eingehende Nachrichten, Antworten des Agenten und Relay-Back-Antworten werden nun sofort an die UI übertragen, anstatt erst nach Abschluss der Antwort des Agenten zu erscheinen.
  • Extension: Private Relay Reconnect: Es wurde behoben, dass das Relay nach einem Neustart des MV3 Service Workers getrennt blieb, indem auf den gespeicherten Aktivierungsstatus zurückgegriffen wird. Zudem wurde eine Race Condition beim Selbstaustausch während enable() und beim Reconnect nach Identitätswechsel behoben.
  • Extension: Private Relay Race Conditions: Absicherung von Race Conditions beim Aktivieren/Deaktivieren, Hinzufügen von Guards für unhandled rejections bei Messaging Bridge Callbacks und Behebung eines Timer-Leaks beim Schließen des Einstellungs-Panels.

Version 0.9.710 (22. März 2026)

Neue Funktionen

  • Common: Zero-Day Risk (ZDR) Enforcement: Live-ZDR-Datensynchronisierung mit einem Enforcement-Toggle für OpenRouter — zeigen Sie Aufschlüsselungen der Provider-Anzahl an und blockieren Sie Modelle, die mit Zero-Day-Risiken markiert sind.
  • Common: Tool Call Healing: Schwache Modelle, die XML-Tool-Calls innerhalb von Reasoning-Blöcken ausgeben, werden nun automatisch erkannt und korrigiert, was die Zuverlässigkeit bei Nicht-Frontier-Modellen verbessert.
  • Common: Unified Token Lifecycle: Symmetrischer OAuth-Token-Refresh über alle Plattformen hinweg (Extension, Server, macOS, iOS) via eines vereinheitlichten TokenLifecycleManager, mit proaktivem Refresh vor Ablauf.
  • iOS: Composer Icon Scaling: Composer-Aktions-Icons skalieren auf iOS jetzt um das 1,18-fache für bessere Tippziele, mit einer dedizierten native-ios Body-Klasse für plattformspezifisches Styling.

Verbesserungen

  • Common: Slate Proposed Changes: Die Navigation zwischen vorgeschlagenen Änderungen, Hover-basiertes Akzeptieren/Ablehnen und Counter-Updates funktionieren jetzt korrekt im Slate-Editor.
  • Common: Slate Selector Dropdown: Der Slate-Typ-Selektor verwendet nun ein Inline-Dropdown anstelle eines portalierten Popovers, was Z-Index- und Positionierungsprobleme behebt.
  • Common: Propose Change Full Replacement: propose_change erlaubt nun den vollständigen Dokumentenaustausch bei kleinen Dokumenten (500 Zeichen oder weniger), anstatt Teilbearbeitungen zu erfordern.
  • Common: Voice Send Waits for Transcription: Das Drücken von Senden/Enter während der Aufnahme wartet nun auf den Abschluss der Transkription vor dem Absenden, um leere oder unvollständige Nachrichten zu verhindern.
  • Common: Private Sync Setup Flow: Der Passphrasen-Dialog wird nun nach OAuth während des Private Sync Setups automatisch angezeigt, was den Onboarding-Flow optimiert.
  • Common: BYOA Registry Refresh: Die BYOA-Provider-Registry wird nun neu initialisiert, nachdem Private Sync neue Zugangsdaten heruntergeladen hat, um sicherzustellen, dass importierte Verbindungen sofort nutzbar sind.
  • Common: Terminology Consistency: "Cloud Sync" wurde in den Inhalten des Benutzerhandbuchs in "Private Sync" umbenannt, inklusive eines Terminology-Guard-Tests, um Regressionen zu verhindern.
  • Server: Private Relay Stability: Kompatibilitätsdatum aktualisiert, Durable Object Crash-Handling verbessert und MV3-Reconnect-Logik für zuverlässige, langlebige Verbindungen gehärtet.
  • Server: Private Sync Settings Excluded: Private Relay-Einstellungen sind nicht mehr in Cloud-Sync-Payloads enthalten, um geräteübergreifende Relay-Konfigurationskonflikte zu vermeiden.

Fehlerbehebungen

  • Common: SVG Image Handling: SVG-Dateien werden nicht mehr als image_url an Provider gesendet, was bei Modellen, die das SVG-Format nicht unterstützen, zu HTTP 400-Fehlern führte.
  • Common: Private Sync Race Conditions: Fehler bei der Nachrichtenweiterleitung behoben, die durch Race Conditions während der Private Sync Initialisierung verursacht wurden. Sync-Loop und Quarantäne-Logik gehärtet.
  • Common: Private Sync Data Deletion: Löschung von Cloud-Daten und Audit funktionieren nun korrekt nach der Deaktivierung von Private Sync.
  • Common: Model Matching Contamination: Fehler beim familienübergreifenden Model-Matching im Auto-Adjust-System behoben, der Modelle fälschlicherweise über Provider-Familien hinweg zuordnen konnte.
  • Common: Dynamic Tool Selector: Der Prompt des dynamischen Tool-Selektors wurde gehärtet, um Agent-ähnliches Reasoning zu verhindern, das zu Fehlern bei der Tool-Auswahl führen konnte.
  • Common: Validation Error Messages: Die Validierung von Pflichtfeldern gibt nun fokussierte Fehlermeldungen anstelle von generischen Fehlern zurück.
  • Extension: Private Relay WebSocket Drops: WebSocket-Verbindungen brachen nach ca. 60 Sekunden aufgrund der MV3-Service-Worker-Suspendierung ab. Keepalive- und Reconnect-Logik verbessert.
  • Extension: Google OAuth Incremental Scopes: OAuth-Scope-Erweiterung mittels launchWebAuthFlow im Extension-Kontext korrigiert, anstatt lautlos fehlzuschlagen.
  • Extension: Relay Toggle Settings Reload: Unnötiges Neuladen der Einstellungen beim Umschalten des Relays unterdrückt, um UI-Flackern und Diagnose-Rauschen zu vermeiden.
  • Server: Durable Object Hibernation: WebSocket-Close-Handling nach Durable Object Hibernation korrigiert, das Verbindungen in einem veralteten Zustand hinterlassen konnte.
  • Server: Messaging Credential Persistence: Messaging-Zugangsdaten bleiben nun sofort bei Änderung bestehen, anstatt auf den nächsten Speicherzyklus zu warten.
  • iOS: Stale WebSocket Callbacks: WebSocket-Handler werden nun beim Schließen gelöscht, um zu verhindern, dass veraltete Callbacks nach einer Rekonnektion auf iOS ausgelöst werden.
  • Desktop: NSIS Installer Upload: Der Windows NSIS-Installer wird nun korrekt via API in Draft-Releases hochgeladen.

Version 0.9.709 (21. März 2026)

Neue Funktionen

  • Common: Slack Messaging Adapter: Neuer Slack Events API Adapter für die Messaging-Bridge mit Bot-Signaturverifizierung, Unterstützung für Medien-Downloads und Konfiguration der Benutzeroberfläche in den Einstellungen.
  • Common: Slate File Roundtrip: Lokale Dateien können jetzt direkt in Slate geöffnet und gespeichert werden, inklusive Persistenz der Dateisystem-Handles und Hash-basiertem Dirty-Tracking. Die neue Schaltfläche „Datei laden“ im Slate-Auswahldialog verarbeitet Dokumente vor und öffnet sie mit dem korrekten Editor.
  • Common: Slate Dateimenü-Restrukturierung: Das Dateityp-Menü wurde in die Kategorien Dokumente, Renderbar (HTML/Vega/Mermaid) sowie Code & Daten umstrukturiert, inklusive automatischer Erkennung bei Umbenennung.
  • Common: Remote Browser App: Remote-Browser-Clients können nun Sidepanel-Assets über das Private Relay abrufen, was einen browserbasierten Zugriff ohne installierte Extension ermöglicht.
  • Common: Geräteidentität im Private Relay: Relay-Clients zeigen nun einen menschenlesbaren Gerätenamen an. Wenn ein Gerät durch ein anderes verdrängt wird, zeigt die Benutzeroberfläche an, welches Gerät den Platz eingenommen hat.
  • Common: Redesign des Composer Mic Chips: Die Mikrofon-Schaltfläche wurde als sichtbarer Chip/Pill neu gestaltet, mit einer klaren Anzeige des Aufnahmestatus, 44px Mindest-Touch-Zielen für Mobilgeräte und einem Voice-Overlay, das über dem Eingabebereich gerendert wird.
  • Common: Link zum Benutzerhandbuch: Das Benutzerhandbuch ist nun im Einstellungsbereich Dokumentation & Rechtliches verlinkt.
  • iOS: BYOA Setup Gate: Der BYOA-Assistent auf Mobilgeräten zeigt nun eine Meldung an, die Benutzer anweist, Private Apps auf dem Desktop einzurichten, da der 8-stufige Browser-Flow auf Mobilgeräten nicht praktikabel ist.
  • Server: Login Challenge: E-Mail-basierte 6-stellige MFA-Verifizierung für den Login, mit Consent-Tracking und Sitzungswiderruf.

Verbesserungen

  • Common: Private Sync Settings-First: Einstellungen werden nun vor den Konversationen synchronisiert. Dies stellt sicher, dass Tokens und Konfigurationen sofort verfügbar sind, während die Massensynchronisation der Threads im Hintergrund fortgesetzt wird.
  • Common: WebSocket Request Korrelation: WebSocket- und Private Relay-Transporte warten nun ordnungsgemäß auf Serverantworten, anstatt sofort aufzulösen. Dies behebt über 40 UI-Operationen im macOS Sidepanel und bei Relay-Clients (Drive-Audit, Ollama-Test, MCP-Operationen usw.).
  • Server: Webhook-Signaturverifizierung: Die Verifizierung der Webhook-Signatur wurde auf die Route-Ebene des App-Secrets verschoben, um eine sauberere Architektur zu gewährleisten.

Fehlerbehebungen

  • Common: WhatsApp Antwort-Zustellung: Fehler behoben, bei dem Agenten-Antworten lautlos verschluckt wurden, anstatt an WhatsApp zurückgesendet zu werden. Der Messaging-Relay-Back-Pfad protokolliert nun Diagnosedaten bei Zustellungsfehlern, wodurch zukünftige Probleme sofort diagnostizierbar sind.
  • Common: Thinking Block Signaturen über Modelle hinweg: Fehler „Ungültige Signatur im Thinking Block“ beim Wechsel von einem Nicht-Claude-Modell zu Claude mit Thinking-Modus behoben. Die Erkennung des Reasoning-Formats ist nun standardmäßig auf „unknown“ eingestellt, anstatt fälschlicherweise als Anthropic-Format identifiziert zu werden.
  • Common: Slate-Editierbarkeit für neue Dokumente: Neue DOCX-, PDF-, RTF- und XLSX-Slates werden nun korrekt in ihren Editoren geöffnet, anstatt als statisches HTML gerendert zu werden.
  • Common: Slate Export Fallback: Neue Dokumente ohne ursprüngliche Binärdaten werden nun ordnungsgemäß exportiert — XLSX fällt auf CSV zurück, RTF auf HTML-Konvertierung, PDF auf Browser-Druck.
  • Common: Sandbox Preview Rendering: Leere HTML- und Vega-Vorschauen behoben, die durch eine Diskrepanz des Sandbox-Origin beim postMessage-Targeting verursacht wurden.
  • Common: Track Changes Spalten-Offsets: Löschungen in den Änderungsnachverfolgungen ordnen nun HTML-zu-Text-Offsets korrekt zu, was falsch positionierte Änderungen in TipTap behebt.
  • Common: Private Sync Auth Recovery: Abgelaufene oder widerrufene OAuth-Tokens während der Synchronisation lösen nun automatisch eine Re-Autorisierung aus, anstatt eine manuelle Neuverbindung zu erfordern.
  • Common: Voice Streaming Entwurfs-Indikator: Das Voice-Transkript-Overlay zeigt nun den Status „Vorschau“ mit reduzierter Deckkraft an, um zu signalisieren, dass der Text vorläufig ist, bis die Aufnahme stoppt.
  • Common: MCP Tools auf nativen Plattformen: Lokale MCP-Server-Tools werden nun ordnungsgemäß auf macOS, Windows und Linux registriert — zuvor startete der Handler den MCP-Prozess, rief jedoch dessen Tools nie ab oder registrierte sie.
  • Common: Slate Context Chip Update: Der Kontext-Chip des aktiven Tabs wird nun aus dem Speicher aktualisiert, wenn sich der Titel eines Slate-Tabs nach dem Laden von Drive oder GitHub ändert. Der Texteingabebereich für Titel im Dark Mode ist nicht mehr unlesbar.
  • Extension: Chrome Stub Polyfill: Chrome-Browser-Tabs auf localhost mit window.chrome, aber ohne Extension-APIs, erhalten nun eine ordnungsgemäße Stub-Injektion, anstatt übersprungen zu werden.
  • Extension: Relay Client Bundle Crash: import.meta.env-Absturz im Relay-Client IIFE-Bundle durch Definition von Build-Zeit-Umgebungsvariablen behoben.
  • Extension: Remote App Login: Der Login der Remote-Browser-App wurde bereinigt, mit Google OAuth als primärer Methode und E-Mail/Passwort als eingeklappte sekundäre Option.

Version 0.9.708 (19. März 2026)

Verbesserungen

  • Common: Koordination der Generierungsanzeige: Die Typing-Dots pro Nachricht werden nun mit dem Fallback-Indikator auf Thread-Ebene koordiniert, wodurch doppelte hüpfende Punkte während der Generierung vermieden werden. Die Punkte bleiben nun während der Reasoning- und Tool-Ausführungsphasen sichtbar und werden erst ausgeblendet, sobald die finale Antwort zu streamen beginnt.
  • Common: Streaming-Cursor: Ein blinkender Cursor erscheint nun am Ende des gestreamten Textes und bietet einen klaren visuellen Hinweis darauf, dass die Antwort noch generiert wird.
  • Common: Formatierung der Reasoning-Vorschau: Eingeklappte Reasoning-Blöcke rendern nun Inline-Fett- und Kursivformatierungen anstelle von roher Markdown-Syntax.
  • Common: Slate-Dokumentenauflistung: list_slates zeigt nun korrekt die Inhaltsgröße für DOCX-, PDF- und XLSX-Dateien an, die über leichtgewichtige Thread-Abfragen geladen wurden. Die Auflistungen enthalten zudem Workflow-Anleitungen für die Bearbeitung von DOCX- und XLSX-Dokumenten.
  • Common: Bereich für Private Sync-Einstellungen: Die Private Sync-Einstellungen befinden sich nun in einem eigenen, dedizierten Bereich für eine klarere Organisation, getrennt von den allgemeinen Einstellungen.
  • Extension: Restrukturierung der Verbindungs-Einstellungen: Der Bereich Private Relay wurde in zwei klare Unterabschnitte gegliedert — Private Relay (Remote-Zugriff-Umschalter, immer sichtbar) und Caiioo Bridge (lokale MCP-Server und System-Tools). Der Remote-Zugriff-Umschalter erfordert nicht mehr, dass die Bridge ausgeführt wird.
  • Desktop: Tauri Unified Binary: Die Windows/Linux Desktop-App wurde von Compile-Zeit-Varianten in ein einziges Binary mit Runtime-Tier-Gating konsolidiert — die Sichtbarkeit des Sidepanels wird zur Laufzeit durch die Abonnementstufe bestimmt.

Fehlerbehebungen

  • Extension: Private Relay ohne Bridge: Private Relay verbindet sich nun unabhängig ohne die Caiioo Bridge-App. Zuvor wurde die Authentifizierung nur durch die Bridge-Verbindung initialisiert, wodurch reine Extension-Nutzer (einschließlich Linux/Windows) keine Messaging-Webhooks empfangen oder den Remote-Zugriff nutzen konnten.
  • Extension: Google OAuth-Routing: OAuth-Popup-Fehler in Chrome wurden behoben, indem getAuthToken übersprungen wird, wenn es nicht verfügbar ist, und auf BYOA-Anmeldedaten zurückgegriffen wird. Die COOP-Popup-Resilienz verhindert leere Fenster auf restriktiven Websites.
  • Common: ElevenLabs Streaming STT: Fehler behoben, bei dem die Sprachtranskription abbrach oder fehlschlug, wenn beim ElevenLabs-Streaming Verbindungsunterbrechungen auftraten. Die Spracheingabe der nativen App nutzt nun einen ordnungsgemäßen Fallback.
  • iOS: Externe Links in WKWebView: Links, die in Safari geöffnet werden sollten, öffnen sich nun korrekt extern, anstatt innerhalb der WebView der App geladen zu werden.
  • Common: Verwaiste Ad-Blocker-Regeln: Dynamische DNR-Ad-Blocking-Regeln bleiben nach Neustarts des Service Workers nicht mehr bestehen. disableAllBlocking fragt verwaiste Regeln nun direkt ab und entfernt sie, selbst wenn die Blocker-Instanz null ist.
  • Common: Lizenz-Synchronisierung bei Profilwechsel: Beim Wechseln von Profilen wird die Lizenz nun vom Server synchronisiert, um sicherzustellen, dass Tier-gated Tools sofort aktualisiert werden, anstatt einen Neustart zu erfordern.
  • Common: Token-Refresh vor dem Provisioning: Abgelaufene OAuth-Tokens werden nun vor dem Provisioning von API-Keys aktualisiert, um Silent Failures zu verhindern. Neue Server können nun bestehende Identitätsverbindungen übernehmen.
  • Web: Mobiles Menü in iOS Safari: Das Hamburger-Menü auf der Marketing-Website ist in iOS Safari nicht mehr transparent.
  • Common: React-18 Batching Race: Ein Generierungsindikator auf Thread-Ebene wurde als Fallback für Fälle hinzugefügt, in denen das React-18 State-Batching das Erscheinen der Typing-Dots pro Nachricht verhinderte.

Version 0.9.707 (17. März 2026)

Verbesserungen

  • Vorausfüllung bei BYOA-Rekonfiguration: Bei der Neukonfiguration einer bestehenden Google oder Microsoft Private App werden Client-Secret und Tenant-ID nun vorausgefüllt, sodass diese nicht erneut eingegeben werden müssen.

  • Sortierung der Modellliste: Modelle innerhalb jeder Anbietergruppe werden nun nach Veröffentlichungsdatum sortiert (neueste zuerst), um eine konsistente Reihenfolge über alle Plattformen hinweg zu gewährleisten.

Fehlerbehebungen

  • Wiederherstellung der Private Sync-Authentifizierung: OAuth-Token-Fehler (abgelaufene Sitzungen, entzogene Tokens, Chrome-Profil-Tokens) während der Initialisierung der privaten Synchronisierung werden nun korrekt in der UI angezeigt, anstatt lautlos in einen Fehlerzustand überzugehen.

  • Zuverlässigkeit von Slate-Änderungsverfolgung: 10 vertrauenskritische Korrekturen für nachverfolgte Änderungen – Race Condition beim Zusammenführen von Revisionen, Persistenz der Diff-Basis über alle Aktualisierungspfade, Erhalt der Formatierung beim DOCX-Export, Entfernen von HTML-Tags für TipTap-Abgleiche, Reihenfolge beim Akzeptieren/Ablehnen aller Änderungen sowie Konvergenzkorrekturen für Entity-Escaping und Tag-Regex-Matching.

  • Slate-Datenintegrität: Fehler behoben, bei dem eingefügte Bilder in einen toten lokalen Cache geschrieben wurden, Cloud-Quell-Metadaten nicht persistiert wurden und BroadcastChannel-Fallback für Live-KI-Updates im Relay/Mobile-Modus implementiert.

  • Slate-Sicherheit: XSS-Injection im Bildbetrachter behoben und Wildcard-postMessage-Ursprünge durch spezifische Erweiterungs-URLs ersetzt.

Version 0.9.706 (16. März 2026)

Neue Funktionen

  • Provider-Fehlerbanner: Wenn ein KI-Anbieter einen Fehler zurückgibt (402 Zahlung erforderlich, fehlender API-Schlüssel, Ratelimit), erscheint nun ein interaktives Banner mit klaren Anweisungen anstelle einer generischen Fehlermeldung.

Verbesserungen

  • DOCX Cross-Span-Bearbeitung: Das propose_change-Tool verarbeitet nun Suchen/Ersetzen-Vorgänge korrekt, die sich über mehrere Formatierungsbereiche erstrecken (z. B. teilweise fettgedruckter Text). Die Absicht wird weitergegeben, damit der Agent kontextbezogene Änderungen vornehmen kann.

  • PDF-Speicherleistung: Das native Speichern von PDFs ist deutlich schneller – redundantes Parsing wurde eliminiert, Importmodule werden zwischengespeichert und unnötige Operator-Bereinigungen übersprungen.

  • Modusname in Nachrichten: Die Modus-Auswahl in den Nachrichteneinstellungen zeigt nun den Markennamen des Modus anstelle der internen ID an.

Fehlerbehebungen

  • Google OAuth Token-Aktualisierung: Fehler „Nicht autorisiert“ beim Aktualisieren von Google OAuth-Tokens behoben, die den Zugriff auf Calendar, Gmail und Drive blockieren konnten.

  • Fehlermeldung bei bereitgestellten Schlüsseln: Benutzer mit bereitgestellten API-Schlüsseln sehen keine irreführende „Guthaben hinzufügen“-Fehlermeldung mehr – die Nachricht erklärt nun das tatsächliche Problem und die nächsten Schritte.

  • Race Condition bei gleichzeitigen Threads: Ein Fehler wurde behoben, bei dem das Wechseln von Threads während der Generierung dazu führen konnte, dass GENERATION_COMPLETE/ERROR-Ereignisse auf den falschen Thread angewendet wurden.

  • Wiederherstellungsschaltfläche im Versionsverlauf: Die Wiederherstellungsschaltfläche im Versionsverlauf von Slate erscheint nun korrekt, wenn der aktuelle Inhalt von der ausgewählten Revision abweicht.

  • Doppeltes OAuth-Popup: Neue Chrome-Erweiterungsbenutzer sehen bei der ersten Anmeldung nicht mehr zwei OAuth-Popups.

Version 0.9.705 (15. März 2026)

Neue Funktionen

  • Gruppierung der Einstellungskategorien: 19 Einstellungsbereiche sind jetzt in 5 ausklappbare Kategorien für eine schrittweise Offenlegung unterteilt. Der Bereich „Agenten-Modi“ zeigt einen übergreifenden Indikator mit Navigationslinks zu den betroffenen Abschnitten (Tool-Konfig, Modell-Konfig, Erscheinungsbild). Der Bereich „API-Anbieter“ öffnet sich standardmäßig mit einer Warnung zur Modellkapazität.

Fehlerbehebungen

  • Agenda-Synchronisierung bei doppelten Kalendern: Google Calendar-Konten erscheinen nicht mehr doppelt im Sync-Tab, wenn sowohl eine Login-Verbindung (Identität) als auch eine private Verbindung für dieselbe E-Mail-Adresse bestehen. Verbindungen werden nun vor dem Rendern dedupliziert.
  • i18n Einstellungskategorien: Bezeichnungen der Einstellungskategorien werden nun in alle unterstützten Sprachen übersetzt.

Version 0.9.704 (14. März 2026)

Neue Funktionen

  • Microsoft 365 Integration Foundation: Microsoft Scope-Routing, Graph API Client und Account-Service mit BYOA-Unterstützung. Definitionen der Scope-Hierarchie und Erweiterungen der Tool-Scope-Registrierung für den Microsoft-Provider. Microsoft wurde als Relay-Proxied-Provider hinzugefügt.
  • Rich Inline Rendering (RIR): Neue Codec-Architektur für das Rendern von Rich-Content direkt in Chat-Nachrichten. Enthält Codecs für HTML, Markdown und DOCX mit einer erweiterbaren Codec-Schnittstelle.
  • PDF-Strukturbaum & Layout-Analyse: Parser für getaggte PDF-Strukturbäume für semantisches Dokumentenverständnis. Heuristische Absatzgruppierung für nicht getaggte PDFs bietet eine Fallback-Layout-Analyse. Bildersetzung/-einfügung und Erkennung von Inhaltsüberlauf.
  • Auswahl des Messaging-Modus: Die Einstellungen der Messaging-Bridge enthalten jetzt einen Standard-Modus-Selektor, mit dem der Agent bei eingehenden Nachrichten mit der richtigen Persönlichkeit antworten kann.

Verbesserungen

  • Provider Rate Limit Retry: Alle LLM-Provider versuchen nun automatisch bei 429 (Rate Limit) und 529 (Overloaded) Antworten mit einem exponentiellen Backoff erneut zu senden, anstatt sofort abzubrechen. Bis zu 3 Versuche mit Jitter.
  • Google OAuth Scope Superset Matching: Schreib-Scopes erfüllen nun die Anforderungen für Lese-Scopes (z. B. deckt drive auch drive.readonly ab). Dies verhindert unnötige Re-Autorisierungen, wenn bereits ein umfassenderer Scope gewährt wurde.
  • BYOA Full-Scope Initial Auth: Wenn eine Private Connection erforderlich ist, fordert der initiale Auth-Flow nun alle notwendigen Scopes im Voraus an, anstatt zweimal zu fragen (einmal für Basis, einmal für Erweitert).
  • Google 404-zu-Expanded-Access Promotion: Wenn eine BYOA-Verbindung einen 404-Fehler bei einer Google Workspace-Datei erhält, wird der Fehler zu einer Aufforderung für erweiterten Zugriff hochgestuft, anstatt eine Sackgassen-Fehlermeldung anzuzeigen.
  • Messaging Credentials Private Sync: Zugangsdaten für die Messaging-Bridge werden jetzt über E2E-verschlüsselten Private Sync geräteübergreifend synchronisiert, anstatt gerätespezifisch zu sein. Sync-Manifest auf v10 aktualisiert.
  • OAuth Wait Extended Timeout: BYOA- und Expanded-Access-OAuth-Flows haben nun ein Timeout von 5 Minuten (vorher 2 Minuten), um Benutzern genügend Zeit für die Schritte in der Google Cloud Console zu geben.
  • Sparkle Framework Signing: macOS-Distributions-Builds signieren nun verschachtelte Binärdateien des Sparkle-Frameworks korrekt in Inside-Out-Reihenfolge, wodurch Notarisierungsfehler behoben werden.
  • Tauri Node Binary Bundling: Tauri-Konfigurationen bündeln nun die Node.js-Binärdatei als Ressource für die Sidecar-Ausführung unter Windows/Linux.
  • Messaging Settings Search: Der Bereich Messaging-Bridge ist nun über die Suchleiste der Einstellungen mit Schlüsselwörtern wie „whatsapp“, „telegram“, „webhook“ auffindbar.
  • Settings Relay Forwarding: Das Speichern von Einstellungen wird nun über die WebSocket-Bridge an den Relay-Server weitergeleitet, um sicherzustellen, dass Messaging-Zugangsdaten und andere Konfigurationsänderungen die Statusdatei des Servers erreichen.

Fehlerbehebungen

  • Slate Währung vs. Math: Dollarbeträge wie $9/mo in Markdown-Tabellen werden nicht mehr fälschlicherweise als LaTeX-Inline-Math-Begrenzer interpretiert. Der Math-Regex berücksichtigt nun maskierte Währungs-Dollarzeichen.
  • Conversation Page ToastProvider: Ausgekoppelten Konfigurations-Tabs fehlte der ToastProvider, was dazu führte, dass Toast-abhängige Funktionen lautlos fehlschlugen. Der Provider-Baum entspricht nun dem Sidepanel.

Version 0.9.703 (14. März 2026)

Neue Funktionen

  • Google Picker Integration: Vollständiger Google Drive Datei-Picker mit Popup/Iframe-Hybrid, Multi-View-Filtern (Docs, Sheets, Slides, PDFs) und Drive-Referenz-Chips im Composer. Dateien, die über den Google Picker ausgewählt werden, erhalten automatisch drive.file-Zugriff.
  • Google Sheets Native Sync: Öffnen Sie Google Sheets in Slate mit vollständiger Bearbeitung auf Zellenebene (Round-Trip). Der Sheets-Codec konvertiert Tabellen-Grid-Daten in TipTap HTML-Tabellen und zurück, inklusive Konflikterkennung via Drive modifiedTime. Unterstützt Lesen, Batch-Zellen-Updates und strukturelle Änderungen (Blätter hinzufügen/löschen, Zellen verbinden).
  • Google Slides Read-Only View: Google Slides Präsentationen werden in Slate mit Folien-Thumbnails und extrahierten Textinhalten für die Suchbarkeit gerendert.
  • Gmail Batch Fetch & Markdown Konvertierung: Das Gmail-Tool ruft Nachrichten-Metadaten jetzt in Batches (bis zu 100 gleichzeitig) statt einzeln ab, verfügt über einen 5-minütigen Label-Namen-Cache und eine automatische HTML-zu-Markdown-Konvertierung des Bodys für eine sauberere Verarbeitung durch LLMs.
  • Selection Overlay: Die Schaltfläche „Zum Prompt hinzufügen“ erscheint beim Markieren von Text auf jeder Webseite, sodass Sie ausgewählte Inhalte schnell zur Konversation hinzufügen können.
  • Relay Overlay Manager: Agent-Overlay-Befehle werden jetzt über die Browser-Extension geroutet, was Agent-gesteuerte UI-Overlays auf der aktiven Webseite ermöglicht.
  • Inline Quick-Tasks Model Picker: Die Modellauswahl für Quick-Tasks ist jetzt direkt in das Dropdown-Menü des Model Pickers eingebettet, statt in einem separaten Menü.
  • Slate DOCX Export aus Google Drive: In Slate geladene Google Docs werden jetzt als DOCX exportiert (via readFileContentAsBinary), wodurch der vollständige visuelle TipTap-Editor mit Änderungsverfolgung aktiviert wird, anstatt sie als reines Markdown zu öffnen.
  • Private Connection Setup Wizard: Verbesserter BYOA-Assistent mit einem dedizierten Schritt „Testbenutzer hinzufügen“, der dem aktuellen Google Cloud Console-Flow entspricht. Die Teilschritte des Consent-Screens folgen nun dem tatsächlichen 4-stufigen Accordion von Google. E-Mail-Anweisungen werden personalisiert, wenn die Identität des Benutzers bekannt ist.
  • Private Connection Promotion Banner: Wenn der Agent erweiterte Google-Scopes benötigt (Gmail, Calendar etc.) und keine Private Connection existiert, erscheint ein animiertes Banner mit einem One-Click-Pfad zum Setup-Assistenten. Der Agent bleibt pausiert, während der Benutzer das Setup abschließt, und setzt die Arbeit automatisch fort, sobald die Verbindung gespeichert ist.
  • Export Fidelity Warnings: Vor dem Export eines Dokuments in ein anderes Format (z. B. PDF zu DOCX) warnt ein Fidelity-Dialog vor potenziellen Formatierungsverlusten mit nach Schweregrad kategorisierten Hinweisen (Info, Warnung, Kritisch).
  • PDF Annotation Extraction: PDF-Textanmerkungen und Markups werden nun während der Dokumentenverarbeitung und -rekonstruktion extrahiert und beibehalten.
  • Reminders Calendar Sync: Das Reminders-Modal unterstützt jetzt den Kalender-Sync mit erweitertem Access-Gating.

Verbesserungen

  • Google Docs Sync Fidelity: Verbesserte Extraktion von Formatierungs-Spans mit korrektem Tag-Matching (behandelt selbstschließende Tags, fehlerhafte Verschachtelungen) und Konflikterkennung bei gleichzeitigen Bearbeitungen.
  • Private Sync Account Mismatch Detection: Das Account-Dropdown in den Sync-Einstellungen erkennt jetzt, wenn die konfigurierte Sync-E-Mail mit keinem verbundenen Google-Konto übereinstimmt, und zeigt einen „Nicht verbunden“-Indikator mit der Option zum Wechseln an.
  • Teams/Enterprise Effective Tier: Die Lizenzvalidierung verwendet jetzt effectiveTier aus der Team/Enterprise-Delegation, um den korrekten Feature-Zugriff sicherzustellen, wenn der Tier eines Benutzers von einem Team-Plan geerbt wird.
  • „Private App“ umbenannt in „Private Connection“: Alle benutzerorientierten Referenzen verwenden jetzt „Private Connection“ statt „Private App“ – klarer für Nicht-Entwickler, die OAuth-Integrationen nicht mit „Apps“ assoziieren.
  • Google OAuth Scope Alignment (drive.file): Alle erweiterten Google Drive Scopes (drive, drive.readonly, documents.readonly, spreadsheets.readonly, presentations.readonly) werden für Nicht-BYOA-Benutzer nun durch den engeren drive.file Scope ersetzt, entsprechend den Anforderungen für verifizierte Apps von Google. BYOA-Benutzer behalten die vollen Scopes.
  • Gmail-Berechtigungen im Scope-Selector sichtbar: Scopes zum Lesen, Verfassen und Ändern von Gmail sind jetzt für alle Benutzer im Google Permissions Editor unter „Hochempfindliche Berechtigungen“ sichtbar, statt nur für BYOA-Nutzer. Diese Scopes werden auf dem Consent-Screen genehmigt und via JIT angefordert, wenn Gmail-Tools sie benötigen.
  • Google Picker Consent Recovery: Wenn Google-Berechtigungen extern widerrufen werden (z. B. in den Google-Konto-Einstellungen), erkennt die App veraltete Scopes jetzt automatisch, entwertet sie, autorisiert neu und versucht es erneut – statt lautlos mit 403-Fehlern abzubrechen.
  • Agent Google Drive Guidance: Tool-Fehlermeldungen und Hinweise bei leeren Ergebnissen weisen den Agenten nun an, dem Benutzer zu sagen, dass er auf die +-Schaltfläche im Composer klicken und Google Drive auswählen soll, anstatt nicht verfügbare Tool-Aktionen vorzuschlagen.
  • Slate Drive Picker vereinfacht: Slates „Aus Google Drive laden“ lädt Dateien jetzt direkt und überspringt den Auswahlbildschirm zwischen „In Drive bearbeiten“ und „Zur Konversation hinzufügen“.
  • Offizielles Google Drive Logo: Drive-Chips und das Anhang-Menü verwenden jetzt das offizielle Google Drive Logo anstelle des generischen grünen Dreiecks.
  • Unified Model Picker: Die Auswahl des Helper-Modells fällt auf das Standardmodell zurück, mit einem einzigen konsolidierten Modell-Dropdown.
  • DOCX Non-Text Element Passthrough: Die DOCX-Rekonstruktion bewahrt Nicht-Text-Elemente (Bilder, Diagramme, eingebettete Objekte), die nicht Teil des Textbearbeitungs-Flows sind.
  • PDF Multi-Segment Line Editing: Der PDF-WYSIWYG-Editor verarbeitet jetzt Zeilen, die über mehrere Textsegmente verteilt sind.
  • Auth Rate Limit erhöht: Das Rate-Limit für den Auth-Endpunkt wurde von 10/Min auf 30/Min erhöht, um schnelle OAuth-Token-Austausche während des BYOA-Setups zu ermöglichen.
  • OAuth Token Endpoint Reclassified: Der OAuth-Token-Austausch wurde vom Auth-Rate-Limit-Bucket in den allgemeinen Bucket verschoben, um Drosselungen während Multi-Scope-Autorisierungs-Flows zu verhindern.

Fehlerbehebungen

  • iOS Modal Stacking: Absturz behoben, wenn Datei-Picker oder Slate-Overlays angezeigt wurden, während bereits ein anderes Modal (z. B. Browser-Overlay) aktiv war. Picker und Overlays werden nun auf dem obersten View Controller angezeigt.
  • Slate Line Range Validation: get_slate_content gibt nun einen klaren Fehler zurück, wenn startLine außerhalb der Dokumentlänge liegt, anstatt lautlos leeren Inhalt zu liefern.
  • Server Path Traversal: Storage-Keys werden jetzt gegen Directory-Escapes validiert, um Path-Traversal-Angriffe auf den Sync-Storage-Endpunkt zu verhindern.
  • Ad Blocker Regex Cap: Der DNR-Konverter begrenzt Regex-Regeln jetzt auf das Chrome-Limit von 1000 Regeln und verwirft große begrenzte Quantifizierer, die das Speicherlimit von RE2 überschreiten, um Installationsfehler der Extension zu vermeiden.
  • OAuth Timeout bei erweitertem Zugriff: Timeout von 120 Sekunden behoben, wenn der Agent erweiterte Google-Scopes benötigt (Gmail, Calendar). Die Wartezeit für ausstehende OAuth-Anfragen wurde für das BYOA-Setup auf 5 Minuten verlängert; das Abschließen der Verbindung in den Einstellungen setzt den pausierten Agenten automatisch fort.
  • Chat UI Freezes: Überlappende asynchrone Intervalle und stille Broadcast-Fehler behoben, die die Chat-Oberfläche einfrieren konnten.
  • Cloud Sync Download Batch: TypeScript Null-Check-Fehler im Cloud-Sync-Download-Batch-Handler behoben.
  • Service Worker Dynamic Imports: Dynamische Imports wurden für die Kompatibilität mit dem Chrome MV3 Service Worker in statische Imports umgewandelt.
  • BYOA-Only Scope Enforcement: Die Aktionen convert_to_google_doc und convert_to_google_sheet erfordern jetzt korrekt nur drive.file anstelle von breiten Editor-Schreibrechten.
  • Drive Chip Format: Dreiteiliges Format für Drive-Referenz-Chips mit korrektem BYOA-only Scope-Gating.
  • Google Picker CORS: Der Picker wird jetzt auf dem privaten Relay gehostet, um Cross-Origin-Probleme mit dem Popup-Scope-Flow zu lösen.

Version 0.9.701 (6. März 2025)

Verbesserungen

  • Ollama Context Window Anzeige: Der Kreis für die Nutzung des Kontextfensters wird nun für Ollama-Modelle gerendert, indem der /api/show-Endpunkt für num_ctx abgefragt wird, anstatt sich auf die Modellliste von OpenRouter zu verlassen, die keine lokalen Modelle enthält.
  • Ollama Tool Calling: Dynamische Tool-Auswahl für Ollama korrigiert – reicht tool_choice an die API weiter (unterstützt seit Ollama v0.5.1), deaktiviert den Think-Modus bei aktiven Tools, um korruptes JSON zu verhindern, und nutzt ein leichtgewichtiges Non-Streaming-Hilfsmodell als Fallback, wenn das Primärmodell Tool-Aufrufe nicht unterstützt.
  • OpenRouter Reasoning Cache: Fehler behoben, bei dem Reasoning-Text vorzeitig vom Streaming-Provider gelöscht wurde. Der Cache-Lebenszyklus wird nun vom agent-runner an Iterationsgrenzen verwaltet, konsistent mit Anthropic- und Google-Providern.
  • PDF WYSIWYG Zuverlässigkeit: Die globale Textausrichtung verarbeitet PDF.js-Splitting-Operatoren über mehrere TextItems hinweg. Block-Bearbeitung auf nicht übereinstimmenden Spannen (Anmerkungen/Header-Text) deaktiviert, um Exportfehler zu verhindern. CMap 2-Byte-Dekodierung beschädigt keine mehr von Word generierten PDFs mit 1-Byte-ASCII-Schriftarten. Bounds-Check für Operator-Matching verhindert Out-of-Range-Indizes bei leeren Textelementen.
  • Desktop-Plattform-Erkennung: Der dynamische Tool-Selektor verwendet die localFolderSync-Fähigkeit anstelle von caiiooReminders für die Desktop-Erkennung und appleScript/appleNotes anstelle von Kalender/Erinnerungen für die macOS-Erkennung (Kalender/Erinnerungen sind via EventKit Apple-übergreifend).

Version 0.9.700 (5. März 2025)

Neue Funktionen

  • File Manager: Vollständiges Dateiverwaltungssystem mit verschachtelten Ordnern, Benutzer-Tags, Favoriten und einer dedizierten File Manager UI. Organisieren Sie Anhänge in Ordnerhierarchien, filtern Sie nach Typ (Screenshots, AI-Bilder, Fotos), suchen, sortieren und betrachten Sie Dateien im Raster- oder Listenmodus. Automatisches Thread-Tagging verknüpft Dateien mit Konversationen. Unterstützung für Private Sync via Manifest v9.
  • Local Folder Sync: Bidirektionale Synchronisierung zwischen lokalen Dateisystemordnern und dem File Manager. Die mutationsgesteuerte Resynchronisation überträgt Löschungen, Massenlöschungen und Verschiebungen automatisch mit einem 2-Sekunden-Debounce auf die Festplatte. Die Erkennung von Unterordner-Verschiebungen verschiebt Dateien auf der Festplatte, wenn sie in Caiioo neu organisiert werden. Das Navigieren in einen beliebigen Unterordner innerhalb eines Sync-Baums löst eine automatische Resynchronisation aus.
  • Dateitypübergreifende Tracked Changes: Einheitlicher Workflow zum Akzeptieren/Ablehnen über DOCX, PDF und Markdown hinweg. DOCX-Bearbeitungen werden jetzt als Tracked Changes mit derselben Diff-Engine aufgezeichnet, die auch für Markdown und Code-Slates verwendet wird. PDF Tracked Changes sind in den visuellen Editor integriert. Die Aktion resolve_tracked_changes ermöglicht es dem Agenten, Revisionen programmatisch zu akzeptieren oder abzulehnen.
  • PDF WYSIWYG Editing: Direkte Textbearbeitung auf gerenderten PDF-Seiten mit dokumentenangepasstem Styling. Die Textebene verknüpft Bearbeitungen über textItemIndex mit Quell-Content-Stream-Operatoren für eine chirurgische Rekonstruktion beim Export. Enthält eine plainText-Baseline für die Änderungserkennung.
  • DOCX-Rendering-Treue: Umfangreiche DOCX-Vorschau mit Absatzausrichtung, Hyperlinks, Schriftfarbe/-größe, Zeilenabstand, Einzug und Tabellenzellenschattierung. Die Code-Ansicht zeigt die Markdown-Konvertierung für einen Token-effizienten LLM-Verbrauch.
  • Universal Messaging (nur interne Tests): Senden und Empfangen von Nachrichten über WhatsApp, Telegram und Slack mit Local-First-Privatsphäre. Der Agent kann Nachrichten verfassen und senden, Konversationen auflisten und auf Threads antworten – alles geroutet über Ihr eigenes Gerät.
  • Google Meet Integration: Meeting-Recall-Tool mit mehreren Aktionen: list_meetings (Entdecken der letzten Meetings mit Datumsbereichsfilterung) und get_meeting (Abrufen von Transkripten). Durchgängig implementiert über die volle OAuth/JIT/Scope-Approval-Pipeline mit Credentials-Vault-Unterstützung.
  • Gmail Send Email: Direkter E-Mail-Versand über die Gmail API, abgesichert durch eine Genehmigung für Hochrisiko-Tools. Risk-Level-Overrides pro Aktion ermöglichen es, dass send_email eine explizite Bestätigung erfordert, während Entwurfsaktionen auf mittlerem Risiko bleiben.
  • Microsoft BYOA: Bring Your Own App Unterstützung für Microsoft 365. Registrieren Sie Azure AD App-Registrierungen für Microsoft OAuth Verbindungen. Multi-Provider BYOA-Registry (Google + Microsoft) mit Tenant-ID-Unterstützung und einem 3-stufigen Azure Portal Setup-Assistenten.
  • Poe Provider: Neue LLM-Provider-Integration für Poe, mit Modellauflistung, Provider-gruppierter Modellauswahl, Erkennung von Vision/Tools/Reasoning-Fähigkeiten und Preisanzeige.
  • What's New Dialog: Eine über die API bereitgestellte Content-Pipeline liefert Release Notes und Benutzerhandbuch-Seiten. Ein asynchroner What's-New-Dialog zeigt bei Updates die Highlights der Version an.
  • Private Sync Account Selector: Wählen Sie aus, welches Google-Konto für Private Sync verwendet werden soll, anstatt standardmäßig das Primärkonto zu nutzen.
  • Native TipTap Diff Marks: Das separate marked.js Rendering-Overlay für AI-Revisionsvorschauen wurde durch native ProseMirror-Markierungen (DiffAdded/DiffRemoved) ersetzt. Revisionen werden nun als Inline-Tracked-Changes mit konsistenter Typografie gerendert, inklusive Akzeptieren/Ablehnen auf Chunk-Ebene.
  • Mermaid Diagrams: Live-Rendering von Mermaid-Diagrammen in Code-Blöcken innerhalb des TipTap-Vorschaumodus von Slate.
  • Fuzzy Section Search im Help Tool: Das Help Tool unterstützt jetzt Fuzzy Matching bei der Suche nach spezifischen Abschnitten innerhalb der Dokumentationsseiten.

Verbesserungen

  • File Manager UX Polish: Icon-Indikatoren für Ordner-Sync, Löschbestätigungsdialoge, Shift-Klick-Bereichsauswahl, Toolbar-Umbruch statt Überlauf bei geringer Breite und korrigierte Tag-Persistenz nach Neuladen.
  • Responsive Composer Layout: Ein Drei-Zonen-Flex-Layout verhindert, dass der Button für neue Threads bei geringer Breite aus dem Bildschirm geschoben wird. Modus- und Modellauswahl verwenden gestaffelte Breakpoints zum Ausblenden von Text. Eigene Icons für Agenten und AI-Chips ersetzen generische Standardwerte.
  • Settings UX: Neu geordnete Abschnitte für besseren Flow (Personalization → Credentials → Tool Approvals → Agent Modes → Tool Configuration → Skills Library → Tool Servers → Document Processing → Voice).
  • Revision State Integrity: Korrektur von Fehlern beim Löschen großer Inhaltsblöcke während aktiver AI-Revisionen – sourceContent Immutabilität, Schwellenwert für Chunk-Relokation auf 0,7 erhöht, veraltete Chunks werden automatisch abgelehnt und Integritätsprüfungen der Versionshistorie.
  • Agent Loop Reliability: Behebung einer Abort-Controller Race Condition, bei der alte Durchläufe den Controller eines neuen Durchlaufs löschen konnten. Das Abbruchsignal wird nun in die in der Warteschlange befindlichen Tools propagiert. Verwaiste Ausführungszustände senden Fehlermeldungen, anstatt leere Nachrichten zu hinterlassen.
  • Interjection Handling: Vereinheitlichte getActiveBranchMessages Traversierung auf Server und UI, um Interjections konsistent zu überspringen. Fehler behoben, bei dem die Antwort nach einem Follow-up verschwand, wenn die Streaming-parentId auf die Interjection statt auf die Benutzernachricht zeigte.
  • macOS Native Stability: Behebung einer Restart Race Condition mit Process Epoch Tracking, URLSession-Leak bei Wiederverbindung und LineBuffer Data Race zwischen Pipe-Handler und Stop.
  • Google Sheets Fix: create_table schreibt nun Spaltenüberschriften, anstatt die erste Zeile leer zu lassen.
  • Middleware Cleanup: requireAuth Middleware aus 10 Inline-Auth-Prüfungen in apple-routes, mcp-routes und attachment-routes extrahiert.
  • Image Type Filtering: Der File Manager unterscheidet Screenshots, AI-generierte Bilder und Benutzerfotos mit separaten Filteroptionen und unterschiedlichen Icons.
  • Mode/Model Picker Parity: Schriftstärke und Icon-Strichstärke zwischen Modus-Auswahl und Modell-Auswahl angeglichen.
  • Beta Tier Gating: Der Credentials Vault beschränkt Beta-Features basierend auf Tier-Prüfungen.
  • CIDFont Re-Encoding: Die PDF-Rekonstruktion unterstützt CIDFont-Kodierung mit ToUnicode CMap-Tabellen und Identity-Fallback für Zeichen, die nicht in der Map enthalten sind.
  • PDF Export Renamed: "Download" wurde im gesamten PDF-Workflow zur Klarheit in "Export" umbenannt.

Fehlerbehebungen

  • PDF Text Disappearing: Fehler behoben, bei dem PDF-Ansichtstext beim Blur verschwand und Inhalte beim Export aus der WYSIWYG-Bearbeitung verstümmelt wurden.
  • PDF Tracked Changes Routing: Verhindert, dass PDF Tracked Changes durch die einheitliche Diff-Engine geleitet werden, was PDF-spezifische Operatordaten beschädigte.
  • PDF Export Integrity: Der PDF-Download schlägt nun explizit mit Diagnosemeldung fehl, anstatt stillschweigend auf den Markdown-Export zurückzufallen.
  • Markdown Table Line Breaks: <br> Tags in Markdown-Tabellen werden nun als tatsächliche Zeilenumbrüche statt als literaler Text gerendert.
  • DOCX Tracked Deletions Preserved: Fehler behoben, bei dem nachverfolgte Löschungen in DOCX beim Wechsel zwischen Visual- und Code-Ansicht entfernt wurden.
  • Tracked Changes on Stored Markdown: Fehler behoben, bei dem propose_change auf Markdown-Slates keine Korrekturmarkierungen anzeigte, wenn diese aus dem Speicher geladen wurden.
  • Reject Reverts Content: resolve_tracked_changes mit "reject" setzt den Inhalt für Markdown- und Code-Slates nun korrekt zurück.
  • Slate Save Loop: Endlosschleife beim Speichern behoben, die ausgelöst wurde, wenn Track Changes aktiv war.
  • Messaging Stability: Korrekturen an Routing, Reply-Threading, Profil-Handling, Queue-Resilienz, Webhook-Signaturen, Sender-Sanitization und Payload-Limits.

Version 0.9.662 (27. Februar 2025)

Neue Funktionen

  • Bring Your Own App (BYOA): Verwenden Sie Ihre eigenen Google OAuth-Zugangsdaten anstelle der integrierten App von caiioo. Die Multi-App-Unterstützung ermöglicht es Teams, einen einzigen OAuth-Client organisationsweit zu teilen, während individuelle API-Keys beibehalten werden. BYOA-Verbindungen erkennen veraltete Token automatisch und fordern zur erneuten Authentifizierung auf.
  • Wikilink-Navigation: Wikilinks in doppelten eckigen Klammern im Obsidian-Stil zwischen Slate-Dokumenten zum Aufbau vernetzter Wissensdatenbanken. Klicken Sie auf einen Wikilink, um sofort zwischen Slates zu navigieren.
  • Skills-Menü: Einfügen von Skills per Tab-Taste, Dropdown-Menü mit dynamischer Höhe, Inline-Bearbeitung mit Variablen-Chips und eine gemeinsame SkillForm-Komponente für vollständiges CRUD direkt aus dem Composer.
  • DOCX-Download: Laden Sie Slate-Markdown- und Textdokumente als DOCX-Dateien herunter, wobei nachverfolgte Änderungen erhalten bleiben.
  • Automatisches Ausfüllen von Tabellen: insert_component füllt jetzt Tabellenzellen automatisch aus strukturierten Daten aus, wodurch leere Platzhaltertabellen eliminiert werden.
  • Gemini 3.1 Flash: Als Bildgenerator-Modelloption neben den bestehenden Gemini-, FLUX- und Seedream-Modellen hinzugefügt.
  • Google Drive Speicherung für alle Konten: Das Speichern in Google Drive ist jetzt für jedes verbundene Google-Konto verfügbar, nicht nur für das Primärkonto.
  • Einheitliche Diff-Engine: Komplette Neuentwicklung des Diff-Systems zur Änderungsvorgabe von Slate (Phasen 0–7) mit TOCTOU-Sicherheit, Caching, Widgets zum Annehmen/Ablehnen pro Änderung und Unterstützung für Mobile-Tap-to-Toggle.

Verbesserungen

  • Adaptiver Private Sync: Die Sync-Polling-Rate passt sich dynamisch basierend auf der Aktivität an. Die Optimierung der Download-Only-Sperre reduziert Konflikte.
  • OAuth-E-Mail-Erfassung: Google OAuth enthält jetzt immer Identity-Scopes, sodass die E-Mail des Benutzers bei jeder Verbindung erfasst wird, was leere E-Mails bei einigen Konten behebt.
  • Sicherheitshärtung: Gehärtete OAuth PKCE-Flows, Agent-Subprozess-Grenzen und Brute-Force-Sperre pro Konto bei wiederholten fehlgeschlagenen Authentifizierungsversuchen.
  • Browser-Chip-Layout: Browser-Selector-Chips sind kleiner und brechen um, anstatt den Container zu überlaufen.
  • Registry-gesteuerte Bildanbieter: Die fest codierte Liste der Bildanbieter wurde durch eine dynamische Registry ersetzt, was das Hinzufügen neuer Modelle trivial macht.
  • Content i18n Pipeline: Einheitlicher Hash-gesteuerter Content-Sync für alle Dokumentationsseiten mit Unterstützung für inkrementelle Übersetzungen.

Fehlerbehebungen

  • Mathematische Ausdrücke in der Vorschau: Fehler behoben, bei dem mathematische Ausdrücke beschädigt wurden, wenn von der TipTap-Vorschau zur Code-Ansicht gewechselt wurde.
  • Wikilinks in der Vorschau: Fehler behoben, bei dem die Wikilink-Syntax beim Umschalten zwischen TipTap-Vorschau und Code-Ansicht entfernt wurde.
  • Verschwindende Thread-Nachrichten: Fehler behoben, bei dem Thread-Nachrichten durch STATE_PATCH entfernt wurden oder beim Modellwechsel während der Konversation verschwanden.
  • Interjektions-Waisen: Fehler behoben, bei dem verwaiste parentIds nach der Filterung von Interjektions-Nachrichten zu Rendering-Fehlern führten.
  • Endlosschleife bei Private Sync: Endlosschleife im Sync behoben, die durch gleichzeitige Zeitstempel-Konflikte bei Collection-Items und thread_data_-Präfix-Verschmutzung verursacht wurde.
  • BYOA-Sonderfälle: Fehler behoben, bei dem die BYOA-Konfiguration beim Löschen nicht wiederhergestellt wurde, sowie Probleme mit asynchronen Save-Races, der Nutzung veralteter Localhost-Popups in der Extension anstelle von launchWebAuthFlow und falscher Priorisierung von issuedByClientId.
  • Wiederherstellung des Private Sync Scopes: Fehler behoben, bei dem die Entsperrung des Private Sync lautlos fehlschlug, wenn Google Drive-Scopes abgelaufen waren oder fehlten.
  • Doppelte Skills: Verhindert, dass doppelte Skills nach Private Sync-Merges erscheinen.
  • Routing nachverfolgter Änderungen: get_tracked_changes und get_comments in das SlateTool-Action-Routing integriert, damit der Agent den Revisionsstatus lesen kann.
  • DOCX-Download-Quelle: Fehler behoben, bei dem downloadAsDocx veraltete Artefakt-Inhalte anstelle des Live-Editor-Status verwendete.
  • Intelligente Modellnamen-Abkürzung: Lange Modellnamen überlaufen den kompakten Picker dank intelligenter Abkürzung nicht mehr.
  • Markdown-Link-Rendering: Fehler behoben, bei dem chrome-extension: und Caiioo: URLs in gerenderten Markdown-Links blockiert wurden.
  • Thread-Erstellungsgeschwindigkeit: Die Zeit zur Thread-Erstellung wurde durch Eliminierung redundanter Einstellungs-Kaskaden-Lookups halbiert.
  • Chrome-Tab-Titel: Der dynamische Chrome-Tab-Titel basierend auf dem aktiven Konversations-Thread wurde wiederhergestellt.
  • Adaptive Greeting Tokens: max_tokens für adaptive Begrüßungen erhöht, um Abschneiden bei Reasoning-Modellen zu verhindern.

Version 0.9.661 (25. Februar 2025)

Neue Funktionen

  • Agent Interjection: Steuern Sie die KI während des Laufs, indem Sie eine Nachricht eingeben und die Eingabetaste drücken, während sie arbeitet. Der Agent sieht Ihre Anweisungen am nächsten Entscheidungspunkt und passt den Kurs an — ein Abbrechen und Neustarten ist nicht erforderlich. Eine bernsteinfarben markierte Senden-Schaltfläche erscheint neben der Stopp-Schaltfläche, wenn Sie Text zum Senden bereit haben.
  • API Tool Management: Das API-Integrations-Tool unterstützt jetzt save_tool, list_tools und delete_tool als erstklassige Aktionen. Dies erleichtert die Verwaltung von vom Agenten entdeckten APIs direkt aus Konversationen heraus. Kostenlose Nutzer sehen GET und list_tools; Pro-Nutzer erhalten den vollen Funktionsumfang.
  • Live Token Counter: Token- und Kostenverbrauch werden jetzt in Echtzeit während des Streamings aktualisiert und in der Fußzeile jeder Nachricht angezeigt. Spezialisierte Kosten (Bildgenerierung, Web-Suche) werden schrittweise hinzugefügt, sobald das jeweilige Tool abgeschlossen ist.
  • Auto-Expand Tool Cards: Tool-Karten erweitern sich automatisch, wenn sie Streaming-Argumente empfangen oder eine Genehmigung benötigen, und schließen sich automatisch bei erfolgreichem Abschluss. Fehler und abgelehnte Tools bleiben zur Überprüfung erweitert.
  • Monaco Diff Editor: Slate-Code-Revisionen verwenden jetzt den nativen Inline-Diff-Editor von Monaco mit Schaltflächen zum Akzeptieren/Ablehnen pro Änderung und ersetzen damit das bisherige benutzerdefinierte Dekorationssystem.

Verbesserungen

  • Private Sync Auth Recovery: Private Sync-Fehler aufgrund abgelaufener oder widerrufener Google-Token zeigen jetzt handlungsrelevante Schaltflächen "Google neu verbinden" und "Berechtigungen erteilen" anstelle einer passiven Fehlermeldung. Die Wiederverbindung fordert die korrekten Drive-Berechtigungen an und wählt das richtige Google-Konto vor.
  • Private Sync Multi-Account: Private Sync authentifiziert sich jetzt gegenüber dem Google-Konto, das mit der Konfigurations-E-Mail übereinstimmt, anstatt auf das zuerst verbundene Konto zurückzugreifen. Behebt das Synchronisieren mit dem falschen Drive, wenn mehrere Google-Konten verbunden sind.
  • Brand Refresh: Neue Farbpalette in River Blue und Rock Grey, abgeleitet vom caiioo-Logo, ersetzt das bisherige lila Thema in der gesamten App und auf der Website.
  • OAuth Security: Google, GitHub und Slack OAuth Client Secrets wurden aus dem Extension-Paket entfernt. Der Token-Austausch erfolgt nun über einen sicheren Cloudflare-Relay-Proxy, wodurch Secrets aus dem Client-Code eliminiert werden.
  • Schnellerer Start: Anhangsinhalte (Bilder, extrahierter Text) werden jetzt bei Bedarf geladen statt beim Start, was die initiale Ladezeit für Konversationen mit vielen Anhängen erheblich verkürzt.
  • Schnelleres Streaming: Die Nutzung des Context-Fensters wird jetzt über den schnellen Broadcast-Pfad gestreamt, anstatt den Umweg über den Speicher zu nehmen, was Echtzeit-Updates ohne Async-I/O pro Agent-Schleife ermöglicht.
  • Private Sync Speed: Der Google Drive File-ID-Cache bleibt über Neustarts hinweg erhalten, wodurch ein vollständiger API-Aufruf zur Dateiauflistung beim ersten Synchronisierungszyklus entfällt.
  • Unified Streaming Render Path: Streaming- und finale Inhalte fließen nun durch einen einzigen Render-Pfad, was das Flackern bei Abschluss der Generierung eliminiert und Interjection-Nachrichten erhält.
  • Cross-Model Switching: Das Wechseln zwischen AI-Providern mitten im Thread (z. B. Gemini zu Claude) verursacht keine "Invalid signature in thinking block"-Fehler mehr. Fremde Reasoning-Artefakte werden automatisch zu narrativem Text geglättet, wodurch der Kontext ohne inkompatible kryptografische Signaturen erhalten bleibt.
  • Disabled Tool Guidance: Wenn die KI versucht, ein deaktiviertes Tool zu verwenden, erhält sie nun hilfreiche Vorschläge (ähnliche aktivierte Tools, Anleitung zur Aktivierung) anstelle eines generischen "nicht gefunden"-Fehlers.
  • Responsive Composer Layout: Die Composer-Toolbar nutzt ein gestaffeltes progressives Einblenden — Modus-Auswahl, Modell-Auswahl, Einstellungen, Agenda und Hilfe-Icons erscheinen, sofern Platz vorhanden ist, anstatt abgeschnitten zu werden.
  • Settings Color Coding: Einstellungsbereiche verwenden jetzt ein 3-Farben-System — Akzenttönung für Anpassungsbereiche, abwechselnde neutrale Töne für den Rest — für eine klarere visuelle Gruppierung.
  • Onboarding Errors: Die Bereitstellung kostenloser Keys zeigt nun beschreibende Fehlermeldungen unter den Aktionsschaltflächen an, anstatt lautlos fehlzuschlagen.
  • AI Provider Settings: Der Bereich "API & Provider" wurde zur Klarheit in "AI Provider" umbenannt.
  • Extended Free Trial: Der Pro-Testzeitraum wurde von 7 Tagen auf 14 Tage verlängert, um neuen Nutzern mehr Zeit zum Erkunden der Pro-Funktionen zu geben.
  • Optimistic Branch Switching: Das Wechseln zwischen Nachrichten-Zweigen und das Neuladen von Nachrichten aktualisiert die UI jetzt sofort, ohne auf Speicher-Antworten zu warten.
  • MCP Tool Configuration: Schema-Autokorrektur und verbesserte MCP-Tool-Konfiguration für eine zuverlässigere Tool-Einrichtung.

Fehlerbehebungen

  • Per-Message Costs: Die Kosten für einzelne Nachrichten entsprechen nun kumuliert der Gesamtsumme im Thread-Header. Kosten für Helper, OCR, Bildgenerierung und Suche werden einzelnen Nachrichten zugeordnet statt nur der Thread-Zusammenfassung.
  • Interjection Rendering: Interjection-Nachrichten werden jetzt als kompakte bernsteinfarbene Annotationen inline in der Assistant-Timeline gerendert, anstatt bei Abschluss der Generierung verloren zu gehen.
  • Loop Detection: Behebung einer fälschlicherweise positiven Wiederholungserkennung bei zitatreichen Antworten, in denen URLs natürlicherweise 3+ Mal vorkommen.
  • Slate Diff Alignment: Ausrichtung von roten/grünen Linien im Vorschaumodus für mehrzeilige Blöcke korrigiert, bei denen die Overlay-Schleife unabhängig von der Blockspanne nur um 1 Zeile voranschritt.
  • Slate Deletion Positions: Doppelte Zählung des Einfüge-Versatzes korrigiert, die dazu führte, dass Löschungen nach ihren zugehörigen Einfügungen statt davor gerendert wurden.
  • Private Sync Fixes: JIT-Scope-Anfragen werden nun korrekt über Code-Split-Chunks hinweg ausgelöst; Endlosschleife beim Synchronisieren nach Uploads behoben.
  • Onboarding Flow: Der OAuth-Flow schließt das Onboarding nun ordnungsgemäß ab, IDs für Modi mit Bindestrich werden bei der Trigger-Erkennung unterstützt und 0 verbleibende Tage werden nicht mehr zu null erzwungen.
  • Password Reset: Das Zurücksetzen des Passworts über einen E-Mail-Link verifiziert nun die E-Mail-Adresse. Resend-Verification-Endpunkt für Nutzer mit abgelaufenen Verifizierungs-E-Mails hinzugefügt.
  • License Tier: Nutzer mit einem vom Admin zugewiesenen Tier, aber ohne Lizenz-Eintrag, hängen nicht mehr am Upgrade-Gate fest.
  • Settings Scroll: Das Klicken auf das Gehirn-Icon für eine gelernte Seite scrollt nun zum korrekten Einstellungsbereich, anstatt aufgrund von Lazy-Loading-Bereichen darüber zu früh zu stoppen.
  • Monaco Disposal: Reihenfolge der Modell-Entsorgung im Diff-Editor korrigiert, um verwaiste Referenzen und das Durchscheinen von Monaco durch die TipTap-Vorschau zu verhindern.
  • Walkthrough Targeting: Walkthrough-Schritte überspringen jetzt Elemente, die durch responsive Container-Queries ausgeblendet sind, anstatt ein 16x16 Pixel großes Feld in der oberen linken Ecke zu markieren.
  • Kokoro TTS: Text-to-Speech in der Extension korrigiert — die Erkennung der ONNX-Laufzeit schlug in Offscreen-Dokumenten fehl, was zu "no available backend found"-Fehlern führte.
  • Custom API Tool Save: Das Speichern von vom Agenten entdeckten APIs als benutzerdefinierte Tools in der Extension korrigiert, das aufgrund verbotener dynamischer import()-Aufrufe im Service Worker-Kontext abstürzte.
  • Boot Performance: Sitzungsmigration wurde bei jedem Zugriff auf die Einstellungen (20+ Mal beim Start) ausgeführt; dies wurde behoben, um unnötige Schreibvorgänge und langsamen Start zu vermeiden.
  • Duplicate Storage Broadcasts: Doppelte Speicheränderungs-Benachrichtigungen im Relay/Server-Modus unterdrückt, die UI-Flackern verursachen konnten.
  • Cairn Texture Recovery: Texturgenerierung korrigiert, die fehlschlug, wenn der In-Memory-World-Cache zwischen Laden und Rendern geleert wurde; Renderer zeigt kein Schwarz mehr für anhangsbasierte Texturen.
  • Security Patches: fast-xml-parser (DoS über DOCTYPE Entity Expansion) und tar (Hardlink Escape Vulnerability) aktualisiert.
  • MV3 Compliance: Über CDN geladenes vega-embed durch lokale Vendor-Bundles ersetzt, um sicherzustellen, dass der gesamte Chart-Rendering-Code der Remote-Code-Richtlinie des Chrome Web Store entspricht.
  • Vega-Lite Charts: Die KI generiert Vega-Lite-Visualisierungen jetzt direkt in Slate anstelle von über CDN geladenem HTML, was interaktive Diagramme ohne Abhängigkeiten von Remote-Skripten ermöglicht.
  • Google Drive Save: 403-Fehler beim Speichern in Google Drive aus Slate behoben, die durch veraltete OAuth-Scope-Prüfungen in Nicht-Agent-Drive-Handlern verursacht wurden.
  • New User Onboarding: Onboarding-Bildschirm wird für neue Nutzer nicht mehr übersprungen, wenn während des Logins automatisch ein API-Key bereitgestellt wurde.
  • OpenRouter OAuth Popup: "Verbinden..."-Spinner hängt nicht mehr unendlich fest, wenn Popup-Blocker das OAuth-Fenster lautlos geschlossen haben.
  • Trial Banner Copy: Das Test-Banner behauptet nicht mehr, dass Modelle nach Tier beschränkt sind — aktualisiert, um Pro-Funktionen (Schreibzugriff, Bildgenerierung, benutzerdefinierte Modi) korrekt zu beschreiben.
  • DOCX Review Toolbar: Flackern der Toolbar bei der Anzeige von Dokumentenprüfungs-Steuerelementen durch Verzögerung des Scrollens bis zur initialen Sichtbarkeit behoben.
  • Add to Prompt Overlay: Overlay-Logo wurde durch Content Security Policy blockiert und Hintergrund-Deckkraft entsprach nicht dem Thema; beides behoben.
  • Message Edit/Reload State: In-Memory-Status wurde nach dem Bearbeiten einer Nachricht, dem Neuladen einer Antwort oder dem Wechseln von Zweigen veraltet; dies wurde behoben.
  • Server Login Hang: WebSocket-Speicheroperationen schlugen während des Server-Login-Flows fehl. Die Authentifizierung ist nun entkoppelt, sodass die lokale Sitzung sofort funktioniert, während die Server-Identität im Hintergrund aufgelöst wird.
  • WebSocket Connection Hang: Race Condition behoben, bei der AUTH_STATE: ready während der initialen WebSocket-Verbindung eintraf und das Auth-Promise verwaisen ließ, was den Abschluss der Verbindung verhinderte.

Version 0.9.655 (19. Februar 2025)

Neue Funktionen

  • Slack-Integration: Verbinden Sie Ihren Slack-Workspace, um KI-gestützte Slack-Tools mit vollständiger OAuth V2-Autorisierung zu aktivieren
  • API-Tool-Anmeldedaten: Vom Agenten entdeckte APIs können jetzt als benutzerdefinierte MCP-Tools mit gespeicherten Anmeldedaten gespeichert werden, was die Wiederverwendung über Gespräche hinweg ermöglicht
  • Gespeicherte API-Badge: Vom Agenten erstellte API-Tools zeigen zur einfachen Identifizierung ein „Gespeicherte API“-Badge in den Einstellungen an
  • Gesprächsimport: Importieren Sie Gespräche von ChatGPT, Claude, Gemini, Perplexity und Grok — laden Sie Ihre Exportdatei hoch und Caiioo konvertiert sie mit vollständigem Nachrichtenverlauf, Anhängen und Metadaten

Verbesserungen

  • Verschachtelung gelernter APIs: Gelernte API-Tools sind jetzt für eine sauberere Organisation unter einem ausklappbaren Bereich in den Einstellungen gruppiert
  • Caiioo-Branding: Integrierte Tools zeigen jetzt das Caiioo-Symbol für visuelle Konsistenz an
  • Browser-bewusste Links: Vom Agenten geöffnete URLs werden jetzt in dem Browser gestartet, den Sie in den Einstellungen ausgewählt haben
  • Slate Cloud Load: Das Laden eines Slate-Dokuments von Google Drive löst jetzt eine JIT-OAuth-Aufforderung aus, anstatt mit einem kryptischen Fehler fehlzuschlagen

Fehlerbehebungen

  • DOCX-Bearbeitung: Regex-Matching für Absatzläufe über verschachtelte Spans hinweg korrigiert, das beim Bearbeiten von formatiertem DOCX-Text zu Inhaltsfehlern führte
  • Sicherheit bei Suchen/Ersetzen: Struktureller HTML-Musterschutz wiederhergestellt, der beim Refactoring verloren ging — verhindert, dass Bearbeitungen das interne Markup von XLSX/DOCX beschädigen
  • Tool-Genehmigungsschleife: Race-Condition behoben, die wiederholte Genehmigungsaufforderungen für dasselbe Tool innerhalb eines einzelnen Agentenlaufs verursachte
  • Veraltete Identität: Fehler behoben, bei dem die veraltete Benutzeridentität bei 401 während der Lizenzsynchronisierung nicht gelöscht wurde, mit Logout-Escape beim Onboarding wiederkehrender Benutzer

Version 0.9.651 (17. Februar 2025)

Neue Funktionen

  • Berechtigungen mit minimalen Privilegien: Google Workspace-Tools fordern nun nur noch die exakten Scopes an, die für die jeweilige Aktion erforderlich sind, anstatt umfassenden Zugriff zu verlangen. Das Lesen von E-Mails erfordert nur Lesezugriff; das Erstellen von Terminen erfordert nur Schreibzugriff auf den Kalender.
  • Erweiterter Berechtigungsdialog: Der Just-in-Time-Autorisierungsdialog zeigt genau an, welche Berechtigungen angefordert werden, warum sie benötigt werden und ob der Vorgang schreibgeschützt oder Lese-/Schreibzugriff ist.
  • Berechtigungsauswahl: Beim manuellen Verbinden eines Google-Kontos können Sie vorab auswählen, welche Dienste (Calendar, Gmail, Drive, Docs, Sheets, Slides) und Zugriffsebenen (schreibgeschützt vs. Lese-/Schreibzugriff) gewährt werden sollen. Schaltfläche „Berechtigungen bearbeiten“ bei bestehenden Verbindungen verfügbar.
  • Bild-Ergebnisse: Generierte Bilder und Screenshots werden nun prominent zwischen eingeklappten Prozessschritten und der endgültigen Antwort dargestellt, wodurch das Aufklappen von Tool-Aufrufen zur Ansicht visueller Ausgaben entfällt.

Verbesserungen

  • Sicherheit bei Private Sync: Gleichzeitige Bearbeitungen werden nun zum Zusammenführen heruntergeladen statt hochgeladen, die Sperr-Aktualisierung überprüft den Besitz, und die Manifest-Zusammenführung verhindert Datenverlust durch vorzeitige Löschvorgänge.
  • P2P Sync entfernt: P2P-Echtzeit-Synchronisierung wurde entfernt, wodurch über 100 MB an unnötigem WebSocket-Traffic eingespart und die Leistung der Erweiterung verbessert wurden.
  • Leistung der Einstellungen: Memoization des Einstellungsbereichs und Isolierung des Kontext-Einklappens für schnelleres Rendering.
  • DOCX-Rendering: Verbessertes Rendering von Absätzen, Nummerierungen und Stil-Unterstützung im Dokument-Parser.

Fehlerbehebungen

  • Google Docs Scope: Fehler „insufficient authentication scopes“ beim Indizieren von Google Docs behoben – index_document benötigte Schreibzugriff für benannte Bereiche.
  • Google Docs Read: Fehler behoben, bei dem read_document und get_document_info fehlschlugen, wenn nur Docs-Scopes gewährt wurden – diese Aktionen benötigen zusätzlich Drive-Lesezugriff.
  • Calendar Copy: Fehlende copy_event-Aktion im Scope-Register behoben, was JIT-Berechtigungsanfragen verhinderte.
  • API Key Persistence: Fehler behoben, bei dem der BYOK API Key stillschweigend verloren ging, wenn saveCustomMode während der Aktivierung der Pro-Testversion den Speicherpfad der Einstellungen zum Absturz brachte.
  • Settings Reload Race: Fehler behoben, bei dem ein nicht gespeicherter API Key gelöscht wurde, wenn das Ein-/Ausklappen von Einstellungsbereichen einen Speicher-Neuladezyklus auslöste.
  • Chrome Identity Cancellation: Fehler behoben, bei dem Benutzerabbrüche während inkrementeller Scope-Anfragen nicht von Fehlern unterschieden wurden; die Auth-Methode wechselt nun korrekt nach Erhalt eines Web OAuth Refresh Tokens.
  • Private Sync Overwrite: Fehler behoben, bei dem Private Sync aktuelle Turns bei gleichzeitigen Bearbeitungen überschrieb.
  • Viewport Screenshots: Anzeige von Viewport-Screenshots über dem endgültigen Antworttext unterbunden.
  • Agent Coordination: 7 Probleme bei der Turn-Koordination, Wahrnehmung und Zustandsverwaltung behoben.
  • Track Changes: Fehler behoben, bei dem der Modus „Änderungen nachverfolgen“ nach der Slate-Dekomposition aufgrund eines Dual-State-Variablen-Desyncs defekt war.
  • File Manager: Lösch- und Download-Aktionen sind nun in allen Modi verfügbar, nicht mehr nur bei verwaisten Dateien.
  • MCP Tool Names: Tools korrigiert, die interne Server-IDs anstelle von menschenlesbaren Namen verwendeten.
  • Agenda Tool: Fehler behoben, bei dem die Sync-Karte immer fehlende Berechtigungen anzeigte; nun mit dem Google OAuth-Verbindungssystem verknüpft.

Version 0.9.642 (16. Februar 2025)

Verbesserungen

  • Erstellung neuer Dokumente: Neue DOCX-, XLSX-, PDF- und RTF-Dateien aus dem „Neue Datei“-Dropdown sind jetzt vollständig bearbeitbar, inklusive Unterstützung für nachverfolgte Änderungen
  • Gemini-Stabilität: Erkennung von Wiederholungen bei der Schlussfolgerung hinzugefügt, um Gemini-Denkschleifen automatisch zu unterbrechen und zu verhindern, dass durchgesickerte Denktexte im Chat erscheinen
  • Bildverarbeitung: DNG-Rohfoto-Vorschauen berücksichtigen jetzt die EXIF-Ausrichtung für eine korrekte Anzeige und verhindern Verzerrungen bei hochgeladenen Bildern.

Fehlerbehebungen

  • Bearbeitbarkeit neuer Dokumente: Fehler behoben, bei dem über „Neue Datei“ erstellte leere Dokumente als statische Vorschauen statt als bearbeitbare Rich-Text-Editoren gerendert wurden
  • API-Schlüssel-Erkennung: Der Wechsel zu Ihrem eigenen API-Schlüssel (BYOK) wird jetzt sofort wirksam, ohne dass ein Seiten-Refresh erforderlich ist
  • Screenshot-Stabilität: Handhabung der Anhangs-ID korrigiert, um zu verhindern, dass Screenshot-Daten verloren gehen oder beschädigt werden
  • Tab-Gruppierung: Absturz behoben, wenn der Browser nicht-normale Fenster (z. B. Devtools, Popups) enthielt
  • Konsolen-Rauschen: Unnötiges llms.txt-Probing entfernt, das 404-Fehler verursachte
  • Tool-Timeouts: Fragile Keepalive-Workarounds entfernt, die lang laufende Tool-Aufrufe wie die 4k-Bilderzeugung mit Gemini stören konnten
  • Prompt-Caching: Fehler behoben, bei dem multimodale Inhalte (Bilder/Screenshots) während der Prompt-Cache-Optimierung verworfen wurden

Intern

  • Signifikante Verbesserungen der Codebasis-Qualität in Bezug auf Fehlerbehandlung, Typsicherheit und architektonische Schichtung
  • Kern-Dokument-Parser in fokussierte, wartbare Module modularisiert

Version 0.9.641 (14. Februar 2025) - Alles Gute zum Valentinstag!

Verbesserungen

  • Modell-Selector Tier-Medaillen: Hardcodierte Empfehlungs-Badges durch 5 API-gesteuerte Tier-Medaillen ersetzt (Best for Caiioo, Qualität, Zuverlässigkeit, Geschwindigkeit, Preis-Leistung), die Gold/Silber/Bronze-Rankings direkt aus Benchmark-Daten anzeigen
  • Skills-System: Skills haben jetzt eine Schaltfläche zum Wiederherstellen der Standardwerte, um integrierte Skills wieder hinzuzufügen
  • Prompt-Caching: Prompt-Caching zur Kosteneinsparung weiter optimiert

Fehlerbehebungen

  • Browser-Kompatibilität: OAuth-Login und automatische Verbindung funktionieren jetzt in Vivaldi und anderen Nicht-Chrome-Browsern
  • Kostenverfolgung: Race-Condition behoben, bei der das Abbrechen eines Laufs Kosten- und Nutzungsdaten überschreiben konnte; Kosten-/Nutzungsdaten bleiben nun bei abgebrochenen und fehlerhaften Läufen erhalten
  • Private Sync: purgeAllStorage für eine radikale Löschung neu geschrieben, Sync-Listener-Race behoben, private Sync-UI konsolidiert
  • i18n: Fehlende Übersetzungsinitialisierung zur conversation.html Popup-Seite hinzugefügt
  • Sicherheit: Abhängigkeits-Schwachstellen gepatcht (qs, @casl/ability, axios, markdown-it)
  • Benchmarks-Seite: Backend der Benchmarks-Seite auf Cloudflare-Auth migriert

Version 0.9.65 (13. Februar 2025)

Verbesserungen

  • MiniMax M2.5 Benchmarks: Vollständige Benchmark-Suite abgeschlossen — Tool-Genauigkeit 91 %, Vertrauenswürdigkeit 95 % (Rang #2), Gesamtrang #5 mit Gold-Wertstufe
  • Model Intelligence API: Standard-Antwortlimit von 100 auf 500 erhöht, um sicherzustellen, dass alle Modelle mit verdienten Abzeichen für Clients sichtbar sind

Fehlerbehebungen

  • Fehlende Modell-Abzeichen: 35 Modelle mit verdienten Stufen-Abzeichen (Gold/Silber/Bronze), die nicht in der Erweiterungs-Modellliste erschienen, wurden korrigiert — einschließlich Claude Opus 4.6 (Gold-Verbund), Claude Sonnet 4.5 (Silber-Verbund) und Claude Haiku 4.5 (Bronze-Verbund). Ursache: Die API gab standardmäßig nur die 100 nach Vertrauenswürdigkeit sortierten Modelle zurück, aber die Stufen wurden aus allen 367 Modellen berechnet. Bei Modellen außerhalb der Top 100 nach Vertrauenswürdigkeit wurden die Abzeichen stillschweigend entfernt.

Version 0.9.64 (12. Februar 2025)

Verbesserungen

  • Ollama Provider Parity: Vollständige Funktionsparität mit OpenRouter — Unterstützung für Abort-Signale, Fehlerbehandlung, Reasoning-Details, aufgelöste Modell-IDs und Verarbeitung von Think-Tags via Streaming-Mixin
  • AbortSignal Propagation: Subprocess SIGTERM/SIGINT bricht nun laufende LLM API-Aufrufe ab
  • Build-Time Schema Validation: Die Validierung des Einstellungs-Schemas zur Build-Zeit erkennt fehlende SETTING_METADATA-Einträge
  • Platform Capabilities Caching: Zwischenspeicherung zur Leistungsoptimierung, anstatt bei jedem Zugriff neu zu berechnen
  • Website i18n: Übersetzungen für die Trust-Seite und die Preisgestaltung wurden über alle 22 Sprachversionen hinweg synchronisiert

Fehlerbehebungen

  • Website Authentication: Ersetzung der veralteten Supabase-Authentifizierung durch direkte Cloudflare Worker API-Aufrufe für Google-Anmeldung, E-Mail-Login, Registrierung und Passwort-Zurücksetzung
  • Stripe Checkout Locale: Fehler „Invalid locale“ beim Checkout und im Portal behoben, indem navigator.language (z. B. en-US) auf von Stripe unterstützte Locales gemappt wird, mit Fallback auf auto
  • Password Minimum Length: Synchronisierung der Mindestlänge von 12 Zeichen über Server-Registrierung, Passwort-Zurücksetzung und die Website-Seite zum Zurücksetzen
  • Private Sync Profile Dedup: Der Login erkennt und entfernt nun doppelte Profile, die durch frühere Sync-Fehler entstanden sind
  • State Manager Init Race: Race Condition bei der Initialisierung im state-manager behoben
  • Agent Subprocess Cleanup: Bereinigung von Zombie-Subprozessen bei Agenten-Beendigung
  • Tab Group/Storage API Guards: Korrekte Guards für Tab-Gruppen- und Storage-APIs über alle Plattformen hinweg
  • Geolocation Error Handling: Fehlerbehandlung bei Geolocation-Berechtigungsfehlern verbessert
  • OAuth Refresh Locking: Verhindert gleichzeitige Versuche zur Aktualisierung von OAuth-Tokens
  • Settings Save Mutex: Gleichzeitige Speichervorgänge von Einstellungen überschreiben sich nicht mehr gegenseitig
  • Agent JSON Parse Isolation: Fehlerhafte Agenten-Ausgaben führen nicht mehr zum Absturz des Parsers
  • Thread Search Race: Race Condition bei Thread-Suchergebnissen behoben
  • Streaming Version Staleness: Überprüfung auf veraltete Versionen während Streaming-Antworten
  • Content Script Timeouts: Timeouts für das Message-Passing von Content-Skripten hinzugefügt
  • Context Pruning for Multimodal: Verbessertes Context-Pruning bei Vorhandensein von multimodalem Inhalt

Version 0.9.63 (12. Februar 2025)

Fehlerbehebungen

  • Private Sync Modus-Variablen: Migration veralteter Einstellungen behoben, die bei jedem Sync-Zyklus lief und lokale Änderungen (z. B. Modus-Variablen-Änderungen) stillschweigend mit veralteten Drive-Daten überschrieb

Version 0.9.62 (12. Februar 2025)

Neue Funktionen

OpenRouter OAuth One-Click Setup

  • PKCE Key Erstellung: Der neue One-Click OpenRouter OAuth Flow ermöglicht es Nutzern, einen API Key zu erstellen und zu verknüpfen, ohne Caiioo zu verlassen.
  • Überarbeitetes Onboarding: Optimierte Onboarding- und Upgrade-Flows mit OpenRouter OAuth Integration.
  • Datenschutz-Warnung: Die Onboarding-Option für kostenlose Modelle zeigt nun eine klare Warnung bezüglich Datenschutz und Trainingsdaten an.

Granulare Private Sync

  • Synchronisierung pro Element: MCP Server, Tool-Freigaben, Profile, Skills, Modi, Overrides und Erinnerungen werden jetzt auf Ebene einzelner Elemente synchronisiert, anstatt ganze Sammlungen zu überschreiben.
  • Synchronisierung der Einstellungen pro Key: Einstellungen werden granular pro Key synchronisiert, was verhindert, dass remote durchgeführte Änderungen nicht zusammenhängende lokale Änderungen überschreiben.
  • Deduplizierte Lesevorgänge: Laufende WebSocket-Speicherlesevorgänge werden dedupliziert, um unnötigen Netzwerkverkehr zu reduzieren.

Verbesserungen

  • Modus-Einstellungen UX: Overrides werden jetzt automatisch gespeichert, und "Standardeinstellungen wiederherstellen" stellt gelöschte Modus-Variablen korrekt wieder her.
  • Responsiver Composer: Der Skills-Button wird bei geringer Breite auf ein reines Icon reduziert; der Layout-Abstandshalter im Skills-Bereich wurde entfernt.
  • Support-Tickets: Build-Version und Zeitstempel werden nun automatisch beigefügt.
  • Slate Suche: Neue Aktion search_document zum Slate Tool hinzugefügt.

Fehlerbehebungen

  • Google Slides/Sheets OAuth: Wirft nun einen korrekten OAuthAuthorizationRequiredError anstatt Setup-Text zurückzugeben, was Just-in-Time-Autorisierung ermöglicht.
  • Configuration Tool UI Refresh: Agent-Mutationen über das Configuration Tool senden nun STORAGE_CHANGED, sodass die UI sofort aktualisiert wird.
  • Tool-Freigabe-Modal: Verletzung der React-Hooks-Reihenfolge behoben (useMemo vor Early Return).
  • Localhost HTTPS: Das API Integration Tool unterstützt nun selbstsignierte Zertifikate für lokale HTTPS Server.
  • Persistenz von Modus-Variablen: Fehler bei i18n-Getter-Eigenschaften behoben, die vor der Speicherung nicht materialisierten, was dazu führte, dass Variablen beim Neuladen verschwanden.
  • Slate Thread-Sicherheit: Race Condition in Slate Tools behoben, die bei parallelen AI-Zügen zu doppelten Slates führte.
  • Slate DOCX: Sichtbarkeit von Löschungen und Baseline-Fehler in den Änderungshistorien korrigiert.
  • Private Sync Stabilität: "Bouncing" und verschwindende Bearbeitungen durch Synchronisationskonflikte eliminiert.

Version 0.9.61 (10. Februar 2025)

Verbesserungen

Slate Editor i18n

  • Übersetzte Symbolleiste & Menüs: Alle Schaltflächen der Slate-Editor-Symbolleiste, Kontextmenüs und Dialog-Strings sind jetzt vollständig übersetzt

Fehlerbehebungen

  • OAuth-Fetch-Timeouts: Alle OAuth-Token-Austausch- und Aktualisierungsanfragen haben jetzt ein 15-Sekunden-Timeout, um endlose Hänger bei Netzwerkproblemen zu verhindern
  • GitHub Private E-Mail: Fehler bei der GitHub-Verbindung behoben, wenn die Profil-E-Mail des Benutzers privat ist (wird jetzt über die /user/emails API abgerufen)
  • OAuth-Verbindungsdialog: OAuth-Verbindungsdialog generalisiert und mehrere Token-/Verbindungsfehler behoben
  • Konsistenz der Passwortlänge: 12-Zeichen-Mindestpasswortanforderung über alle Anmelde- und Zurücksetzungsflächen hinweg synchronisiert

Version 0.9.6 (8. Februar 2025)

Neue Funktionen

Internationalisierung (20+ Sprachen)

  • Vollständiger i18n-Support: Caiioo ist jetzt in über 20 Sprachen verfügbar, darunter Englisch, Spanisch, Französisch, Deutsch, Japanisch, Koreanisch, Chinesisch, Arabisch, Hebräisch, Hindi und weitere.
  • RTL-Sprachunterstützung: Vollständiges Right-to-Left-Layout für Arabisch, Hebräisch und Urdu.
  • UI-Spracheinstellung: Wählen Sie Ihre bevorzugte Sprache in den Settings — alle UI-Elemente, Tool-Labels und Statusmeldungen sind übersetzt.

Verbesserungen

Performance des Settings-Panels

  • Lazy-Loaded Sections: Abschnitte des Settings-Panels werden jetzt bei Bedarf geladen, was die initiale Render-Zeit verkürzt.
  • Modularer Speicher: Settings werden in granularen Schlüsseln pro Abschnitt anstatt in einem einzigen monolithischen Blob gespeichert, was die Lese- und Schreibperformance verbessert.
  • Typisierte Getter: Der interne Zugriff auf Settings erfolgt über streng typisierte Getter mit Verfolgung der Änderungsgranularität.

Zuverlässigkeit der Slate-Änderungsverfolgung

  • 17 Fixes für den Revision Manager: Umfassende Härtung des Systems zur Änderungsverfolgung in den Bereichen Diff-Berechnung, Annahme, Ablehnung und Persistenz.
  • Plain Text Diffing: Redline-Änderungen vergleichen nun Plain Text anstelle von rohem Markdown, was sauberere und präzisere Änderungshervorhebungen erzeugt.
  • Persistente Benutzeränderungen: Vom Benutzer vorgenommene nachverfolgte Änderungen bleiben nun auch nach einem Seiten-Refresh erhalten.
  • Race Condition Fix: Erzwungenes "Baking" von nachverfolgten Änderungen vor dem Speichern, um Datenverlust zu verhindern.

Fehlerbehebungen

  • Service Worker Abstürze: Über 112 dynamische import()-Aufrufe wurden durch statische Imports ersetzt, um Chrome Service Worker Abstürze zu verhindern.
  • Mode-Willkommensnachrichten: Probleme mit der Sprache, der Erkennung bereitgestellter Keys und der Persistenz in Mode-Willkommensnachrichten wurden behoben.
  • Google Tool Account-Auswahl: Der Account-Picker spiegelt nun dynamisch die tatsächlich verbundenen Accounts wider.
  • DOCX Verschachtelte Listen: Anzeige-Marker und Export-Fehler bei Round-Trips von verschachtelten Listen wurden korrigiert.
  • LaTeX Math Rendering: Fehler behoben, bei dem das Escaping von Währungs-Dollarzeichen LaTeX-Mathematikausdrücke unterbrach, die mit Zahlen begannen.
  • Tab-Gruppen-Erstellung: Die Lazy-Erstellung von Tab-Gruppen wurde verzögert, bis das Web-Browsing-Tool tatsächlich verwendet wird.
  • Agenda OAuth: OAuth-Fehler werden nun erneut geworfen (re-throw), damit die Just-in-Time-Autorisierung korrekt ausgelöst wird.
  • Settings-Persistenz: Fehlende Metadaten-Einträge für 6 Settings hinzugefügt, bei denen das Speichern lautlos fehlschlug.

Version 0.9.5 (6. Februar 2025)

Sicherheits-Härtung

  • Validierung des Content-Script-Ursprungs: Nachrichten von Webseiten an die Erweiterung sind jetzt nur noch auf caiioo.ai-Ursprünge beschränkt, mit strengen Same-Origin-Prüfungen, die Cross-Origin-Message-Injection verhindern
  • CSP verschärft: Nur für die Entwicklung gedachte Localhost-Skriptquellen wurden aus der Content Security Policy der Erweiterungsseiten entfernt
  • Auth-Response-Scoping: Authentifizierungsantworten der Erweiterung werden jetzt an den spezifischen Seitenursprung gesendet, anstatt an alle Frames übertragen zu werden

Version 0.9.4 (4. Februar 2025)

Neue Funktionen

Mehrsprachige Spracherkennung (Speech-to-Text)

  • Sprachauswahl: Wählen Sie Ihre STT-Sprache in den Einstellungen für eine präzise nicht-englische Spracheingabe
  • 90+ Sprachen unterstützt: Funktioniert mit Whisper und ElevenLabs für umfassende Sprachabdeckung

Echtzeit-Sprachaktivitätserkennung (VAD)

  • VAD mit geringer Latenz: Neue Silero VAD v5-Integration erkennt Sprache in Echtzeit mit minimaler Verzögerung
  • Intelligentere Aufnahme: Die Aufnahme startet und stoppt automatisch basierend auf der Sprachaktivität
  • Reduzierte Fehlalarme: Bessere Unterscheidung zwischen Sprache und Hintergrundgeräuschen

Umschalter für Vorschlags-Sichtbarkeit

  • Vorschläge ausblenden/einblenden: Neuer Umschalter, um KI-Folgevorschläge auszublenden, wenn Sie eine sauberere Oberfläche wünschen
  • Persistenter Status: Ihre Präferenz wird gespeichert und sitzungsübergreifend erinnert

Verbesserungen

Track Changes Auto-Bake

  • Diff-basiertes Tracking: Effizienteres Änderungs-Tracking unter Verwendung von Diff-Algorithmen
  • Auto-Speichern: Änderungen werden regelmäßig gespeichert, um Datenverlust bei langen Bearbeitungssitzungen zu verhindern
  • Snapshot beim Beenden: Das Beenden des Track-Changes-Modus übernimmt automatisch alle ausstehenden Änderungen

Erweitertes Provider-Streaming

  • Gemini-Verbesserungen: Bessere Streaming- und Reasoning-Fähigkeiten für Google Gemini-Modelle
  • Konsistentes Verhalten: Vereinheitlichtes Streaming-Verhalten über OpenRouter und native Provider hinweg

Version 0.9.3 (31. Januar 2025)

Neue Funktionen

Geführte Onboarding-Tour

  • Interaktive UI-Tour: Eine neue Schritt-für-Schritt-Anleitung führt neue Benutzer nach Eingabe ihres API-Schlüssels durch alle Teile der Benutzeroberfläche
  • Drei Phasen: Deckt den Composer (11 Schritte), das Einstellungs-Panel (7 Schritte) und das Modus-System (5 Schritte) ab
  • Spotlight-Effekt: Jeder Schritt hebt das relevante UI-Element mit einem fokussierten Spotlight hervor
  • Konversations-Onboarding: KI-gestützter Profilaufbau, um Ihr Erlebnis von Anfang an zu personalisieren

Prompt-Verlauf

  • Zugriff auf vorherige Prompts: Ihre letzten Prompts werden gespeichert und können im Composer aufgerufen werden
  • Schnelle Wiederverwendung: Vorherige Nachrichten einfach wiederverwenden oder ändern

Ad-Blocker-Stufen

  • Granulare Kontrolle: Werbeblockierung unterstützt jetzt mehrere Stufen statt nur Ein/Aus
  • Wählen Sie Ihren Schutz: Wählen Sie die Blockierungsstufe, die für Ihre Browsing-Bedürfnisse am besten geeignet ist

DOCX-Review-Toolbar

  • Änderungen nachverfolgen: Neue Toolbar beim Anzeigen von Word-Dokumenten mit nachverfolgten Änderungen
  • Annehmen/Ablehnen: Dokumentbearbeitungen einfach überprüfen und auflösen

Verbesserungen

Thread-Aufbewahrungseinstellungen

  • Konfigurierbare Bereinigung: Legen Sie fest, wie lange alte Threads vor der automatischen Bereinigung aufbewahrt werden sollen
  • Speicherverwaltung: Bessere Kontrolle über Ihren Gesprächsverlauf

Caiioo-Animation

  • Leistungsoptimierungen: Glattere Animationen mit verbessertem Rendering
  • Nässe-Effekte: Neue visuelle Überlagerung, die Wassersättigung anzeigt
  • Direktes Partikel-Rendering: Sauberere Optik mit optimierter Partikelzeichnung

Profilwechsel

  • Verbesserte Statusverwaltung: Zuverlässigerer Profilwechsel mit verbesserter Protokollhandhabung
  • Bessere Synchronisierung: Profiländerungen werden korrekt über die Erweiterung hinweg synchronisiert

Google Calendar

  • Token-Management: Verbesserte Handhabung von Zugriffstoken für Kalenderoperationen
  • Zuverlässigere Synchronisierung: Besserer OAuth-Flow für die Kalenderintegration

Version 0.9.2 (26. Januar 2025)

Neue Funktionen

Werbe- & Tracker-Blockierung

  • Integrierter Ad-Blocker: Blockieren Sie Werbung und Tracker mit der Ghostery-Engine über MV3-kompatibles declarativeNetRequest
  • Umschalten in den Einstellungen: Aktivieren oder deaktivieren Sie die Werbeblockierung im Einstellungs-Panel
  • Filterlisten-Updates: Automatisches Caching von Filterlisten für zuverlässiges Blockieren

Just-in-Time Google-Berechtigungen

  • Inkrementelle Autorisierung: Berechtigungen für Google-Tools werden jetzt nur bei Bedarf angefordert, nicht im Voraus
  • Klareres Scope-Management: Fehlende Scopes lösen hilfreiche Fehlermeldungen mit Optionen zur Zugriffsgewährung aus
  • Besserer Datenschutz: Fordern Sie nur die spezifischen Google-Scopes an, die für jedes Tool erforderlich sind

Verbesserungen

Caiioo-Animation

  • Verbesserte Physik: Optimierte Partikeldynamik mit besseren Höhen-, Geschwindigkeits- und Dichtekräften
  • Flüssigerer Fluss: Partikel folgen beim Erscheinen der Kanalrichtung, was Klumpenbildung reduziert
  • Realistisches Stapeln: Partikel stapeln sich natürlich, wenn sie durch Kieselsteine oder Dämme blockiert werden

Google OAuth-Flow

  • Schnellere Anmeldung: Priorisiert jetzt den Abruf von ID-Token für eine schnellere Authentifizierung
  • Verbesserte Zuverlässigkeit: Bessere Token-Handhabung reduziert Authentifizierungsfehler in Nicht-Chrome-Browsern

Onboarding & Einstellungen

  • Vorschau-Modus: Testen Sie Onboarding-Flows, ohne Benutzerdaten zu löschen
  • Sauberer Free-Tier: Veraltete UI zur Wiederherstellung bereitgestellter API-Schlüssel entfernt

Internes

  • Minispiel-System: Neue MinigameContainer-Infrastruktur für interaktive Intro-Erlebnisse
  • Verstecktes Easter Egg: Sichtbarkeitsstatus des Minispiels bleibt über Sitzungen hinweg erhalten

Version 0.9.1 (25. Januar 2025)

Neue Funktionen

Interaktive Wassersimulation

  • Caiioo Intro: Neue interaktive Fluidsimulation auf dem Ladebildschirm – beobachten Sie, wie Wasser durch einen dynamischen S-förmigen Kanal fließt
  • Ziehbare Kieselsteine: Bewegen Sie Kieselsteine, um den Wasserfluss umzuleiten und Dämme zu bauen
  • Sedimentdynamik: Realistische Erosion und Ablagerung – schnelles Wasser nimmt Sedimente auf, langsames Wasser lagert sie ab
  • Theme-Adaptiv: Die Wasserfarben passen sich automatisch dem Farbton Ihres gewählten Themes an

Unterstützung für Vega/Vega-Lite Diagramme

  • Interaktive Visualisierungen: Anzeigen und Bearbeiten von Vega und Vega-Lite Diagrammen direkt in Slate
  • Datenvisualisierung: Erstellen Sie Balkendiagramme, Liniendiagramme, Streudiagramme und komplexe mehrschichtige Visualisierungen
  • Spec-Bearbeitung: Bearbeiten Sie die JSON-Spezifikation und sehen Sie Änderungen in Echtzeit gerendert

Unterstützung für Mermaid Diagramme

  • Diagrammtypen: Erstellen Sie Flussdiagramme, Sequenzdiagramme, Klassendiagramme, Zustandsdiagramme und mehr
  • Live-Vorschau: Bearbeiten Sie die Mermaid-Syntax mit sofortiger visueller Vorschau
  • Export-Optionen: Diagramme werden als SVG gerendert für eine gestochen scharfe Ausgabe in jeder Größe

Vorlagen für die Dateierstellung

  • Schnellerstellungs-Menü: Neues Dropdown-Menü beim Erstellen von Dateien in Slate mit Vorlagen für gängige Dateitypen
  • Vorlagen-Kategorien: Markdown, Code-Dateien, Datenformate, Diagramme und mehr
  • Ein-Klick-Start: Starten Sie direkt in ein neues Dokument mit der richtigen Struktur

Verbesserungen

API-Fehlerbehandlung

  • Visuelle Benachrichtigungen: API-Fehler werden jetzt als schließbare Toast-Benachrichtigungen angezeigt
  • Automatisches Schließen: Nicht-kritische Fehler (wie Abbrüche) werden nach einigen Sekunden automatisch ausgeblendet
  • Klarere Meldungen: Bessere Fehlermeldungen helfen dabei, Probleme schneller zu identifizieren und zu lösen

Plattform-Funktionen

  • Intelligente Feature-Erkennung: Funktionen, die spezifische Plattformen erfordern (wie Apple Calendar auf macOS), werden jetzt automatisch erkannt
  • Sichere Fallbacks: Tools passen sich an Ihre Umgebung an, anstatt lautlos fehlzuschlagen
  • Verbesserungen der Apple-Tools: Apple Reminders unterstützt jetzt Aktionen zum Aufheben der Erledigung und Listen-Aktionen

Safari & Nicht-Chrome Browser

  • Besserer OAuth-Flow: Verbesserte Browser-Erkennung für den Google-Login
  • Fallback-Mechanismus: Nicht-Chrome Browser verfügen nun über einen zuverlässigeren Authentifizierungspfad

Version 0.9.0 (22. Januar 2025)

Neue Funktionen

Automatische Datenbereinigung

  • Speicherverwaltung: Alte Threads und Anhänge werden automatisch basierend auf Ihren Aufbewahrungspräferenzen bereinigt
  • Konfigurierbare Richtlinien: Legen Sie fest, wie lange Daten vor der automatischen Bereinigung aufbewahrt werden

GitHub-Sync

  • Backup auf GitHub: Synchronisieren Sie Ihre Caiioo-Daten mit einem GitHub-Repository für Backups und geräteübergreifenden Zugriff
  • Intelligente Konfliktlösung: Änderungen von mehreren Geräten werden automatisch ohne Datenverlust zusammengeführt
  • Selektive Synchronisierung: Steuern Sie mit Mustern im .gitignore-Stil, welche Daten synchronisiert werden

GitHub-Tool

  • KI-GitHub-Integration: Die KI kann jetzt in Ihrem Namen mit GitHub interagieren – Issues erstellen, Repositories durchsuchen, Pull-Requests verwalten und mehr
  • Repository-Browsing: Lassen Sie die KI Codebasen erkunden, Dateien finden und Projektstrukturen verstehen

Verbesserungen

Browser-Automatisierung

  • Verbesserte Seiteninteraktion: Zuverlässigeres Klicken, Scrollen und Ausfüllen von Formularen auf komplexen Webseiten
  • Intelligentere Tool-Auswahl: Die KI wählt jetzt präziser die richtigen Tools für jede Aufgabe aus

Dokumentenhandhabung

  • Bessere Word-Dokumente: Verbesserte Handhabung von Tabellen, Listen und Formatierungen in DOCX-Dateien
  • Google Slides: Mehr Kontrolle über Folienformatierung, Formen und Layouts

Einstellungen & UI

  • Erweitertes Einstellungs-Panel: Mehr Konfigurationsoptionen mit besserer Organisation
  • Verbesserte Thread-Liste: Besseres Sortieren und Filtern Ihrer Gespräche
  • Standortberechtigung: Klarerer Ablauf bei der Gewährung des Standortzugriffs für standortbasierte Abfragen

Version 0.8.9 (19. Januar 2025)

Neue Funktionen

Google Slides-Integration

  • KI-gestützte Präsentationen: Das neue Google Slides-Tool ermöglicht es der KI, Folienpräsentationen zu erstellen, zu lesen und zu bearbeiten
  • Volle Folienkontrolle: Erstellen Sie Folien, fügen Sie Textfelder, Bilder, Formen und Tabellen hinzu
  • Vorlagenunterstützung: Verwenden Sie integrierte Vorlagen oder arbeiten Sie mit leeren Präsentationen
  • Kollaborative Bearbeitung: Funktioniert mit Ihrer bestehenden Google-Konto-Verbindung

Verbesserungen

Code-Qualität

  • TypeScript-Korrekturen: Typfehler und ungenutzte Importe in der gesamten Codebasis bereinigt
  • Testabdeckung: Test-Fixtures aktualisiert, um den aktuellen Typdefinitionen zu entsprechen

Version 0.8.8 (17. Januar 2025)

Neue Funktionen

Resemble.ai Text-to-Speech

  • Professionelle Sprachsynthese: Neue Resemble.ai-Integration für hochwertige KI-Sprachgenerierung
  • Streaming-Audio: Echtzeit-Audio-Streaming für reaktionsschnelle Sprachausgabe
  • Konfigurierbare Stimmen: Wählen Sie aus mehreren professionellen Sprachoptionen
  • Kürzungswarnungen: Klares Feedback, wenn langer Text für die Synthese gekürzt wird

Kalender-Synchronisierungsdienst

  • Hintergrund-Synchronisierung: Automatische Kalendersynchronisierung mit Google Kalender
  • Inkrementelle Updates: Nur geänderte Ereignisse werden zur Effizienzsteigerung synchronisiert
  • Alarm-basierte Planung: Zuverlässige Synchronisierungsplanung mit Chrome-Alarmen

Verbesserungen

Desktop-App (Electron)

  • Wake-Erkennung: Das System erkennt jetzt, wenn Ihr Mac aus dem Ruhezustand aufwacht und aktualisiert OAuth-Tokens automatisch
  • Verbesserte Zuverlässigkeit: OAuth-Verbindungen bleiben auch nach längerem Ruhezustand frisch

Rich-Composer-Eingabe

  • Erweiterte Komposition: Verbesserte Nachrichteneingabe mit besserer Formatierungsunterstützung
  • Tab-Autovervollständigung: Reaktionsschnellere Tab-Referenzvorschläge

Version 0.8.71 (15. Januar 2025)

Neue Funktionen

Thread-Suche

  • Durchsuchen Sie Ihre Konversationen: Neues Suchfeld in der Thread-Liste, um Threads schnell anhand von Titel oder Inhalt zu finden
  • Sofortige Filterung: Geben Sie Text ein, um zu filtern – passende Threads erscheinen sofort mit Suchhervorhebung
  • Smart Debouncing: Die Suche ist optimiert, um auch bei Hunderten von Threads nicht zu verzögern

Physik-Simulations-Tool

  • KI-gestützte Physik: Neues Physik-Tool ermöglicht es der KI, physikalische Berechnungen und Simulationen durchzuführen
  • Wurfbewegungen: Berechnen Sie Flugbahnen, sagen Sie Kollisionen voraus und lösen Sie Bewegungsprobleme
  • Strukturanalyse: Analysieren Sie Spannungen, Balkenbiegung, Knicken und die Stabilität von Strukturen
  • Materialeigenschaften: Integrierte Datenbank gängiger technischer Materialien (Stahl, Aluminium, Holz, Beton usw.)
  • Physikalische Formeln: Berechnungen zu kinetischer Energie, Impuls, Kraft und Stoß

Verbesserungen am Cairn World Builder

  • Physik-Engine: Vollständige Rapier3D-Physik-Integration für realistische Simulationen
  • Gelenke & Einschränkungen: Erstellen Sie Scharniere, Schieberegler, Kugelgelenke und feste Verbindungen zwischen Körpern
  • Sensoren & Trigger: Definieren Sie Sensorbereiche, die erkennen, wenn Objekte eintreten oder austreten
  • Character Controller: First-Person-Charakter mit Schwerkraft, Springen und Kollisionsreaktion
  • Spielmodus: Echtzeit-Physik mit festem Zeitschritt für interaktive Erkundungen

Verbesserungen

Private Sync v2

  • Inkrementelle Synchronisierung: Jeder Thread und Anhang wird jetzt einzeln synchronisiert, anstatt als eine große Datei
  • Schnellere Synchronisierung: Nur geänderte Elemente werden hochgeladen, was die Synchronisierungszeit für große Bibliotheken drastisch reduziert
  • Bessere Konfliktlösung: Vektorkuhren pro Element ermöglichen eine präzisere Zusammenführungsauflösung
  • Reduzierte API-Aufrufe: Intelligentes Diffing bedeutet weniger Google Drive API-Anfragen

Synchronisierungszuverlässigkeit

  • Parität zwischen Erweiterung und Server: Speicherung von Anhängen korrigiert, um Vektorkuhren auf beiden Plattformen korrekt nachzuverfolgen
  • Tombstone-Filterung: Gelöschte Profile werden jetzt sowohl in der Erweiterung als auch auf dem Server korrekt ausgeblendet

Version 0.8.70 (14. Januar 2025)

Neue Funktionen

Private Sync (GRATIS-Stufe)

  • Geräteübergreifende Synchronisierung: Synchronisiere deine Threads, Einstellungen und Anhänge über alle deine Geräte via Google Drive
  • Ende-zu-Ende-Verschlüsselung: Alle synchronisierten Daten werden mit deiner Passphrase verschlüsselt, bevor sie dein Gerät verlassen
  • Automatische Hintergrund-Synchronisierung: Änderungen werden alle 30 Sekunden mit intelligentem Debouncing synchronisiert
  • Konfliktlösung: CRDT-basierte Vektorkuhren stellen sicher, dass Änderungen geräteübergreifend korrekt zusammengeführt werden

Verbesserungen

Private Sync Effizienz

  • Reduziertes Polling: Sync-Intervall von 3s auf 30s erhöht, um API-Aufrufe zu reduzieren
  • Intelligentes Debouncing: Wartet 10 Sekunden nach Abschluss der Änderungen vor der Synchronisierung
  • In-Flight-Schutz: Threads, die aktiv von der KI verarbeitet werden, sind bis zum Abschluss von der Synchronisierung ausgeschlossen

Version 0.8.69 (14. Januar 2025)

Neue Funktionen

Slate-Revisionsnavigation

  • Zwischen Änderungen navigieren: Neue Navigationstasten, um im Editor zwischen ausstehenden Revisionsabschnitten zu springen
  • Änderungszähler: Visuelle Anzeige der aktuellen Position (z. B. „2 von 5“) innerhalb der ausstehenden Revisionen
  • Tastaturkürzel: Verwenden Sie Alt+Pfeil hoch/runter, um schnell zwischen Abschnitten zu navigieren, ohne die Tastatur zu verlassen

Verbesserungen

Dokumentenverarbeitung

  • Remote-OCR-Fallback: Wenn die lokale PDF-Textextraktion fehlschlägt oder schlechte Ergebnisse liefert, werden Dokumente für eine verbesserte Genauigkeit automatisch per Cloud-OCR verarbeitet
  • Verarbeitungsstatus: Echtzeit-Feedback zeigt an, wenn Dokumente remote verarbeitet werden

Unterstützung für Reasoning-Modelle

  • Multi-Turn Reasoning: Besseres Caching von Reasoning-Details über Konversationsverläufe hinweg, was die Kontinuität bei Modellen mit erweitertem Denken verbessert
  • Sauberere Nachrichten: Interne Systemnotizen werden jetzt aus gerenderten Nachrichten entfernt, um Instruction Leakage zu verhindern

Version 0.8.68 (11. Januar 2025)

Neue Funktionen

Langzeitgedächtnis

  • Kontext-Persistenz: Die KI behält nun ein Langzeitgedächtnis über Konversationen hinweg bei und merkt sich wichtigen Kontext zu Ihren Präferenzen und Workflows
  • Nutzungsverfolgung: Verbesserte Nachverfolgung von Token-Nutzung und Kosten mit detaillierter Protokollierung

Modellintelligenz

  • Intelligente Modellauswahl: Neue Funktionen zur Modellintelligenz helfen dabei, optimale Modelle basierend auf Ihren Nutzungsmustern zu identifizieren
  • Ranking-System: Modelle werden nach Leistungs- und Wertmetriken bewertet

Verbesserungen

Speicherzuverlässigkeit

  • Plattformübergreifender Speicher: Modell-Cache, Tool-Freigaben und gelernte Seiten funktionieren jetzt zuverlässig über Erweiterungs-, Server- und LAN-Modi hinweg
  • Authentifizierungs-Timeout: Behobener potenzieller Hänger bei der Verbindung zum Relay-Server – bricht nun nach 5 Sekunden sauber ab, anstatt unbegrenzt zu warten
  • Ladegeschwindigkeit der Einstellungen: Einstellungen und Modellauswahl laden nach einem Neuladen der Erweiterung schneller

Inhalts-Paginierung

  • Korrekte Seitengröße: Webseiteninhalte werden jetzt basierend auf dem tatsächlichen Kontextfenster des Modells (z. B. 131k Token) aufgeteilt, nicht mehr nach einem fest codierten Standard. Das bedeutet, Sie sehen größere Seitenabschnitte und weniger Seiten bei Modellen mit hohem Kontext.

Fehlerbehebungen

  • API-Key-Persistenz: Problem behoben, bei dem der OpenRouter API-Key nach kurzem Aktivieren und anschließendem Deaktivieren des LAN-Modus „vergessen“ wurde

Version 0.8.67 (7. Januar 2025)

Neue Funktionen

Kokoro TTS – Lokale neuronale Text-to-Speech

  • Hochwertige Stimmen: Kokoro ist ein lokales neuronales TTS-Modell mit natürlich klingender Sprache in mehreren Stimmen
  • Kein API-Key erforderlich: Läuft vollständig auf dem Gerät mittels WebGPU/WASM – keine Cloud-Dienste oder API-Keys nötig
  • Mehrere Stimmen: Wählen Sie aus amerikanischen, britischen und anderen Akzentoptionen mit männlichen/weiblichen Varianten
  • Unterstützung für lange Texte: Verarbeitet lange Texte korrekt durch Streaming-Synthese – keine Abbrüche mehr nach 30 Sekunden
  • Saubere Sprache: Entfernt automatisch Markdown-Formatierungen (fett, kursiv usw.) vor der Sprachausgabe

Verbesserungen

Spracheinstellungen

  • Vereinigter Sprachbereich: TTS- und STT-Einstellungen in einem übersichtlicheren Layout zusammengefasst
  • Sprachvorschau: Ausgewählte Stimme vor der Verwendung testen

Version 0.8.66 (7. Januar 2025)

Verbesserungen

Suche im Einstellungsbereich

  • Filtersuche: Neues Suchfeld oben in den Einstellungen, um Bereiche schnell nach Schlüsselwörtern zu filtern
  • Sofortige Ergebnisse: Tippen zum Filtern – passende Bereiche erscheinen sofort
  • Tastaturfreundlich: Die Suche erhält beim Öffnen der Einstellungen automatisch den Fokus

MCP-Server-Zuverlässigkeit

  • Start-Verifizierung: MCP-Server werden jetzt vor der Erfolgsmeldung auf ihre Ausführung geprüft
  • Bessere Fehlermeldungen: Wenn MCP-Server beim Start abstürzen, wird der tatsächliche Fehler anstelle eines allgemeinen Fehlers angezeigt
  • Korrigierte Beispiele: Beispiel-Paketnamen korrigiert, um @modelcontextprotocol/server-* (nicht @anthropic/mcp-server-*) zu verwenden

macOS App-Authentifizierung

  • Selbstvalidierende Tokens: 401-Fehler beim Hinzufügen von MCP-Servern vor der WebSocket-Status-Synchronisierung behoben
  • Schnellere Authentifizierung: HTTP-Endpunkte erfordern kein Warten mehr auf die WebSocket-Verbindung

Version 0.8.65 (6. Januar 2025)

Neue Funktionen

ElevenLabs Sprachintegration (BYOK)

  • Cloud TTS: Hochwertige Text-zu-Sprache mit ElevenLabs – wählen Sie aus mehreren Stimmen und Modellen
  • Cloud STT: Scribe-Transkription mit Echtzeit-Streaming (~150ms Latenz) und Unterstützung für über 90 Sprachen
  • Sprachauswahl: Durchsuchen und wählen Sie Stimmen aus der ElevenLabs-Bibliothek direkt in den Einstellungen
  • Modelloptionen: Wählen Sie zwischen Flash v2.5 (ultraschnell ~75ms), Turbo v2.5 oder Multilingual v2 (beste Qualität)
  • Eigener Schlüssel: Verwendet Ihren ElevenLabs-API-Schlüssel – keine zusätzlichen Kosten durch Caiioo

Mehrsprachiges Whisper-Modell

  • Whisper Tiny Multilingual: Neue lokale STT-Option, die 99 Sprachen unterstützt (~39MB Download)
  • Gleiche Größe wie Englisch: Dieselbe kompakte Größe von 39MB wie Whisper Tiny English
  • Spracherkennung: Erkennt automatisch die gesprochene Sprache

Google Docs Verbessertes Lesen & Schreiben

  • Markdown als Standard: Text wird beim Schreiben jetzt standardmäßig als Markdown formatiert. Verwenden Sie useMarkdown: false für Nur-Text-Einfügungen, die bestehende Formatierungen beibehalten.
  • Reichhaltige Formatierung: Konvertiert Markdown-Überschriften, Fett, Kursiv, Durchgestrichen und Links in native Google Docs-Stile
  • Listen & Tabellen: Unterstützt geordnete/ungeordnete Listen mit Verschachtelung und Markdown-Tabellen
  • Vorschlagsverfolgung: Ausstehende Vorschläge werden mit semantischen Tags angezeigt: <ins>hinzugefügter Text</ins> für Einfügungen, <del>entfernter Text</del> für Löschungen. Benachbarte Tags zeigen Ersetzungen an.
  • Inline-Kommentare: Kommentare erscheinen inline mit Autorenangabe: <comment author=\"Name\" on=\"zitierter Text\">Inhalt</comment> mit verschachtelten <reply>-Tags für Threads

Verbesserungen

Gemini Extended Thinking

  • Verbesserte Thought-Signatures: Bessere Handhabung von Geminis thought_signature über Streaming-Chunks hinweg, was die Kontinuität beim erweiterten Denken mit mehrstufiger Tool-Nutzung verbessert

Version 0.8.64 (5. Januar 2025)

Neue Funktionen

Google Sheets Zell-Metadaten

  • Hyperlinks & Notizen lesen: Verwenden Sie includeMetadata: true, um Hyperlinks, Notizen und Datenvalidierungsregeln aus Zellen abzurufen
  • Hyperlinks hinzufügen: Neue update_cell_metadata-Aktion zum Hinzufügen anklickbarer Hyperlinks mit benutzerdefiniertem Anzeigetext
  • Notizen hinzufügen: Programmgesteuertes Anhängen von Notizen/Kommentaren an Zellen
  • Datenvalidierung: Erstellen Sie Dropdowns, Zahlenbereiche, Textvalidierungen und benutzerdefinierte Formelregeln für Zellen

Safari Tiling (macOS)

  • Intelligente Fensterpositionierung: Beim Öffnen von Links aus dem Seitenpanel positionieren sich Safari-Fenster automatisch neben dem Seitenpanel für einfaches Browsen nebeneinander
  • Bildschirmplatz-Optimierung: Die Tiling-Logik berechnet die optimale Safari-Platzierung basierend auf dem verfügbaren Bildschirmplatz
  • Neuanordnung bei Moduswechsel: Safari-Fenster positionieren sich automatisch neu, wenn das Seitenpanel den Modus wechselt

Kopieren/Einfügen im macOS-Seitenpanel

  • Vollständige Unterstützung für Kopieren/Einfügen: Kopieren und Einfügen funktioniert jetzt zuverlässig in der macOS-Seitenpanel-App
  • System-Tastaturkürzel: Standardmäßige ⌘C/⌘V-Kürzel funktionieren wie erwartet

Verbesserungen

macOS Server-Zuverlässigkeit

  • Signalverarbeitung: Verbesserte Verarbeitung von Pipe-Signalen, um unerwartete App-Beendigungen zu verhindern
  • Neustart-Zuverlässigkeit: Server-Stopp- und Neustartvorgänge sind jetzt zuverlässiger mit ordnungsgemäßer Bereinigung
  • Verbindungsstabilität: Bessere Handhabung der OAuth-Token-Aktualisierung mit Wiederholungslogik und exponentiellem Backoff

Safari Extension

  • Stabile Browser-IDs: Die Safari Extension generiert jetzt stabile Browser-IDs, um doppelte Einträge bei Wiederverbindungen zu verhindern
  • Sauberere Wiederverbindung: Die serverseitige Browser-Registrierung verwendet vom Client bereitgestellte stabile IDs für eine sauberere Handhabung der Wiederverbindung

Modellauswahl

  • Zum Ausgewählten scrollen: Beim Öffnen des Modell-Dropdowns wird jetzt automatisch zum aktuell ausgewählten Modell gescrollt

Tab-Referenzen in der macOS App

  • Funktioniert im Seitenpanel: Tab-Referenzen und Kontext funktionieren jetzt im nativen macOS-Seitenpanel, nicht nur in der Chrome Extension

Version 0.8.63 (31. Dezember 2025)

Neue Funktionen

Sprachausgabe (Text-to-Speech)

  • Vorlesen: KI-Antworten können jetzt mit Microsoft Edge TTS vorgelesen werden
  • Auto-Play-Option: Automatisches Vorlesen neuer KI-Antworten in den Einstellungen aktivieren
  • Geschwindigkeitsregelung: Wiedergabegeschwindigkeit von 0,5x bis 2x anpassen
  • Pause/Fortsetzen: Steuerung der Wiedergabe über Pause- und Fortsetzen-Schaltflächen bei jeder Nachricht

Lokale Spracherkennung (Whisper)

  • Whisper-Upgrade: Nutzen Sie die lokale Whisper-Transkription für präzisere Spracheingaben
  • Modell-Download: Laden Sie das Whisper Tiny-Modell (~40MB) für die Offline-Nutzung herunter
  • Datenschutz: Audio wird lokal verarbeitet und niemals an externe Server gesendet
  • Fallback: Rückfall auf die Web Speech API, falls Whisper nicht verfügbar ist

Einheitliches Agenda-Tool

  • Einzelnes Tool: Das neue agenda-Tool bündelt Kalender- und Erinnerungsfunktionen
  • Multi-Provider: Funktioniert mit Google Calendar, Apple Calendar, Apple Reminders und caiioo-Erinnerungen
  • Einfacher für Agents: Eine einheitliche Tool-Schnittstelle für alle Planungsanforderungen

Verbesserungen

Einstellungsmenü

  • Permanenter Status: Der Status (offen/geschlossen) von Abschnitten wird jetzt über Sitzungen hinweg gespeichert
  • Spracheinstellungen: Neuer Bereich zur Konfiguration von TTS- und STT-Präferenzen

Version 0.8.62 (31. Dezember 2025)

Neue Funktionen

DOCX-Listenunterstützung

  • Nummerierte Listen: Word-Dokumente mit nummerierten Listen werden jetzt korrekt mit der richtigen Formatierung gerendert
  • Aufzählungslisten: Aufzählungspunkte bleiben erhalten und werden präzise angezeigt
  • Verschachtelte Listen: Die Einrückung mehrstufiger Listen bleibt in der HTML-Vorschau erhalten

CSV-Export für Tabellenkalkulationen

  • Export als CSV: XLSX-Dateien können jetzt zur einfachen Datenextraktion als CSV exportiert werden
  • Formatwahl: Wählen Sie beim Herunterladen von Tabellenanhängen zwischen XLSX oder CSV

Version 0.8.61 (30. Dezember 2025)

Neue Funktionen

Tool-Genehmigungsworkflow

  • Interaktive Genehmigung: Bestimmte Tools erfordern nun vor der Ausführung eine Benutzergenehmigung – Sie sehen ein modales Fenster, in dem Sie die Aktion genehmigen oder ablehnen können
  • Statusverfolgung: Tool-Ausführungen zeigen nun in der Zeitleiste die Zustände „ausstehende Genehmigung“ und „abgelehnt“ an
  • Standardmäßig sicher: Sensible Vorgänge warten auf die ausdrückliche Zustimmung des Benutzers, bevor sie fortfahren

Variable für den aktuellen Standort

  • {{currentLocation}}: Neue Variable zum Hinzufügen Ihres aktuellen Standortkontexts zu Prompts
  • Geolokalisierungsberechtigung: Erfordert bei der ersten Verwendung die Geolokalisierungsberechtigung des Browsers
  • Kontextbezogen: Ideal für standortbezogene Anfragen wie „Restaurants in meiner Nähe“ oder Reiseplanung

Batch-Thread-Verwaltung

  • Mehrfachauswahl-Modus: Aktivieren Sie den Auswahlmodus, um mehrere Threads gleichzeitig auszuwählen
  • Batch-Löschung: Löschen Sie ausgewählte Threads mit einer einzigen Aktion
  • Batch-Archivierung/Export: Archivieren oder exportieren Sie mehrere Threads gleichzeitig

Bildbetrachter in Slate

  • Dedizierter Betrachter: Bilder öffnen sich nun in einem Vollbild-Betrachter innerhalb von Slate
  • Zoom-Steuerung: Vergrößern/Verkleinern und Verschieben bei großen Bildern
  • Download-Option: Schnelle Download-Schaltfläche zum lokalen Speichern von Bildern

Verbesserungen

Anzeige von Überlegungen (Reasoning)

  • Bessere Aggregation: Denk-/Überlegungsblöcke von Modellen werden nun korrekt und ohne Duplizierung zusammengeführt
  • Sauberere Anzeige: Überlegungsinhalte von Modellen mit erweitertem Denken werden zuverlässiger angezeigt

Ollama-Integration

  • Streaming von Überlegungen: Echtzeit-Streaming von Überlegungs-/Denkinhalten von lokalen Ollama-Modellen
  • Bessere Modellhandhabung: Verbesserte Kompatibilität mit Mistral-Modellen und strikten Anforderungen an die Nachrichtenreihenfolge

Anhangsverwaltung

  • Bereinigung verwaister Dateien: Neuer Dialog in den Einstellungen zur Verwaltung verwaister Anhänge, die mit keinem Thread verknüpft sind
  • Thread zuweisen: Verschieben Sie verwaiste Anhänge in bestehende Threads
  • Massenlöschung: Bereinigen Sie verwaiste Dateien, um Speicherplatz freizugeben

Slate-Standardeinstellungen

  • Standardmäßig Markdown: Beim Erstellen eines neuen Slate ohne Angabe des Typs ist Markdown (.md) nun das Standardformat

Version 0.8.6 (19. Dezember 2025)

Neue Funktionen

Warte-Aktion für Browser-Automatisierung

  • Diskrete Warte-Typen: Neue wait-Aktion in der Browser-Automatisierung mit 4 spezialisierten Warte-Modi:
    • timeout - Einfache Verzögerung (Standard 1000ms, max 30000ms) für grundlegendes Timing
    • selector - Warten, bis ein Element erscheint oder verschwindet (nützlich für Spinner/Lader)
    • network_idle - Warten, bis Fetch/XHR-Anfragen abgeschlossen sind (nur Erweiterung)
    • animation - Warten, bis CSS-Animationen und Übergänge abgeschlossen sind
  • Intelligente Element-Sichtbarkeit: Die Selektor-Wartefunktion prüft Anzeige, Sichtbarkeit, Deckkraft und offsetParent für eine genaue Sichtbarkeitserkennung

Verbesserungen

Architektur der Browser-Automatisierung

  • Einheitliche Skriptausführung: Neue executeInPage-Abstraktion stellt konsistentes Verhalten über Chrome-Erweiterungs- und Relay/Server-Kontexte hinweg sicher
  • MAIN World-Ausführung: Korrekte MAIN-World-Skriptausführung für Operationen, die JavaScript auf Seitenebene abfangen müssen (fetch, XHR)
  • Graceful Degradation: Funktionen, die nur in der Erweiterung verfügbar sind, bieten jetzt hilfreiche Fehlermeldungen mit Alternativen, wenn sie im Relay-Modus verwendet werden

Fehlerbehebungen

OAuth-Token-Aktualisierung

  • Chrome-Erweiterung Token-Aktualisierung: Problem mit veralteten Tokens behoben, bei dem die zwischengespeicherten OAuth-Tokens von Chrome nicht ordnungsgemäß aktualisiert wurden. Tokens werden jetzt verifiziert und veraltete Tokens vor einem erneuten Versuch gelöscht.
  • PKCE-Autorisierungsfluss: Das OAuth-Popup verwendet jetzt den Autorisierungscode-Fluss mit PKCE anstelle des impliziten Flusses, was eine ordnungsgemäße Unterstützung von Refresh-Tokens ermöglicht, ohne ein Client-Secret zu erfordern.
  • Direkte Token-Aktualisierung: Verbindungen mit Refresh-Tokens können jetzt direkt über den Token-Endpunkt von Google aktualisiert werden, ohne einen Backend-Server zu erfordern.
  • Token-Validierung: Schritt zur Token-Verifizierung hinzugefügt, um widerrufene/ungültige Tokens frühzeitig zu erkennen und eine automatische erneute Authentifizierung auszulösen.

Version 0.8.5 (19. Dezember 2025)

Neue Funktionen

Apple Calendar Integration

  • Nativer Kalenderzugriff: Das neue Apple Calendar-Tool bietet schnellen, nativen Zugriff auf Ihre macOS-Kalender via EventKit
  • Einheitliche Agenda: Kombinierte Ansicht von Erinnerungen und Kalenderereignissen aller verknüpften Konten (Google Calendar + Apple Calendar)
  • Multi-Account-Unterstützung: Ereignisse aus mehreren Google Calendar-Konten und Apple-Kalendern gleichzeitig abrufen

Gelernte Seiten

  • Intelligentes Seitenlernen: Bringen Sie Caiioo die Struktur spezifischer Websites bei
  • URL-Mustererkennung: Gelernte Muster werden automatisch auf ähnliche Seiten derselben Website angewendet
  • DOM-Snapshot-Speicherung: Erfasste Seitenstrukturen helfen der KI, komplexe Web-Apps besser zu verstehen und mit ihnen zu interagieren

RTF-Dokumentunterstützung

  • Rich-Text-Bearbeitung: RTF-Dokumente (Rich Text Format) direkt in Slate hochladen und bearbeiten
  • Bidirektionale Konvertierung: Konvertierung zwischen RTF und HTML unter Beibehaltung der Formatierung
  • Export-Optionen: Bearbeitete Dokumente als RTF für die Verwendung in Pages, Word oder anderen Textverarbeitungsprogrammen herunterladen

Verbesserungen

Sicherheit der Desktop-App

  • Relay-Authentifizierung: Sichere HMAC-SHA256-Authentifizierung zwischen Erweiterung und Desktop-Server
  • Benutzerspezifische Token: Authentifizierungs-Token sind jetzt für Multi-User-Sicherheit an die Benutzeridentität gebunden
  • Geschützte Endpunkte: Alle sensiblen API-Endpunkte erfordern nun eine Authentifizierung

Leistung

  • Swift-Helfer: Native Swift-Binärdateien für Apple Reminders, Calendar und Notes bieten 10x schnelleren Zugriff als AppleScript
  • Direktaufrufe: Im Desktop-Kontext umgehen Apple-Tools das HTTP-Relay für geringere Latenz
  • Gemeinsame Utilities: Ein konsolidierter Relay-API-Client eliminiert Code-Duplizierung

Fehlerbehebungen

  • Kalender-Deduplizierung: Ereignisse, die in mehreren Kalendern erscheinen, werden in der einheitlichen Ansicht nun korrekt zusammengeführt
  • Prompt-Caching: Fehler behoben, bei dem Cache-Control-Marker während der Token-Schätzung entfernt wurden

Version 0.8.45 (18. Dezember 2025)

Neue Funktionen

  • Bild-Deduplizierung: Wenn Sie dasselbe Bild mehrfach in einer Unterhaltung hochladen, erkennt die KI es nun als Duplikat und verweist auf das Original, anstatt es erneut zu verarbeiten. Dies spart Kontext-Tokens und hilft der KI zu verstehen, dass Sie sich auf dasselbe Bild beziehen.

Verbesserungen

  • Dokument-Deduplizierung: Verbesserter dokumentübergreifender Abgleich – derselbe Dokumentinhalt wird nun erkannt, egal ob er aus einem Benutzer-Upload, einem Gmail-Anhang oder einer Webseiten-Erfassung stammt.

Fehlerbehebungen

  • PDF-Auth-Fehler: Problem behoben, bei dem Authentifizierungsfehler (401, 403) beim Abrufen geschützter PDFs als allgemeine Extraktionsfehler maskiert wurden. Der tatsächliche Auth-Fehler wird nun korrekt mit hilfreichen Hinweisen angezeigt.

Version 0.8.44 (18. Dezember 2025)

Fehlerbehebungen

  • Neu laden/Generieren-Schaltfläche: Problem behoben, bei dem das Klicken auf „Neu laden“ bei einer Assistenten-Nachricht die alte Antwort anzeigte, anstatt die neue, die gerade generiert wurde. Die UI wechselt nun während des Streamings korrekt zum neuen Zweig.

Verbesserungen

  • Kontextfenster-Management: Konservativere Token-Schätzung (3 Zeichen/Token) wird nun konsistent über alle Paginierungs- und Kontextberechnungen hinweg verwendet, was die Wahrscheinlichkeit von Kontext-Überlauffehlern bei großen Webseiten verringert.

Version 0.8.43 (17. Dezember 2025)

Verbesserungen

Zeitstrahl & Begründungsanzeige

  • Automatisches Einklappen bei Abschluss: Begründungsblöcke und Prozess-Zeitstrahl klappen jetzt automatisch ein, wenn die Generierung abgeschlossen ist, was die Unterhaltung sauber hält und dennoch zugänglich macht
  • Zwischengedanken sichtbar: Das „laute Nachdenken“ des Agenten zwischen Tool-Aufrufen wird nun inline im Zeitstrahl angezeigt, was einen besseren Einblick in den Entscheidungsprozess des Agenten gibt
  • Tool-Aktionsbeschriftungen: Tool-Aufrufe zeigen nun die spezifische Aktion in der Beschriftung an (z. B. „Web Browse → click“ statt nur „Web Browse“)

Tool-Ergebnisse

  • Screenshot-Anzeige-Fix: Screenshots und Bilder werden in Tool-Ergebnissen nicht mehr automatisch erweitert – nur gerenderter Textinhalt (wie Suchergebnisse) wird automatisch erweitert

Fehlerbehebungen

  • Ollama CORS: Verbindungsprobleme bei der Verwendung von Ollama über die Chrome-Erweiterung behoben – CORS-Header werden nun automatisch verarbeitet

Version 0.8.41 (15. Dezember 2025)

Verbesserungen

  • Typsicherheit: Der Server-Speicheradapter verwendet jetzt korrekte TypeScript-Typen anstelle von any für Threads, Skills, Profile, MCP-Server und Lizenzinformationen
  • Build-System: Das Backup-Verzeichnis ist jetzt über die Umgebungsvariable caiioo_BACKUP_DIR optional (nicht mehr fest im Code)

Version 0.8.4 (15. Dezember 2025)

Neue Funktionen

DNG/RAW-Bildunterstützung

  • Kamera-RAW-Dateien: Laden Sie DNG-Dateien (Digital Negative) direkt von Ihrer Kamera oder Fotobibliothek hoch
  • Automatische Vorschau-Extraktion: Eingebettete JPEG-Vorschauen werden für eine schnelle Verarbeitung aus RAW-Dateien extrahiert
  • Erhalt der Originalqualität: Die ursprünglichen RAW-Daten bleiben erhalten, während die KI mit der hochwertigen Vorschau arbeitet

Verbesserte Bildverarbeitung

  • Serverseitige Komprimierung: Große Bilder, die lokale Komprimierungsgrenzen überschreiten, werden jetzt vom Desktop-Server verarbeitet
  • Besseres Fehler-Feedback: Visuelle Fehlerindikatoren (roter Rahmen, Warnsymbol), wenn die Bildverarbeitung fehlschlägt
  • Graceful Fallbacks: Die Komprimierung greift automatisch auf den Server zurück, wenn das Offscreen-Dokument nicht verfügbar ist

Verbesserungen

  • Shared Agent Architecture: Einheitlicher Agent-Runner, der zwischen Erweiterung und Desktop-Server geteilt wird, für konsistentes Verhalten
  • Konsolidierung der Protokoll-Handler: Speicher- und Nachrichtenverarbeitung nutzen jetzt gemeinsame Protokoll-Handler

Version 0.8.3 (13. Dezember 2025)

Neue Funktionen

Native Mobile Apps

  • Android App: Native Kotlin-App (android-app/) mit WebView + nativen Bridge-Kanälen (CalendarContract, SAF/Foto-Picker, AlarmManager, OkHttp-Streaming)
  • Geteiltes UI: Mobile Apps nutzen dasselbe React-UI wie die Web-Extension für ein konsistentes Erlebnis
  • iOS + Android: Natives Swift (iOS) und natives Kotlin (Android) mit passenden Bridge-APIs

Verbesserungen

  • Identitäts-Synchronisierung: Verbesserte Synchronisierung von Lizenz- und Profildaten zwischen Extension und Desktop-Server
  • Anhang-Verwaltung: Bessere Handhabung von Anhängen im LAN/Relay-Modus
  • Extension-Client-Tracking: Desktop-Server verfolgt jetzt verbundene Extension-Clients mit Zeitstempeln

Entfernt

  • Swift Relay App: macOS-Relay-Funktionalität wird nun vollständig vom nativen App-Server übernommen (eingeführt in 0.8.2)

Version 0.8.2 (12. Dezember 2025)

Neue Funktionen

Plattformübergreifender Desktop-Server

  • Caiioo Server: Neue Electron-basierte Desktop-Anwendung ersetzt die macOS-exklusive Swift-Relay-App
  • Windows-Unterstützung: Nativer Windows-Installer (NSIS) und portable ausführbare Datei
  • Linux-Unterstützung: AppImage und .deb-Pakete für Linux-Distributionen
  • Menüleisten-Integration: System-Tray/Menüleisten-App mit Statusanzeigen und Schnellsteuerung

Plattformspezifische Skriptausführung

  • Einheitliche Skript-API: Neuer /api/script-Endpunkt erkennt automatisch die Plattform und nutzt die entsprechende Skript-Engine
  • PowerShell unter Windows: Ausführung von PowerShell-Skripten zur Systemautomatisierung unter Windows
  • Bash unter Linux: Ausführung von Shell-Skripten (bash/sh/zsh) auf Linux-Systemen
  • AppleScript unter macOS: Bestehende AppleScript/JXA-Unterstützung bleibt erhalten

Plattformübergreifende Helfer

  • Desktop-Benachrichtigungen: Anzeige von Benachrichtigungen über native APIs auf allen Plattformen
  • Zwischenablage-Zugriff: Plattformübergreifendes Lesen und Schreiben von Inhalten der Zwischenablage
  • Erkennung des aktiven Fensters: Abrufen der Vordergrundanwendung/des Fenstertitels
  • System-Info: Abrufen von OS-, CPU- und Speicherinformationen

Verbesserungen

  • Automatisierte Build-Pipeline: Version, Icons und Lizenzen werden während des Builds vom Hauptprojekt synchronisiert
  • Kleinere Distribution: Redundante Codebasen der mobilen App zur Vorbereitung auf einheitliche Builds entfernt

Version 0.8.1 (11. Dezember 2025)

Neue Funktionen

Flexible Anmeldeoptionen

  • Mehrere Authentifizierungsmethoden: Melden Sie sich mit Google OAuth, E-Mail/Passwort oder Lizenzschlüssel an – wählen Sie, was für Sie am besten funktioniert
  • Kontoverknüpfung: Verknüpfen Sie Ihr Google-Konto mit einem bestehenden E-Mail/Passwort-Konto für nahtlosen Zugriff über verschiedene Methoden hinweg

Benutzerdefiniertes OAuth für MCP-Server

  • Eigene OAuth-Anmeldedaten: Für MCP-Server, die vorregistrierte OAuth-Clients erfordern, können Sie jetzt Ihre eigene Client-ID und Ihr eigenes Secret angeben
  • Dynamische Token-Aktualisierung: OAuth-Token werden automatisch aktualisiert, um unterbrechungsfreie Verbindungen zu MCP-Servern zu gewährleisten

Verbesserungen

  • Indikatoren für die Dokumentenverarbeitung: Klare visuelle Anzeigen bei der Verarbeitung von PDFs, Word-Dokumenten und Excel-Tabellen
  • Einstellungen-Navigation nach Stufe: Das Einstellungsmenü zeigt jetzt intelligent relevante Optionen basierend auf Ihrem Abonnement-Tarif an
  • Bessere OAuth-Fehlerbehandlung: Verbesserte Fehlermeldungen, wenn die OAuth-Erkennung des MCP-Servers fehlschlägt

Version 0.8.0 (10. Dezember 2025)

Neue Funktionen

MCP Server Browser & Management

  • MCP Server durchsuchen: Suchen und installieren Sie MCP Server sowohl aus der MCP Registry als auch von npm direkt in den Settings.
  • Lokale MCP Server: Führen Sie MCP Server lokal auf Ihrem Rechner über die Relay-App aus, um mehr Privatsphäre und Kontrolle zu erhalten.
  • Credential Resolution: MCP Server können nun Anmeldedaten aus dem Credentials Vault für eine sichere Authentifizierung abrufen.
  • Health Monitoring: Automatische Integritätsprüfungen für verbundene MCP Server mit Statusanzeigen.

Profil-Management

  • Mehrere Profile: Erstellen und wechseln Sie zwischen mehreren Benutzerprofilen.
  • Profil-Switcher: Leicht zugängliches Dropdown-Menü zum Wechseln von Profilen im Composer.
  • Profil-Löschung: Entfernen Sie Profile, die Sie nicht mehr benötigen.

Google Account Auswahl

  • Konto-Auswahldialog: Wählen Sie beim Verbinden von Google-Diensten zwischen Ihrem Chrome-Profilkonto oder fügen Sie ein anderes Google-Konto hinzu.
  • Web OAuth Flow: Option zur Authentifizierung über den Webbrowser für Konten, die nicht in Chrome angemeldet sind.

Verbesserter Browser Agent

  • Go Back Aktion: Der Agent kann nun in der Browser-Historie zurücknavigieren.
  • ARIA Snapshot: Erfassung von Snapshots des Accessibility Trees für eine effizientere Seitenanalyse mit weniger Token.

Mobile Apps

  • iOS App: Nativer iOS-Client für den Zugriff auf Caiioo in Ihrem lokalen Netzwerk.
  • Android App: Nativer Android-Client mit Server-Discovery und WebView-Caching.

Multi-Device Sync

  • Device Identity: Jedes verbundene Gerät bzw. jede Extension wird mit einer eigenen Identität verfolgt.
  • State Synchronization: Echtzeit-Statussynchronisierung über mehrere verbundene Extensions hinweg.
  • Web Client Authentication: Sichere Authentifizierung für Web-Clients, die eine Verbindung zum Relay herstellen.

Verbesserungen

  • LLM Provider Key Management: Verwalten Sie API-Keys für verschiedene LLM-Provider direkt im Credentials Vault.
  • MCP Tool Images: MCP-Tools, die Bilder zurückgeben, werden nun inline in der Konversation angezeigt.
  • PDF Text Detection: Verbesserte Erkennung von verstümmeltem oder weit auseinander stehendem Text bei der PDF-Extraktion mit Konfidenzbewertung.
  • CORS Bypass für Bilder: Bilder werden nun über ein Offscreen-Dokument abgerufen, um CORS-Beschränkungen zu umgehen.

Fehlerbehebungen

  • Generation State Tracking: Verbesserte Erfassung des Final State, um sicherzustellen, dass der Abschluss der Generierung präzise erkannt wird.

Version 0.7.8 (7. Dezember 2025)

Neue Funktionen

Excel-Unterstützung

  • XLSX-Import: Laden Sie Excel-Tabellen (.xlsx) direkt in Ihre Konversationen hoch
  • Datenextraktion: Tabelleninhalte werden analysiert und der KI für Analysen zur Verfügung gestellt
  • Round-Trip-Bearbeitung: Bearbeiten Sie Tabellen in Slate und exportieren Sie diese zurück in das XLSX-Format

"Was ist neu"-Dialog

  • Update-Benachrichtigungen: Nach einem Update von Caiioo zeigt ein Dialog automatisch die Versionshinweise der neuen Version an
  • Versionsspezifische Hinweise: Sehen Sie genau, was sich geändert hat, mit formatierten Feature-Listen und Verbesserungen
  • Dezent: Der Dialog erscheint nur einmal pro Update und wird bei der Erstinstallation nicht angezeigt

Version 0.7.6 (3. Dezember 2025)

Neue Funktionen

Word-Dokumentunterstützung mit nachverfolgten Änderungen

  • DOCX-Import: Laden Sie Word-Dokumente (.docx) direkt in Ihre Unterhaltungen hoch
  • Nachverfolgte Änderungen sichtbar: Sehen Sie Einfügungen (grün) und Löschungen (rote Durchstreichung) mit Autor und Datum beim Überfahren mit der Maus
  • Kommentarunterstützung: Kommentare werden gelb hervorgehoben, mit Tooltips, die den Kommentartext und den Autor anzeigen
  • Slate-Bearbeitung: Anzeigen und Bearbeiten von DOCX-Inhalten in Slate mit vollständigem Styling für nachverfolgte Änderungen
  • Dark Mode-Unterstützung: Alle Stile für nachverfolgte Änderungen und Kommentare funktionieren sowohl im hellen als auch im dunklen Design

Version 0.7.4 (2. Dezember 2025)

Neue Funktionen

FLUX-Bildgenerator

  • KI-Bilderzeugung: Generieren Sie Bilder aus Textbeschreibungen mithilfe von FLUX-KI-Modellen über OpenRouter
  • Bildbearbeitung: Bearbeiten Sie vorhandene Bilder in Ihrer Unterhaltung durch Angabe der Anhangs-ID und Bearbeitungsanweisungen
  • Multi-Referenz-Unterstützung: Kombinieren Sie Elemente aus bis zu 10 Bildern mit dem flux.2-flex-Modell
  • Mehrere Modelle: Wählen Sie zwischen flux.2-pro (schnell, Standard) oder flux.2-flex (maximale Qualität)
  • Automatische Speicherung: Generierte Bilder werden in Ihrer Unterhaltung gespeichert und inline angezeigt
  • Kostenverfolgung: Die Kosten für die Bilderzeugung werden separat erfasst und zu den Thread-Summen addiert

Version 0.7.3 (1. Dezember 2025)

Neue Funktionen

Verbesserte Modellauswahl

  • Einheitliche Modellauswahl: Konsistente Modellauswahl in Composer und Einstellungen
  • Datenschutzindikatoren: Das Schild-Symbol zeigt Modelle mit Zero Data Retention (ZDR) an – Ihre Prompts werden nicht zum Training verwendet
  • Vision-Unterstützung: Das Augen-Symbol zeigt Modelle an, die Bilder analysieren können
  • Empfohlene Modelle: Das Stern-Symbol hebt empfohlene Optionen hervor (Claude Haiku 4.5, Claude Sonnet 4.5)
  • Kostentransparenz: Sehen Sie die Preise pro Million Token direkt in der Modellliste – finden Sie leicht GRATIS-Modelle
  • Icon-Legende: Ein kurzer Verweis in den Einstellungen erklärt die Bedeutung jedes Indikators

Version 0.7.2 (1. Dezember 2025)

Neue Funktionen

PDF-Dokument-Ingestion

  • PDFs direkt hochladen: Hängen Sie PDF-Dokumente an Ihre Nachrichten an – sie werden automatisch per Mistral OCR verarbeitet
  • Hochwertige Textextraktion: Tabellen, Abbildungen, Gleichungen und Formatierungen bleiben als Markdown erhalten
  • Agent-Dokument-Ingestion: Agenten können PDF-URLs, auf die sie beim Browsen stoßen, mithilfe der neuen ingest_document-Aktion verarbeiten
  • Persistente Speicherung: Extrahierte Inhalte werden für zukünftige Referenzzwecke gespeichert, ohne erneute Verarbeitungskosten

Fehlerbehebungen

  • Große Bildanhänge: Bilder über 5 MB werden jetzt vor dem Senden an LLM-APIs automatisch komprimiert, wodurch Fehler wie „Bild überschreitet das Maximum von 5 MB“ bei Anbietern wie Google/Gemini behoben werden

Version 0.7.0 (1. Dezember 2025)

Neue Funktionen

Multi-Thread-Unterstützung

  • Mehrere Agenten gleichzeitig ausführen: Sie können jetzt bis zu 3 Threads gleichzeitig laufen lassen
  • Visuelle Laufanzeigen: Animierte Punkte erscheinen neben Thread-Titeln in der Seitenleiste, wenn dieser Thread aktiv generiert
  • Hintergrundverarbeitung: Agenten arbeiten im Hintergrund, ohne den Fokus zu stehlen – surfen Sie frei, während sie arbeiten
  • Thread-Isolierung: Jeder Thread verfolgt seine eigenen Tabs und seinen Status unabhängig

Agent-Nicht-Interferenz

  • Behalten Sie die Kontrolle: Wenn ein Agent Tabs öffnet oder Seiten navigiert, stiehlt er Ihnen nicht den Fokus, wenn Sie zu einem anderen Tab gewechselt haben
  • Intelligentes Tab-Bewusstsein: Agenten arbeiten nur mit Tabs, die sie erstellt haben oder mit denen sie begonnen haben, und folgen Ihnen nie mitten im Lauf zu neuen Tabs

Apple-Integration (macOS)

  • Apple Notizen: Lesen, erstellen, suchen und organisieren Sie Notizen in Ordnern – die KI kann beim Entwerfen und Bearbeiten von Notizen direkt helfen
  • Apple Erinnerungen: Verwalten Sie Aufgabenlisten und Erinnerungen – erstellen, erledigen und organisieren Sie Aufgaben mit KI-Unterstützung

Version 0.6.5 (30. November 2025)

Neue Funktionen

KI-Follow-up-Vorschläge

  • Smart Prompts: Nachdem der Assistent geantwortet hat, erscheinen KI-generierte Follow-up-Vorschläge, um die Unterhaltung fortzusetzen
  • Kontextbewusst: Vorschläge basieren auf dem Unterhaltungskontext und darauf, was Sie als Nächstes tun möchten

Verbesserungen

LAN-Relay-Einstellungen

  • Netzwerkadresse anzeigen: Wenn eine Verbindung zum Relay-Server besteht, zeigen die Einstellungen jetzt die tatsächliche IP-Adresse und den .local-Hostnamen für eine einfache Verbindung mit Mobilgeräten an
  • Vereinfachte Anweisungen: Verbindungsinformationen erscheinen automatisch, sobald der Server läuft – kein Überprüfen des Terminals erforderlich

Version 0.6.4 (29. November 2025)

Fehlerbehebungen

Slate-Revisionssystem

  • Wortweises Akzeptieren/Ablehnen: Einzelne Wortänderungen können jetzt zuverlässig akzeptiert oder abgelehnt werden, ohne nachfolgende Änderungen zu unterbrechen
  • Stabile Änderungsverfolgung: Problem behoben, bei dem das Akzeptieren einer Änderung dazu führte, dass andere ausstehende Änderungen nicht mehr anklickbar waren
  • Markdown-Rendering in der Vorschau: Änderungsvorschauen rendern jetzt Markdown-Formatierungen (fett, kursiv usw.), anstatt rohe Sternchen anzuzeigen
  • Endlosschleifen-Fix: Browser-Hänger beim Akzeptieren reiner Textzusätze behoben
  • Vollständige Diff-Anzeige: Die Änderungsvorschau zeigt jetzt alle gelöschten und hinzugefügten Wörter an, nicht nur minimale Unterschiede

Version 0.6.3 (26. November 2025)

Neue Funktionen

  • Standard-Benutzererfahrung: Neue Benutzer starten jetzt als Basis-Benutzer statt als Admin
  • Lizenzschlüssel-Upgrade: „Upgrade auf Pro“-Button in den Einstellungen hinzugefügt, um Admin-Funktionen mit einem Lizenzschlüssel freizuschalten
  • Vereinfachtes Onboarding: Sauberere Benutzererfahrung für Erstbenutzer, fokussiert auf Kernfunktionen

Version 0.6.2 (26. November 2025)

Fehlerbehebungen

  • Wiederherstellung bei Generierungs-Timeout: Stumme Fehler bei langen Slate-Operationen behoben, bei denen die UI unendlich „generiert“ anzeigte
    • Das Backend verfolgt jetzt die Aktivität während der Generierung und bricht nach 2 Minuten ohne Fortschritt ab
    • Streaming-Chunks, Tool-Ausführung und Agenten-Entscheidungen setzen das Timeout zurück
    • Automatische Wiederherstellung, wenn der Service Worker mitten in der Generierung neu startet (Erkennung verwaister Zustände)
    • Fehlermeldung wird dem Benutzer bei Timeout angezeigt, anstatt eines stummen Hängers

Version 0.6.1 (26. November 2025)

Neue Funktionen

Thread-Import/Export

  • Ausgewählte Threads exportieren: Auswahlmodus umschalten, um spezifische Threads für den Export zu wählen
  • Alle Threads exportieren: Ein-Klick-Export aller Konversationen inklusive Anhängen
  • Aus Datei importieren: Threads aus exportierten JSON-Dateien importieren
  • Selektiver Import: Auswählen, welche Threads aus einer Datei importiert werden sollen
  • Duplikaterkennung: Erkennt automatisch bereits existierende Threads mit der Option, diese zu überspringen oder zu überschreiben
  • Unterstützung für Anhänge: Alle Bilder, PDFs und Dateien sind in den Exporten enthalten
  • Unterstützung für archivierte Threads: Sowohl aktive als auch archivierte Threads können exportiert/importiert werden

Verbessertes Prompt Caching

  • Bessere Cache-Trefferraten für lange Konversationen mit Claude-Modellen
  • Dynamische Caching-Strategie passt sich der Konversationslänge an

Google Workspace Integration

  • Google Drive: Suchen, Erstellen, Kopieren, Verschieben und Freigeben von Dateien und Ordnern
  • Gmail: E-Mails lesen, Labels verwalten, Entwürfe erstellen (Sicherheit geht vor: nur Entwürfe, kein automatischer Versand)
  • Google Calendar: Kalender auflisten, Termine abfragen, Termine erstellen/aktualisieren/löschen, freie Zeitfenster finden
  • Inline-Autorisierung: Google-Zugriff direkt aus dem Chat autorisieren, ohne die Settings aufzurufen

Verbesserungen beim Web Browsing

  • Neue click_coordinates-Aktion zum Klicken auf Elemente nach Bildschirmposition
  • URLs öffnen sich jetzt standardmäßig in neuen Tabs (verhindert das Überschreiben von Tabs)
  • Tabs werden automatisch pro Konversations-Thread gruppiert
  • Bessere CSS-Selector-Erkennung für zuverlässiges Klicken auf Elemente

Modellauswahl

  • Modellauswahl in den Composer-Bereich verschoben für schnelles Umschalten
  • Modell bleibt global über Modus-Wechsel hinweg bestehen
  • Vision-fähige Modelle sind mit einem Augen-Icon markiert

Streaming-UI

  • Tool-Parameter werden während des Streamings angezeigt
  • Progressive Anzeige von Reasoning/Thinking-Blöcken
  • „Generiert...“-Statusanzeige während der Antwort

Token-Nutzung & Kosten-Tracking

  • Anzeige von Input-, Output-, Reasoning- und Cached-Tokens
  • Anzeige der Kosten pro Nachricht und der kumulierten Thread-Kosten

UI-Verbesserungen

  • Modus-Auswahl für alle Benutzer verfügbar: Nicht-Admin-Benutzer können nun in den Settings zwischen Modi wechseln
  • Einklappbare Settings-Abschnitte: Abschnitte im Settings-Panel können zur besseren Navigation ein- und ausgeklappt werden
    • AI & Model Configuration (LLM Provider, API Key, Modell, Temperature, Max Iterations)
    • Personalization (Personal Instructions, Profile Variables)
    • Agent Mode Configuration (Mode Selector, Variables, Instructions, Branding, Tools, MCP Servers)
    • Appearance settings
    • Backup & Restore
    • Documentation
  • Modus-spezifische Theme-Farben: Jeder integrierte Modus hat nun ein Standard-Farbschema
    • Shopping Agent: Grün
    • Travel Agent: Blau
    • Helper Agent: Pink
    • Caiioo (Allgemein): Lila
  • Chromatischer Modus: Aktivieren Sie die Farbrotation, um schrittweise durch das Farbspektrum zu wechseln
  • Theme-Override-Management:
    • Visuelle Anzeige, wenn das Theme angepasst wurde (geht beim Modus-Wechsel nicht verloren)
    • „Save as Mode Defaults“-Button (Admin) speichert das Theme als neuen Standard des Modus
    • „Reset to Mode Defaults“ stellt die ursprünglichen Theme-Farben des Modus wieder her
  • Neues Caiioo Branding und Icon
  • Modus-Auswahl in den Composer-Bereich verschoben
  • Neuer Thread-Button zeigt Modus-Auswahl-Dropdown
  • Thread-Listen-Umschalter in der oberen Leiste des Composers
  • Vignette-Randeffekt bei gesteuerten Browser-Tabs
  • Schwebender Stop-Button in gesteuerten Tabs
  • Dropdown-Menüs positionieren sich korrekt in der Nähe von Bildschirmrändern

Fehlerbehebungen

  • Modellauswahl aktualisiert sich sofort nach Änderungen in den Settings
  • Onboarding für neue Benutzer startet nun korrekt den Helper Agent
  • Settings-Panel stürzt bei fehlerhaften benutzerdefinierten Variablen nicht mehr ab
  • Tab-Gruppennamen aktualisieren sich, wenn sich der Thread-Titel ändert
  • Slate Accept/Reject-Widgets korrekt positioniert
  • Extended Thinking funktioniert mit mehr Modellen (Haiku 4.5, Gemini, etc.)
  • Fehler „maximum 4 cache_control blocks“ behoben

Version 0.3.4 (24. November 2025)

Neue Funktionen

Textauswahl-Kontext

  • Schaltfläche "Zum Prompt hinzufügen" erscheint beim Markieren von Text auf Webseiten
  • Markierter Text wird als Chip im Composer mit Seitenkontext angezeigt
  • DOM-Position wird für präzise Agent-Interaktion erfasst

Google Calendar Integration

  • Vollständige Kalenderverwaltung (Ereignisse auflisten, erstellen, aktualisieren, löschen)
  • Intelligente Verfügbarkeitssuche über alle Kalender hinweg
  • Zeitverarbeitung in natürlicher Sprache ("morgen", "nächste Woche")

Fehlerbehebungen

Slate-Modus

  • Akzeptieren/Ablehnen-Schaltflächen werden nicht mehr vom Editor-Inhalt verdeckt
  • Diff-Hervorhebung auf Wortebene (nicht mehr ganze Zeilen)
  • Mehrere propose_change-Aufrufe werden nun korrekt akkumuliert
  • Ansichtsumschalter springt nicht mehr unerwartet zurück

Rebranding

  • Umbenannt von "ContextFlow" zu "Caiioo"

Version 0.3.0 (22. November 2025)

Neue Funktionen

Mobiler & LAN-Zugriff

  • LAN-Server: Greifen Sie von jedem Gerät in Ihrem lokalen Netzwerk auf Caiioo zu
  • Konversations-Sidebar: Öffnen Sie Konversationen in einem Browser-Tab für mehr Bildschirmfläche
  • Mobiler Export: Exportieren Sie Konversationen als eigenständiges HTML zur Offline-Ansicht

Fehlerbehebungen

  • Kritischer Fehler in der Logik der Nachrichtenverzweigung behoben
  • Operationen für archivierte Threads korrigiert

Version 0.2.0 (21. November 2025)

Neue Funktionen

Erweiterte Thinking-Unterstützung

  • Claude-Modelle unterstützen jetzt erweiterte Thinking-/Reasoning-Blöcke
  • Einklappbare Reasoning-Benutzeroberfläche zur Ansicht des Denkprozesses des Modells
  • Reasoning-Details werden für die Kontinuität über mehrere Nachrichten hinweg zwischengespeichert

Neue LLM-Anbieter

  • Ollama-Integration: Lokale LLMs über Ollama ausführen
  • Anbieterauswahl im Einstellungsbereich

Unterstützung von Bildformaten

  • HEIC/HEIF-Unterstützung: Apple-Bildformate werden automatisch für die Kompatibilität konvertiert

UI-Verbesserungen

  • Das Tools-Menü wird beim Schließen automatisch gespeichert
  • Bessere Organisation des Einstellungsbereichs

Fehlerbehebungen

  • Positionierung der Variablen-Autovervollständigung verbessert

Version 0.1.x (Vorherige Versionen)

Kernfunktionen

  • Multi-Modell-KI-Chat (OpenRouter, Anthropic, OpenAI, Ollama)
  • Browser-Automatisierung und Web-Scraping
  • Slate für die Bearbeitung von Code und Dokumenten
  • MCP-Server-Integration
  • Screenshot- und Vision-Funktionen
  • Spracheingabe
  • Thread-Verwaltung und Verzweigung
  • Profil- und Modus-System