Esta es una traducción automática del documento original en inglés. En caso de cualquier discrepancia entre esta traducción y la versión original en inglés, prevalecerá la versión en inglés. Leer la versión original en inglés
Versión 0.9.720 (1 de mayo de 2026)
Marca
- Común: PebbleFlow ahora es Caiioo: El producto ha sido renombrado a Caiioo — el mismo animal, la misma app que has estado usando. Verás el nuevo nombre en todo el panel lateral, los ajustes, el sitio web, el menú de la app host de macOS y la app host de Safari. Los datos existentes, las cuentas, los inicios de sesión y la sincronización no han cambiado — solo cambia el nombre visible. El sitio de marketing permanece en pebbleflow.ai por ahora y muestra la nueva marca con compatibilidad futura; el enrutamiento canónico a caiioo.ai se implementará en una versión posterior.
Nuevas Funciones
- Común: El Modo Simple está activado por defecto para nuevos usuarios: Las instalaciones por primera vez ahora inician en Modo Simple — un editor más tranquilo que oculta los detalles de tokens y costes por mensaje, el menú desplegable de compresión sin pérdidas y los indicadores de contexto de pestañas. El selector de modelo sigue visible porque elegir un modelo es una acción de primer nivel. Los usuarios existentes mantienen la configuración de Modo Simple que tuvieran. Un nuevo interruptor con icono de ojo en el editor permite mostrar u ocultar todos los detalles con un toque.
- Común: Eliminación de cuenta: Ahora puedes eliminar tu cuenta de Caiioo desde la página de Cuenta del sitio web (también enlazada desde la app de iOS, según el requisito de eliminación de cuentas de Apple). La eliminación borra tu perfil, credenciales de inicio de sesión, saldo de créditos de AI y la copia cifrada de tu clave de OpenRouter aprovisionada; se conservan registros mínimos de auditoría de cumplimiento sin ID de cuenta, según lo exige la ley. Una nueva sección en la política de privacidad detalla exactamente qué se elimina y qué se conserva.
- iOS: Texto a voz nativo en el dispositivo (Kokoro 82M): La síntesis de voz Kokoro ahora se ejecuta en el proceso host de iOS a través de OnnxRuntime en lugar de dentro de WKWebView, imitando la arquitectura de e5-embeddings de la versión 0.9.719. El modelo recibe el presupuesto de memoria aumentado del proceso host en lugar de competir con la interfaz del panel lateral por el límite por proceso de WebKit, por lo que el TTS en el dispositivo ya no bloquea la WebView bajo carga en iPhone 13/14.
Mejoras
- Común: El generador de imágenes funciona con modelos de streaming lentos: La herramienta de generación de imágenes ahora opta por el streaming para los modelos de imagen de OpenRouter, solucionando el error "Network error: Unable to connect to OpenRouter" en modelos lentos como
gpt-5.4-image-2(~167 s de extremo a extremo). La ruta anterior con búfer esperaba ~1.8 MB de relleno de mantenimiento de conexión (keepalive) antes de que llegara el JSON real, y el tiempo de espera de la capa de conexión se activaba primero. - Común: La selección de modelo de nivel gratuito elige un modelo real dinámicamente: El meta-enrutador anterior
openrouter/freeenrutaba dentro de OpenRouter sin saber qué modelos subyacentes admitían herramientas o visión — los usuarios de Android que enviaban una imagen junto con una llamada a herramienta recibían el error "No endpoints found that support tool use". Caiioo ahora se enruta a sí mismo: el onboarding, los ajustes y el botón de "usar modelos gratuitos" del modal de actualización eligen un modelo gratuito real que admita herramientas (y entrada de imágenes donde esté disponible), y cambian automáticamente ante errores de límite de tasa o de capacidad. Los usuarios existentes enopenrouter/freese migrarán progresivamente en el próximo inicio. - Común: Personal Intuition encuentra el contexto adecuado en mensajes largos: La consulta de recuperación se recortaba a los últimos 500 caracteres de tu mensaje y se incrustaba como un único vector. En mensajes largos de tipo "pegar y preguntar" o turnos con múltiples temas, esto truncaba la pregunta real o difuminaba todo en un centroide temático plano que puntuaba mal. Caiioo ahora extrae una consulta relevante — mantiene el inicio literal y añade un conjunto de tokens con contenido sin duplicados extraídos de hasta los siguientes 3000 caracteres — para que la recuperación se mantenga en el tema incluso cuando tu prompt sea largo.
- Común: El interruptor Ajustes → "Ajustes mínimos" deja de cambiar su propio título: El interruptor alternaba su etiqueta entre "Ajustes mínimos" (activado) y "Ajustes avanzados" (desactivado), por lo que el estado desactivado se leía como si marcar la casilla te llevara a avanzado — lo contrario de lo que sucede. El título ahora permanece constante; la descripción añade el prefijo "Activado — " / "Desactivado — " para que el estado actual sea inequívoco.
- Común: El diálogo de descarga de modelos de voz gestiona el progreso indeterminado: La tarjeta de información del modelo durante la descarga podía desbordarse en el estrecho panel lateral; el diseño ahora está anclado. Cuando el servidor no devuelve un Content-Length, el bloque de progreso muestra un indicador de carga indeterminado en lugar de una barra congelada en 0%.
- Común: El Modo Simple muestra una franja de estadísticas compacta en lugar de ocultarlo todo: El Modo Simple anteriormente ocultaba todo el resumen de estadísticas del hilo. Ahora muestra una franja delgada — anillo de ventana de contexto, tokens totales compactos (ej. "1k"), coste y crédito restante — y el icono del ojo en el editor expande el detalle completo con un toque.
- Común: Los costes de subagentes se consolidan correctamente: El recuento de costes por hilo omitía el gasto de Perplexity / búsqueda web de subagentes, costes de ayudantes, costes de generación de imagen/video/música, costes de OCR de PDF y costes de voz. Todas las categorías ahora se consolidan en la línea
sub_agent_costdel elemento principal. - Común: El selector Ajustes → Herramientas anula las herramientas desactivadas por defecto: Elegir "Siempre" o "Auto" en una herramienta que viene desactivada por defecto estaba siendo ignorado silenciosamente. Tu elección de configuración dinámica de herramientas ahora anula el valor por defecto.
- Común: El sidecar local ha sido renombrado a "App de escritorio" en los textos para el usuario: Todas las referencias visibles para el usuario a "PebbleFlow Relay" — el sidecar que soporta los servidores MCP de stdio local y las herramientas exclusivas de escritorio — ahora dicen "App de escritorio", que es lo que los usuarios realmente instalan.
- Común: Textos de privacidad simplificados: Se eliminó la redacción redundante sobre "telemetría" en las políticas legales, listados de tiendas, la página de privacidad del sitio web y la guía interna de la app. "Sin analíticas" ya lo cubre; no hay cambios fácticos en lo que las apps recopilan o dejan de recopilar.
- Común: Las etiquetas de la vista de cuenta del proveedor equilibran el origen: El panel de cuenta del proveedor ahora indica contra qué clave informa cada saldo (tu clave BYOK frente a la clave aprovisionada por Caiioo), de modo que los créditos y el saldo restante ya no puedan malatribuirse a simple vista.
Corrección de Errores
- Común: Apple Sign-In tras la transición de marca: Apple Sign-In fallaba para nuevos inicios de sesión porque el ID de Servicios OAuth todavía apuntaba al antiguo
com.sixcailloux.PebbleFlow.web. Se ha cambiado acom.sixcailloux.Caiioo.webpara que "Iniciar sesión con Apple" vuelva a funcionar en iOS, macOS y la página de cuenta web. - Común: Botón "Iniciar sesión" en servidores MCP que requieren OAuth: Instalar un servidor MCP remoto que requiere OAuth (ej. Notion) escribe el servidor en el almacenamiento incluso cuando la conexión inicial falla porque se requiere OAuth, pero no se registra ningún cliente. El botón "Iniciar sesión" enviaba entonces una solicitud de actualización que devolvía un error genérico "MCP server
not found" en lugar de abrir el diálogo de OAuth. La actualización ahora recurre a una nueva llamada addServercuando el cliente no está registrado, para que se presente la estructura OAuth/DCR y el diálogo de inicio de sesión se abra realmente. - Común: Los informes de errores enviados desde apps nativas ahora registran la versión correcta de la app: Los shells de iOS, macOS y Android ahora inyectan la versión de la app instalada en la WebView al arrancar, para que los informes de errores enviados identifiquen de qué compilación provienen en lugar de dejar el campo en blanco o repetir la versión del panel lateral empaquetado.
- Android: Cierre inesperado al iniciar tras el cambio de marca: Un renombre excesivamente entusiasta de PebbleFlow → Caiioo había renombrado la clase Application y los símbolos JNI en el lado de Kotlin sin renombrar las exportaciones nativas correspondientes, por lo que la app se cerraba al inicio al no poder resolver los símbolos. Se han revertido los renombres; la app vuelve a iniciar correctamente.
- Común: Bucle de reautorización de Google Workspace: Los usuarios estaban atrapados reautorizando Google Workspace aproximadamente cada hora porque su conexión OAuth almacenada no tenía
refresh_token. Seis correcciones conectadas garantizan un token de actualización en cada concesión y lo preservan a través de la sincronización en la nube, para que las conexiones de Google sobrevivan al TTL de 1 hora del token de acceso sin pasar por la pantalla de consentimiento. - Común: Recuperación de "User not found" en OpenRouter: OpenRouter devuelve HTTP 401 "User not found" cuando el registro de usuario subyacente de una sub-clave aprovisionada ha desaparecido pero la entidad de la clave aún existe. Caiioo anteriormente presentaba esto como una extensión muerta que solo se solucionaba cerrando e iniciando sesión. El proveedor ahora se autorepara intercambiando una nueva clave aprovisionada y reintentando la solicitud una vez.
- Común:
insert_componentde Google Docs devolvía errores engañosos: Insertar un componente después de una tabla insertada previamente mostraba "Document not found" porque la tabla insertada nunca se vinculaba a sucomponentName. Las tablas ahora obtienen un rango con nombre en la misma fase de inserción, el resolutor de posición respeta eltabIdque no sea por defecto, y los errores a nivel de app dejan de clasificarse erróneamente como 404. - Común: Los modelos de OpenRouter recién lanzados perdían el enrutamiento ZDR: Cuando un modelo aún no estaba en la base de datos de inteligencia de Caiioo, el registro de respaldo sintético lo marcaba como no compatible con ZDR, incluso cuando los proveedores exclusivos de ZDR realmente lo admitían. El enrutamiento ZDR ahora utiliza el mismo respaldo de lista de proveedores que la ruta regular.
- Común: La API
/v1/runsignoraba los archivos adjuntos en la primera llamada: Cuando el endpoint de la API iniciaba un agente contra un hilo nuevo, la lista de adjuntos en el mensaje del usuario se perdía porque la rama de hilo vacío solo enviaba texto. Los adjuntos ahora fluyen correctamente. - Común: Las apps nativas podían leer ajustes obsoletos justo después de un cambio de modelo: En Android con poca memoria, cambiar el selector de modelo y enviar inmediatamente un mensaje podía permitir que el agente leyera el modelo anterior del disco porque el volcado con debounce de 500 ms aún no se había ejecutado. La ruta de envío ahora fuerza un volcado de estado antes de generar el agente.
- Común: Triaje de errores de testers (PF-260429 / PF-260430): Cinco correcciones — los usuarios de claves gestionadas (nivel gratuito) ahora pueden ingerir documentos a través de OCR de PDF sin escribir su propia clave; macOS fija la zona horaria del sidecar de Node a la del host para que las fechas se resuelvan correctamente bajo el sandbox; las tareas programadas ahora persisten en los shells de iOS/macOS/Tauri (el stub de almacenamiento de la WebView descartaba silenciosamente las escrituras); la herramienta de configuración presenta programaciones únicas y manuales como opciones de primer nivel; y los puntos de llamada de herramientas se recuperan de la autoreparación 401 de OpenRouter de la misma manera que lo hace el ejecutor del agente.
- Común: El modal de actualización deja de mezclar la suscripción de nivel con créditos/BYOK: "Añadir créditos" en realidad abría el portal de suscripción — la etiqueta mentía. El modal ahora se centra solo en la suscripción de nivel; iOS además oculta cualquier superficie de compra de créditos según Apple §3.1.1.
- Web: La sección Eliminar Cuenta se movió al final de la página de cuenta: El bloque destructivo de Eliminar Cuenta solía renderizarse entre tu tarjeta de identidad y la interfaz de suscripción/facturación. Ahora reside en la parte inferior de la página, después de las FAQ. El comportamiento de enlace profundo de iOS hacia la vista de solo eliminación no ha cambiado.
- iOS: Gestionar Plan ahora abre la hoja de suscripción de Apple: Gestionar Plan en iOS anteriormente redirigía a la página de cuenta web para usuarios gratuitos, de prueba, de Stripe y de origen desconocido, donde el OAuth de Google en WKWebView fallaba. Tocar Gestionar Plan en iOS ahora siempre abre la hoja
showManageSubscriptionsde StoreKit de Apple. - iOS: La vista web de eliminación de cuenta se contrae a una página de solo eliminación: Cuando el botón Eliminar Cuenta de iOS abre el sitio web, la página ahora oculta toda la superficie de facturación (suscripción, planes, créditos, portal de Stripe, FAQ) y muestra solo la sección de eliminación, cumpliendo con §3.1.1.
- iOS: Corrección de validación de versión de framework ITMS-90208: El Info.plist del framework onnxruntime ahora se parchea en el momento del archivado para que coincida con el objetivo de despliegue de la app host, de modo que App Store Connect deje de rechazar compilaciones con "framework does not support the minimum OS version specified in the Info.plist".
- Android: Los enlaces externos se ofrecen en una Custom Tab para que el OAuth de Google funcione: Tocar enlaces como "Abrir pebbleflow.ai/account" solía abrirse dentro de la WebView de Android, donde Google bloquea OAuth con
disallowed_useragent(Error 403). Los enlaces externos ahora se enrutan a través del puente nativo hacia una Chrome Custom Tab, en la que Google confía. - Android: Los botones de copiar bajo los mensajes realmente copian: El icono de copiar usaba
navigator.clipboard.writeTextdirectamente, lo cual no hace nada silenciosamente en la WebView de Android cuando la activación del usuario expira a través del límite asíncrono. Copiar ahora se enruta a través del puente del portapapeles nativo.
Versión 0.9.719 (25 de abril de 2026)
Seguridad
- Common: Parche para protobufjs CVE-2026-41242 (CVSS 9.8): Se fijó
protobufjs >= 7.5.5(resuelto a 8.0.1) para cerrar un agujero crítico de ejecución de código arbitrario enRoot.fromJSON. Caiioo no importaprotobufjsdirectamente —es una transitiva deonnxruntime-web— y el riesgo en la práctica era bajo porque solo alimentamos modelos empaquetados, no esquemas suministrados por el usuario. Se parcheó de todos modos porque la solución es trivial. - Common: @xmldom/xmldom — 4 CVE de alta severidad parcheados: Se fijó
@xmldom/xmldom >= 0.9.10. El análisis de XML se utiliza en los flujos de revisión de DOCX/XLSX y en varias rutas de código de extensiones. - Server: undici — 3 CVE de alta severidad parcheados: Se fijó
undici >= 7.24.0encloud/relay. Afecta únicamente al cliente HTTP del servidor relay. - Desktop: rustls-webpki + quinn-proto — 2 CVE de alta severidad parcheados: Se actualizaron estas dependencias de Rust en Tauri. Afecta a las compilaciones de escritorio para Windows + Linux que pasan por el shell de Tauri.
Nuevas Funcionalidades
- Common: Generación de video (Pro): Genere o anime videos cortos con Google Veo 3.1, OpenAI Sora 2 Pro y ByteDance Seedance a través de OpenRouter. La herramienta selecciona duraciones y resoluciones válidas por modelo, realiza consultas hasta que el trabajo se completa y guarda el resultado como un archivo adjunto en el hilo.
- Common: Generación de música (Pro): Genere canciones y clips instrumentales con Google Lyria 3 Pro Preview a través de OpenRouter. La salida se guarda como un adjunto de audio que se reproduce de forma integrada.
- Common: Catálogo dinámico de modelos de video: El generador de video obtiene la lista actual de modelos de OpenRouter con capacidad de video en tiempo de ejecución, por lo que aparecen nuevos proveedores y modelos sin necesidad de una actualización de Caiioo. Una instantánea empaquetada mantiene el funcionamiento sin conexión.
- Common: Catálogo dinámico de modelos de música: Lo mismo para la generación de música —la herramienta detecta nuevos modelos de música a medida que OpenRouter los publica, con respaldo para modo sin conexión.
- Common: OAuth personalizado en Pro: "Traiga su propia autenticación" (BYOK) —el asistente de Google Workspace, el asistente de Microsoft 365 y el flujo genérico "Agregar proveedor personalizado"— ahora es visible para todos los usuarios de Pro, Platform, Teams y Enterprise en Settings → Custom OAuth. Anteriormente, la pestaña y los botones de agregar estaban ocultos tras indicadores solo para evaluadores, por lo que los usuarios de pago no podían acceder a la configuración de BYOA.
- Common: Física + Análisis Estructural (Pro): La herramienta de simulación física (movimiento de proyectiles, colisiones, energía cinética/potencial, momento, fuerza, impulso, velocidad al objetivo) y análisis estructural (carga de vigas, pandeo de columnas, propiedades de materiales) ya está disponible en Pro junto con las demás herramientas creativas y de utilidad.
- Common: Seeing-Eye Dog — respaldo de visión para LLM de solo texto: Los modelos de solo texto como DeepSeek V4 Pro, Kimi K2.6, MiMo V2.5 Pro y los modelos locales de Ollama ahora pueden manejar archivos adjuntos de imagen enrutándolos a través de un modelo de visión económico configurado (por defecto: Gemini 3.1 Flash Lite). El subtitulado automático se activa al momento de construir el mensaje y se almacena en caché por adjunto para que los turnos posteriores no vuelvan a pagar; una herramienta dedicada
vision({action: "inspect"})otorga al modelo acceso de seguimiento específico. Settings → Tools → Vision Fallback Model permite elegir el asistente. - Common: Cambios controlados a nivel de celda en XLSX: Los artefactos de hojas de cálculo ahora admiten la misma experiencia de usuario de revisión que DOCX. Las propuestas de la AI mediante
propose_change(editMode: 'xlsx_cell')producen cambios controlados localizados en celdas anclados porcellRef+sheetName; las ediciones escritas por el usuario en modo de control de cambios generan diferencias a nivel de celda; las celdas con cambios pendientes renderizan<del>antiguo</del><ins>nuevo</ins>de forma integrada; los botones de siguiente/anterior/aceptar/rechazar de la barra de herramientas existente funcionan en los cambios de celda; las ediciones concurrentes de la AI y del usuario se fusionan celda por celda, prevaleciendo el usuario en caso de conflictos en la misma celda. - Common: Seguimiento de costos para generadores de video y música: Los videos generados (vía OpenRouter
/api/v1/videos) y la música (víachat-completions) ahora suman su costo a los totales del hilo al igual que la generación de imágenes, con nuevas filas de desglosevideo_gen_costymusic_gen_costen el menú desplegable de costos del panel lateral.
Mejoras
- Common: Estabilidad de la serie GPT-5: gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro y gpt-5.3-codex de OpenAI ya no producen respuestas vacías silenciosas en conversaciones de agentes con uso intensivo de herramientas. Una interacción en el esquema de herramientas de función estaba causando que el backend de OpenAI terminara las transmisiones sin producir ninguna salida; Caiioo ahora serializa las herramientas en el formato que estos modelos requieren.
- Common: Mejor comportamiento en conversaciones largas en GPT-5.4+: Las conversaciones de múltiples turnos con gpt-5.4, gpt-5.4-pro y gpt-5.3-codex ya no se detienen prematuramente en secuencias largas de llamadas a herramientas —el marcador de fase que OpenAI usa para distinguir comentarios intermedios de respuestas finales ahora se preserva entre turnos.
- Common: Razonamiento de GPT-5.x visible en el panel de pensamiento: gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro y gpt-5.3-codex ahora transmiten su resumen de razonamiento al panel de pensamiento del chat mientras piensan, igualando el comportamiento de Gemini. Anteriormente, el panel de pensamiento permanecía vacío para estos modelos a pesar de que OpenRouter transmitía el texto de razonamiento.
- Common: Recuperación transparente de interrupciones temporales de proveedores: Cuando OpenRouter enruta una solicitud a un proveedor que devuelve un error 5xx transitorio antes de transmitir cualquier contenido, Caiioo reintenta silenciosamente con un proveedor diferente en lugar de mostrar una respuesta vacía.
- Common: Errores más claros cuando falla la transmisión del modelo: Las caídas del lado del proveedor, los rechazos por filtros de contenido y otros fallos a mitad de la transmisión ahora se muestran con un mensaje de error específico en lugar de que la conversación simplemente se "detenga" sin explicación.
- Common: Los videos y la música generados se renderizan de forma integrada: Los videos y la música generados ahora aparecen en la conversación como las imágenes generadas —un reproductor de video o audio aparece sobre la respuesta final con una pequeña insignia que indica qué modelo lo produjo, en lugar de estar oculto dentro de la sección de herramientas colapsada.
- Common: Selector de modelo predeterminado para herramientas de video y música: Settings → Tools ahora incluye un menú desplegable de Modelo Predeterminado para los generadores de video y música, reflejando el selector existente para el generador de imágenes. El agente utiliza el modelo seleccionado por defecto; aún puede anularse por solicitud mencionando un modelo diferente.
- Common: Visualización del estado de indexación de Personal Intuition: El panel de configuración de Personalization ahora muestra una línea en vivo "Indexed: N threads · M chunks · K tokens · last indexed Xm ago" para que pueda confirmar que el indexador de memoria está haciendo su trabajo. El último resumen de relleno también permanece visible después de que se completa la ejecución en lugar de desaparecer.
- iOS: Embeddings nativos en el dispositivo (más rápidos, menos memoria): La inferencia de Multilingual-e5-small ahora se ejecuta en el proceso host de iOS a través de
onnxruntime-objcde Apple en lugar de dentro de WKWebView. Esto resuelve un límite de memoria por proceso que cerraba la WebView ~7 segundos después de la carga del modelo (el error de cierre tras el inicio de sesión). Después de la primera codificación del catálogo de herramientas, las llamadas posteriores de selección de herramientas acceden a una caché en memoria por texto y se completan en ~10 ms en lugar de ~5 s. La refactorización de la canalización compartida también evita que Personal Intuition y la selección de herramientas en el dispositivo carguen cada uno su propia copia de ~115 MB del modelo. - Common: Personal Intuition y la selección de herramientas en el dispositivo comparten una canalización e5: Ambas funciones instanciaban previamente su propio cargador de multilingual-e5-small (~115 MB cada uno, ~230 MB en total en el renderizador). Ahora delegan en una única canalización compartida que elimina duplicados en cargas concurrentes, reduciendo a la mitad el costo de inicio en frío.
Corrección de Errores
- Common: Las cookies de sesión del navegador ya no se filtran en las llamadas a la API: Si había visitado openrouter.ai en una pestaña del navegador, la extensión adjuntaba involuntariamente su sesión de navegador de OpenRouter (cookies de Clerk / Stripe / analíticas) a cada llamada a la API. Las llamadas a la API ahora están estrictamente autenticadas mediante Bearer.
- Common: Las respuestas de GPT-5.4 ya no aparecen dos veces: Se corrigió un error donde las respuestas de gpt-5.4, gpt-5.4-pro y gpt-5.3-codex mostraban el mismo texto dos veces seguidas —la carga útil de la respuesta final se acumulaba junto con el flujo de tokens que ya la había renderizado.
- Common: El selector de modelos se actualiza tras la recarga: La lista de modelos ahora se invalida en las actualizaciones de versión y respeta un TTL corto en memoria, por lo que los modelos de OpenRouter recién lanzados aparecen después de una recarga en lugar de quedar ocultos tras una caché obsoleta. Los service workers de larga duración ya no mantienen un catálogo congelado.
- Common: Los enlaces cortos de medios generados abren el reproductor: Cuando un modelo escribe un enlace corto como
[Listen](audio-…)después de generar audio/imagen/video, al hacer clic ahora se abre el reproductor de slate en lugar de fallar como una URL externa rota. La misma corrección se aplica a los enlaces de imagen y video. - Common: Los medios generados como incrustaciones de imagen en markdown se renderizaban rotos: Cuando el modelo escribía un adjunto de video o audio como
en lugar de[Video 1](video-…), se renderizaba como una etiqueta<img>rota en lugar de abrir el reproductor. El signo!inicial ahora se elimina para que el enlace abra el visor de slate. - Extension: Callejón sin salida "Permiso de ubicación denegado" en el panel lateral: Se corrigió una regresión donde cada solicitud de ubicación del panel lateral devolvía "Permiso de ubicación denegado. Por favor, permita el acceso a la ubicación en la configuración del navegador", independientemente de lo que el usuario seleccionara. Un intento de enrutar a través del documento offscreen generaba
PERMISSION_DENIEDinstantáneamente porque el contexto offscreen no puede mostrar un aviso de permiso y el manifiesto no declarageolocation. El panel lateral ahora utiliza la cadena original de script de contenido y luego geolocalización por IP que funcionaba anteriormente. - Common: La reconstrucción completa de Personal Intuition dejaba recuentos indexados obsoletos: Se corrigió que el relleno de la reconstrucción completa omitiera la actualización del índice por hilo, por lo que Settings → Personalization mostraba totales inflados previos a la reconstrucción después de una reconstrucción. Los hilos escaneados por la reconstrucción completa pero no indexados previamente ya no son invisibles para la recuperación.
- iOS: Bucle de cierre de WKWebView tras el inicio de sesión: Tres correcciones convergentes para el error de cierre tras el inicio de sesión. (1) Los embeddings nativos e5 ahora se ejecutan fragmentados en lotes de 8 con el área de memoria de ORT configurada para reducirse entre ejecuciones —el conjunto de trabajo máximo se mantiene por debajo de ~100 MB en lugar de dispararse a ~3 GB y activar el cierre por memoria por proceso de iOS. (2) El recuperador en el dispositivo ahora se activa durante
requestIdleCallbacken lugar de integrarse en el arranque, por lo que ya no compite con la sincronización de licencias, restauración de identidad, renderizado de UI e inicio de sincronización en la nube. (3) El recuperador en el dispositivo ahora se vuelve a aprovisionar al cambiar de identidad o nivel, por lo que las instalaciones nuevas ya no recurren silenciosamente a asistentes en la nube porque el nivel no estaba definido en el primer registro. - iOS: Errores 403 falsos de "recorrido de ruta bloqueado": Se corrigió que
LocalFileSchemeHandlermarcara erróneamente cada 404 como un intento de recorrido de ruta porqueNSString.standardizingPathsolo resuelve/var→/private/varpara archivos que existen en el disco. Las rutas legítimas a recursos inexistentes (el paquete de iOS excluye*.wasm, además de rutas de la API de chrome-extension comoapi/active-tab-context) devolvían 403 en lugar de 404, rompiendo el respaldo de pre-obtención de wasm de transformers.js. Se reemplazó con una verificación de../ NUL basada en cadenas que coincide con el controlador de Android. - Common: Las imágenes incrustadas en PDF rompían los modelos de solo texto: Al enviar un PDF con imágenes incrustadas a un modelo de OpenRouter de solo texto (DeepSeek V4 Pro, Kimi K2.6, etc.) se producía el error "No se encontraron endpoints que admitan entrada de imágenes" —la advertencia que el nuevo enrutamiento Seeing-Eye Dog debía eliminar. La ruta de entrega de PDF ahora respeta el mismo indicador
supportsVisionpor modelo que la entrega de bloques de imagen ya respetaba, por lo que los modelos de solo texto reciben un PDF de solo texto y el agente puede generar un subagente de visión si es necesario. - Common: El interruptor de nivel del bloqueador de anuncios no surtía efecto: Cambiar el nivel del bloqueador de anuncios (Desactivado / Estándar / Agresivo) solo cambiaba el valor persistido mientras que las reglas DNR activas + el conjunto de reglas estáticas permanecían en efecto hasta que el service worker se reiniciaba —por lo que después de cambiar a Desactivado, sitios como ads.google.com seguían bloqueados. El escuchador de almacenamiento ahora observa el cubo
globalSharedSettingsdonde realmente se escribe la configuración, y el indicador heredadoadBlockerEnabledse enruta a través del mismo cubo. - Extension: Las imágenes de gran tamaño se descartaban silenciosamente: Cuando un adjunto de imagen excedía el límite de la API, el service worker de la extensión no tenía una implementación de compresión registrada (solo estaba la del servidor respaldada por sharp) —por lo que la defensa en
pushImageBlockcapturaba la excepción y descartaba la imagen por completo. El SW ahora sondea las dimensiones naturales a través decreateImageBitmapy enruta la codificación a través del documento offscreen existente, de modo que los llamadores del contexto de la extensión reciben la imagen comprimida en lugar de un marcador de posición descartado. - Common: Imágenes generadas y capturas de pantalla rechazadas por los proveedores: Anthropic limita las imágenes base64 a 5 MB; otros proveedores tienen límites similares. Las imágenes generadas de FLUX / Gemini / Seedream y las capturas de pantalla grandes se pasaban a tamaño completo, produciendo errores 4xx que abortaban todo el turno del agente. Tres capas de defensa: el generador de imágenes comprime la salida antes del almacenamiento; un nuevo asistente
pushImageBlockenruta cada emisión deimage_urla través de comprimir o descartar; y tanto la reconstrucción de capturas de pantalla como la inyección de capturas en vivo pasan por el mismo asistente. Límite conservador de 4 MB que funciona en todos los proveedores.
Versión 0.9.718 (22 de abril de 2026)
Nuevas Funcionalidades
- Common: Personal Intuition — memoria asociativa entre hilos: Caiioo recuerda discretamente lo que has hablado anteriormente, a través de cada conversación, no solo en la actual. Los recuerdos relevantes acuden a la mente mientras chateas; tu agente puede usar uno directamente o simplemente dejar que matice la respuesta. Como cuando un aroma te recuerda a un lugar. Encuéntralo en Personalization → Personal Intuition; desactivado por defecto. Incluye Full-rebuild e Incremental backfill para que puedas indexar tus hilos existentes, y las conversaciones privadas nunca forman parte del almacenamiento entre hilos.
- Common: Respaldo y restauración de Personal Intuition: Puedes realizar una instantánea de todo el corpus de memoria en un archivo JSON en Backup & Restore → Personal Intuition, y restaurarlo más tarde si algo sale mal o si deseas moverlo a otro dispositivo. Las conversaciones privadas nunca se incluyen.
- Common: Instant Tool Chooser por defecto para todos los niveles: El selector semántico de herramientas ahora se ejecuta localmente en cada dispositivo, en todos los niveles, incluido el gratuito. Elige las herramientas adecuadas para cada turno en ~10 ms, totalmente en tu dispositivo. La interfaz del selector en Settings → Tools aclara la elección como "Instant Tool Chooser" frente a "Quick Tasks LLM" (que utiliza cualquier modelo que hayas marcado con el rayo en el selector de modelos).
- iOS / Android: Instant Tool Chooser en las aplicaciones nativas: El mismo selector de herramientas on-device ahora está disponible dentro de la WebView de las aplicaciones de iOS y Android, no solo en la extensión de Chrome y la versión de escritorio.
Mejoras
- Common: El sandbox de Slate permite CDNs de scripts HTTPS: Los artefactos HTML de Slate ahora pueden cargar librerías comunes como Chart.js o D3 desde CDNs HTTPS de buena reputación (jsdelivr, unpkg, etc.). La obtención de datos sigue bloqueada al mismo origen, así que utiliza
bind_datapara canalizar los datos de los archivos adjuntos hacia un Slate. - Common: Progreso de Personal Intuition más claro: El backfill ahora muestra el progreso por hilo en el panel de configuración (por ejemplo, "47/75 hilos · 2,134 fragmentos") mientras se ejecuta, en lugar de permanecer en silencio hasta su finalización.
- Common: Selección de herramientas más rápida tras la indexación de memoria: La indexación de un corpus de memoria grande ya no expulsa la caché del catálogo de herramientas en el recuperador on-device; la siguiente llamada a una herramienta se mantiene lista en lugar de pagar un coste de re-codificación.
Corrección de Errores
- Common: Los sub-agentes concurrentes generaban errores falsos de actualización de nivel: Se corrigió una condición de carrera donde dos sub-agentes ejecutándose en paralelo podían sobrescribir el contexto de hilo activo del otro, provocando que las acciones restringidas a Pro (update_slate, etc.) fueran rechazadas para el sub-agente equivocado. La aplicación del nivel de suscripción ahora está vinculada al hilo específico de la llamada de despacho.
- Common: Las vinculaciones de datos CSV en Slate rompían
forEach: Se corrigió el error por el cual los datos vinculados a CSV llegaban al sandbox como un objeto no iterable;data.forEach(...)dentro del JavaScript del sandbox ahora funciona como se espera.
Versión 0.9.717 (17 de abril de 2026)
Nuevas Funcionalidades
- Common: Nivel Pro Unificado en todas las Apps: Pro es ahora una suscripción única de $9/mes que desbloquea todas las aplicaciones de Caiioo — Chrome, Desktop y Mobile — en lugar de paquetes separados por aplicación. Platform ($14/mes) se reposiciona como "Pro + infraestructura" (servidor local, vista previa de acceso a API, Messaging).
- Common: Nivel Pro Mobile: Un plan Pro exclusivo para móviles está disponible por $2.99/mes, vendido directamente en la App Store y Play Store. La compra dentro de la aplicación es en sí misma el derecho de acceso — no se requiere una licencia por separado.
- Common: Herramienta Ask-User para Human-in-the-Loop: El agente ahora puede pausar a mitad de la ejecución y mostrar un diálogo de decisión de cuatro vías (aprobar, aprobar con notas, rechazar, rechazar con notas). Sus notas regresan al modelo como guía en lenguaje natural que anula el plan propuesto — no se inicia un nuevo ciclo, el agente continúa en el lugar.
- Common: Búsqueda de Guía In-App: Busque en la guía del usuario directamente desde el menú Document. Los resultados vinculan profundamente a caiioo.ai/guide, preservando el flujo de redirección existente.
- iOS: Alternancia de Paywall Mensual/Anual: La hoja de suscripción de iOS ahora permite cambiar entre facturación Mensual y Anual antes de la compra.
- Desktop: Actualizaciones Automáticas en Windows y Linux: La aplicación de escritorio Tauri ahora se distribuye con el actualizador habilitado, por lo que las versiones de Windows y Linux pueden recibir actualizaciones en el lugar en lugar de requerir una reinstalación manual.
- Web: Búsqueda por Pestañas en Guía y Blog: Los diseños de la guía y el blog del sitio de marketing ahora incluyen una barra de búsqueda con cambio de alcance por pestañas — las coincidencias en el título tienen mayor prioridad que las del cuerpo, y la pestaña activa cambia automáticamente a donde se encuentran los resultados.
- Web: Página de Instalación Dedicada para Linux: La página de instalación dirige a los usuarios de Linux a
/install/linux, que presenta opciones de AppImage,.deby.rpmcon comandos específicos por distribución. - Web: Rutas de Descarga Estables:
/download/macos,/download/linuxy/download/windowsson ahora URLs estables respaldadas por edge-workers que siempre resuelven a la última versión — no se requiere reconstruir el sitio web por cada lanzamiento.
Mejoras
- Common: Gestión de Tickets de Soporte In-App: Las solicitudes de soporte ahora se canalizan a través del flujo de tickets dentro de la aplicación como ruta principal, con mensajes de error de créditos más claros que le indican el lugar correcto cuando algo sale mal.
- Common: Re-autenticación de Google OAuth más Inteligente: Las herramientas de Google ahora verifican los alcances (scopes) realmente otorgados por Google y activan un aviso de re-autorización justo a tiempo cuando un error 403 indica que falta un alcance, en lugar de fallar silenciosamente.
- Common: Alcance Full Drive para Escrituras en Google: Las acciones de escritura en Google Drive ahora solicitan el alcance completo de la unidad para que las ediciones en documentos que usted no creó tengan éxito en lugar de encontrar errores de permisos.
- Common: Descripciones de Modelos del Generador de Imágenes: La herramienta de generación de imágenes muestra una descripción para cada modelo disponible, facilitando la elección del adecuado para la tarea.
- Common: Mensajes de Artefactos Slate más Precisos: Cuando una herramienta crea o actualiza un artefacto Slate, el modelo ya no afirma que el artefacto se "muestra en el editor" — la redacción ahora refleja lo que sucede realmente.
- Common: Mejor Selección Dinámica de Herramientas desde Pestañas: La sugerencia de contexto de pestaña ahora emite IDs de herramientas, para que el selector dinámico de herramientas pueda aplicar reglas de selección basadas en el contexto que dependen de qué herramientas están disponibles.
- Common: Costos de Voz Atribuidos a Threads: El uso de TTS en streaming (ElevenLabs, Resemble) y STT (ElevenLabs Scribe) ahora se acumula como costo de voz en la conversación donde ocurrió, coincidiendo con la ruta de síntesis de un solo paso existente.
- Extension: El Subtítulo de Inicio de Sesión Enfatiza Agentes Locales: Pequeña actualización de texto en la pantalla de inicio de sesión.
Corrección de Errores
- Desktop: Selector de Archivos en Linux Restaurado: Se corrigió el fallo del selector de archivos en Linux dentro de la aplicación de escritorio Tauri.
- Desktop: Reporte de Versión Incorrecto: Se corrigió que la aplicación de escritorio Tauri reportara una cadena de versión incorrecta en la interfaz de usuario y la telemetría.
- Desktop: Audio de Linux más Silencioso y Errores más Claros: Se suprimió el ruido de los registros de PipeWire en Linux, se mostraron los errores de OpenRouter en lugar de ocultarlos, se restauró la ruta de lectura de la alternancia de API y se corrigió un banner de paridad incorrecto.
- Common: La Extracción del Cuerpo de Gmail Perdía Enlaces: Se invirtió la precedencia de extracción de Gmail para intentar primero el markdown que preserva enlaces, y luego recurrir a texto plano solo cuando la salida de markdown está vacía — los correos electrónicos ya no pierden enlaces en el caso común.
- Common: Los Ajustes de la Public API no Persistían: Se corrigió que el interruptor de Public API y el token de acceso no se guardaran en algunas configuraciones, y se aseguró que estos ajustes permanezcan estrictamente locales en lugar de sincronizarse con la nube.
- Common: Archivar y Renombrar se Sentían Lentos: Eliminar, archivar, desarchivar y renombrar ahora actualizan la interfaz de usuario de forma optimista para que la lista refleje el cambio inmediatamente en lugar de esperar un viaje de ida y vuelta al servidor.
- Common: Las Eliminaciones de Archivo no se Sincronizaban: Se corrigió que las eliminaciones de archivos se aplicaran directamente al almacenamiento, omitiendo la ruta del protocolo — ahora se propagan a través de los clientes como cualquier otra acción de thread.
- Common: La Agenda Mostraba Falsos "Faltan Alcances": Se corrigió que el widget de recordatorios/agenda leyera un perfil de contexto de herramienta desactualizado justo después de otorgar alcances de Google Calendar, por lo que marcaba alcances faltantes mientras las herramientas funcionaban bien. La interfaz de usuario ahora lee el perfil actualizado, y una actualización ejecuta automáticamente el flujo de consentimiento de alcances incrementales de forma secuencial en cualquier cuenta de Google conectada que aún lo necesite — no es necesario abrir el diálogo de sincronización para buscar "otorgar acceso".
- Common: Llamadas a Herramientas de Google Rechazadas con "Unknown name exclusiveMinimum": Se corrigió que Gemini rechazara llamadas a herramientas cuyos esquemas de parámetros usaban límites numéricos
exclusiveMinimum/exclusiveMaximum— estos ahora se eliminan antes de enviarlos al subconjunto restringido de OpenAPI de Google. - Common: Servidores MCP Remotos sin DCR Fallaban al Conectar: Se corrigió la adición de servidores MCP remotos que no admiten Dynamic Client Registration (ej. Slack): el cliente ahora respeta los metadatos de recursos protegidos de RFC 9728, sigue a
authorization_serversal host AS cuando difiere del host del recurso, y deja de fabricar un endpoint/registerque no existe. - Server: Usuarios de Nivel Tester Rechazados por Endpoints Restringidos: Se corrigió que los endpoints de organizaciones, hub, admin y claves provisionadas rechazaran a usuarios cuyo nivel efectivo (por licencias) era superior al nivel desactualizado capturado en su token de autenticación. Los endpoints restringidos ahora evalúan el nivel efectivo de manera consistente con
/api/auth/me. - Extension: Bucle de Ping-Pong de Sincronización de Identidad: Se corrigieron las identidades en conflicto entre la extensión y el servidor de retransmisión que entraban en un bucle infinito en
IDENTITY_SYNC. La extensión ahora confirma una vez contra el mismo remoto en conflicto, advierte que debe cerrar sesión en un lado para resolverlo, y se reinicia al desconectarse / coincidir / adopción remota. - Common: Gemini Flash TTS no Podía Seleccionarse ni Configurarse: Se corrigió que Gemini Flash TTS (voz) fuera inutilizable de extremo a extremo — seleccionarlo se revertía al cerrar los ajustes, y el campo de la clave API parecía no aceptar escritura. El proveedor es ahora una opción de TTS de primer nivel: la selección persiste, la clave API + el selector de voz se guardan correctamente, y la síntesis utiliza un endpoint de streaming SSE para que la reproducción de audio pueda comenzar antes de que termine de generarse la locución completa.
- iOS: La Interfaz de Nuevo Thread no Cambiaba: Se corrigió que la aplicación de iOS no cambiara la vista activa a un thread recién creado, y se corrigió un ReferenceError de
modelNamerelacionado que podía bloquear el compositor. - iOS: Bloqueo al Iniciar en el Hook de Almacenamiento Opcional: Se corrigió un bloqueo en iOS cuando
storage.primeSettingsCacheno estaba disponible durante el inicio — la llamada ahora está protegida. - Common: Discrepancias en la Auditoría de Niveles tras el Cambio de Precios: Se corrigieron seis inconsistencias de precios y características detectadas por la auditoría de niveles, de modo que las restricciones de derechos, los avisos de actualización y los flags de características ahora coinciden en la extensión, el sitio web y las aplicaciones móviles.
Cumplimiento de la App Store de iOS
- iOS: CTAs de Registro Externo Ocultos en el Onboarding: El onboarding ya no muestra llamadas a la acción que dirijan a los usuarios fuera del dispositivo para la creación de cuentas o actualizaciones de pago.
- iOS: Interfaz de Compra de Créditos Oculta: Las superficies de compra de créditos están ocultas en iOS según las reglas §3.1.1 de Apple; las suscripciones se canalizan a través de StoreKit en su lugar.
- iOS: Redacción de Soporte y Errores de Crédito Actualizada: La página de /support y los mensajes de error de créditos han sido redactados nuevamente en iOS para cumplir con las directrices de Apple sobre referencias a compras externas.
Version 0.9.716 (April 12, 2026)
New Features
- Common: Gemini 3.1 Flash TTS: Nueva opción de salida de voz impulsada por Gemini 3.1 Flash TTS de Google. 30 voces predefinidas, más de 70 idiomas y etiquetas de audio integradas como
[whispers]y[sighs]para una síntesis expresiva. Trae tu propia API key de Gemini; obtén una gratis en aistudio.google.com. El audio incluye marca de agua con SynthID. - Common: Voice Cost in Conversation Total: El uso de las API de texto a voz y voz a texto (Gemini, ElevenLabs, Resemble) ahora se integra en el resumen de costos por hilo junto con los costos de chat, generación de imágenes, helpers y OCR; para que el número que veas sea el costo real.
- Common: SQL Database Tool: Adjunta bases de datos SQLite a las conversaciones y realiza consultas con SQL. Los resultados pueden renderizarse como tableros en vivo en artefactos de Slate.
- Common: Calendar Invitations and Google Meet: La creación de eventos de calendario ahora envía correos electrónicos de invitación a los asistentes y puede añadir automáticamente un enlace de video de Google Meet.
- Common: Per-Tool Provider Routing: Enruta herramientas individuales (generación de imágenes, búsqueda, OCR de PDF, etc.) a proveedores específicos a través de Settings, en lugar de que todo pase por el modelo predeterminado.
- Common: Conversation Sharing: Comparte conversaciones como Markdown o texto plano.
- Common: 14-Day Platform Trial: Inicia una prueba de 14 días del nivel Platform desde la interfaz de la extensión o la página de cuenta del sitio web. Los suscriptores Pro también son elegibles.
- Common: ZDR Quick-Filter in Model Picker: Nuevo botón en el menú desplegable del selector de modelos para filtrar rápidamente los modelos con zero-data-retention.
- Common: Simplified Settings: Settings ahora se abre en una vista Simple optimizada por defecto, mostrando solo lo esencial. Cambia al modo Advanced en cualquier momento para ver todo.
- Common: Free Google Gemini Access: Trae tu propia clave de Google AI Studio para usar Gemini 2.5 Flash de forma gratuita; el nivel gratuito de Google ahora está disponible para todos los usuarios, sin necesidad de un plan de pago.
- Common: Baseten Self-Hosted Models: Conecta tus propios despliegues de Baseten para usar modelos auto-alojados directamente en caiioo.
- iOS: WhisperKit On-Device Speech-to-Text: El dictado ahora se ejecuta completamente en el dispositivo a través de WhisperKit; el audio nunca sale del teléfono.
- Android: On-Device Whisper STT: El dictado de voz a texto a través de whisper.cpp se ejecuta completamente en el dispositivo en Android con el flujo de permisos de micrófono.
- Android: GPU-Accelerated Moonshine STT: En dispositivos Android con capacidad de GPU, el dictado puede ejecutarse en Moonshine con inferencia de menos de un segundo. Solo en inglés; whisper.cpp sigue siendo la opción multilingüe de respaldo.
- Web: Sign in with Apple on Account & Hub Pages: Apple Sign-In ahora está disponible en las páginas de cuenta y hub del sitio web.
Improvements
- Common: Better PDF Export: Exportar un PDF desde Slate ahora genera un archivo PDF real en lugar de abrir el diálogo de impresión, para que obtengas un documento limpio cada vez.
- Common: Google Slides Full Text: Solicitar el texto de las diapositivas sin especificar una página ahora devuelve el texto de todas las diapositivas de la presentación.
- Common: Smarter Web Search: Los resultados de búsqueda de Google ahora se extraen con una mejor estructura, capturando títulos, fragmentos y enlaces de manera más confiable tras los recientes cambios de diseño de Google.
- Common: Kokoro Text-to-Speech on All Platforms: La opción de voz Kokoro ahora aparece en iOS, macOS y Android; anteriormente estaba oculta en las aplicaciones nativas.
- Common: Cleaner Credit Balance Display: El saldo de la cuenta para configuraciones prepago y de "trae tu propia clave" ahora muestra tu saldo real sin el confuso marco de "Limit".
- Common: Higher-Fidelity PDF to Word Conversion: La exportación de PDF→DOCX ahora utiliza una vista de Document dedicada en Slate, produciendo archivos de Word que preservan fielmente el diseño y la estructura del PDF de origen.
- Web: Quieter Account and Auth Pages: Google Analytics y el banner de consentimiento de cookies se suprimen en las páginas de cuenta y autenticación para un flujo de inicio de sesión más limpio.
Bug Fixes
- Common: Settings Search Didn't Navigate: Se corrigió el error por el cual el menú desplegable de búsqueda de configuración y los enlaces profundos no lograban saltar a varias secciones (API Access, Private Sync, Backup & Restore, Voice y otras); la categoría de destino permanecía colapsada y no se desplazaba a la vista.
- Common: OAuth Prompts in Sub-Agents: Se corrigió el error por el cual las solicitudes de autorización OAuth y de actualización de nivel se descartaban silenciosamente cuando eran activadas por un sub-agente, lo que interrumpía los flujos de conexión a mitad de la ejecución.
- Common: Ollama Model Not Saved After Onboarding: Se corrigió el error por el cual el modelo de Ollama seleccionado durante el onboarding no persistía después.
- Common: UI Chunks Failed to Load During Rate Limiting: Se corrigió el error por el cual los activos estáticos de la interfaz de usuario sufrían limitación de tasa junto con las solicitudes de la API, causando pantallas en blanco o paneles faltantes hasta refrescar.
- Common: Composer-Preprocessed Attachment Metadata Lost: Se corrigió la pérdida de metadatos de archivos adjuntos en el servidor para documentos preprocesados en el composer antes de ser enviados al modelo.
- Common: Free Time Counted Attended Events as Busy: Se corrigió el cálculo de tiempo libre de la agenda que te marcaba como ocupado durante eventos a los que solo asistías; ahora solo se cuentan los eventos en tu propio calendario.
- Common: Google Search Results Broken: Se corrigió la búsqueda web que devolvía resultados vacíos después de que Google cambiara el diseño de su página de búsqueda.
- Desktop: Windows/Linux Login Out of Sync with Other Platforms: Se corrigió el flujo de inicio de sesión de escritorio de Tauri que divergía de Chrome/macOS/iOS, incluyendo la detección incorrecta de niveles y la imposibilidad de volver a iniciar sesión tras cerrar la sesión.
- Desktop: Public API Blocked the Desktop UI: Se corrigió el error por el cual la propia interfaz de la aplicación de escritorio era bloqueada por la autenticación de la API cuando la configuración de Public API estaba habilitada.
- Common: Google Docs OAuth Errors Hidden: Se corrigió el error por el cual las operaciones de Google Docs fallaban silenciosamente cuando la autenticación expiraba en lugar de mostrar un error claro.
- Common: Settings Panel Crash: Se corrigió el cierre inesperado del panel de configuración al restaurar una API key aprovisionada.
- Common: Google Drive Sync Duplicating Documents: Se corrigió la duplicación de Google Docs en cada ejecución de sincronización en lugar de actualizarse en el mismo lugar.
- Common: Google Drive Sync Inline Code Lost: Se corrigió la pérdida del formato de código en línea al sincronizar documentos con Google Docs.
- Common: Gemini Thinking Extraction: Se corrigió el error por el cual el contenido de pensamiento/razonamiento no se capturaba correctamente de las respuestas del modelo Gemini.
- Common: Profile Switch Stale Data: Se corrigió el error por el cual al cambiar entre perfiles a veces se mostraban conversaciones del perfil anterior hasta realizar un refresco manual.
- Common: Task Scheduler "Method Not Found" Error: Se corrigió el error por el cual las tareas programadas lanzaban errores cada 60 segundos en ciertas configuraciones.
- Common: Text Insertion Newlines in Google Docs: Se corrigió la aparición literal de
en las inserciones de texto en lugar de saltos de línea reales. - Common: Google Account Hint on Tools: Se corrigió el error por el cual las herramientas de Google a veces utilizaban la cuenta de Google incorrecta para las llamadas a la API.
- Common: Settings and Thread Import Round-Trip: Se corrigió el error por el cual las exportaciones de configuraciones e hilos no se importaban correctamente de vuelta.
- Common: Sub-Agent Token Usage: Se corrigió el error por el cual el uso de tokens del sub-agente no se contabilizaba en la conversación principal.
- Common: Messaging Bridge Reply During Retry: Se corrigió el fallo en las respuestas del puente de mensajería cuando el asistente reintentaba una respuesta.
- Common: Slate Redline Positioning: Se corrigió el posicionamiento incorrecto de las eliminaciones de redline cuando había markdown presente.
- Common: Browser Connection Survives Sleep/Wake: Se corrigieron los errores de "No browser connected" después de que la computadora entrara en modo de suspensión o permaneciera inactiva por largos períodos.
- Common: Scheduled Tasks Survive Service Worker Sleep: Se corrigió el error por el cual las tareas recurrentes se detenían tras largos períodos de inactividad.
- macOS: Safari Google Search Failures: Se corrigió el error por el cual la búsqueda de Google no funcionaba en la extensión de Safari en macOS.
- iOS: Mobile App Access: Se corrigió el error por el cual la aplicación de iOS requería incorrectamente un plan de pago; la aplicación móvil ahora está disponible para todos los usuarios.
Versión 0.9.715 (3 de abril de 2026)
Nuevas Funciones
- Common: Sistema de Entrega Hub: Las definiciones de herramientas de origen, las configuraciones de modo y el catálogo MCP ahora están preparados para ser entregados desde el hub en la nube en lugar de estar codificados en el paquete, con almacenamiento en caché local y respaldo sin conexión en preparación para el lanzamiento de la comunidad.
- Common: Modo de Pestaña Única para Herramientas de Navegador: La nueva política de pestañas del navegador por modo reutiliza una sola pestaña para toda la navegación en una conversación, evitando la acumulación de pestañas durante flujos de trabajo con mensajería intensiva como WhatsApp.
- Common: Cargas Binarias en Integración de API: La herramienta api_integration ahora admite la carga de archivos binarios y la carga directa de archivos locales a través de URLs firmadas previamente, en lugar de convertir siempre los cuerpos de las solicitudes a cadenas JSON.
- Common: Gestión de Credenciales mediante Herramienta: Guarde, enumere y elimine credenciales de API mediante programación a través de la herramienta api_integration, algo que anteriormente solo era posible a través de la UI de Settings.
- macOS: Selección de Dispositivo de Entrada de Audio: Elija qué micrófono usar para la entrada de voz; enumera todos los dispositivos de audio disponibles y mantiene su selección.
- Android: Recuperación de OAuth en Memoria Baja: Los flujos de OAuth en Android ahora sobreviven a la recreación de la actividad cuando el sistema cierra la aplicación por falta de memoria, recuperando la sesión de autenticación sin problemas.
- Common: Arquitectura CSS Móvil de 3 Capas: Nuevo sistema CSS responsivo para móviles con capas de plataforma, diseño y componentes, garantizando una UI consistente en vistas de teléfono, tableta y escritorio.
Mejoras
- Extension: OAuth Incremental mediante Pestaña: Las solicitudes de alcance incremental ahora abren una pestaña completa del navegador en lugar de una ventana emergente, solucionando bloqueos en cuentas que requieren consentimiento interactivo.
- Common: Calidad del Esquema de Herramientas MCP: Todas las herramientas MCP ahora pasan una prueba de calidad de lint que verifica esquemas completos, descripciones adecuadas y definiciones de parámetros consistentes.
- Extension: Cierre Automático de Pestañas del Navegador al Detener: Las pestañas del navegador abiertas por el asistente ahora se cierran cuando se detiene una ejecución, y las ventanas de Safari de OAuth se cierran en macOS.
- Android: Actualización de Toolchain: Compilación de Android actualizada a AGP 9.1, Kotlin 2.2.10 y Gradle 9.3.1.
Corrección de Errores
- Common: Posicionamiento de Tablas en Google Docs: Se corrigieron las mutaciones que terminaban en posiciones incorrectas cuando las tablas preceden al texto de destino en Google Docs.
- Common: Eliminación de Pie de Página en Contenido de Página: Se corrigió la extracción de contenido de página que eliminaba incorrectamente elementos del pie de página de las páginas capturadas.
- Common: Paginación de Navegación Web: Se corrigió la paginación rota para la página 2+ cuando no se especificaba un maxLength explícito.
- Common: Respaldo de Script de Contenido: Se corrigió el fallo silencioso de la extracción de contenido de página al implementar un respaldo a executeScript cuando el script de contenido no está disponible.
- Common: Renderizado de PDF para Documentos Ingeridos por URL: Se corrigió el fallo del renderizado nativo de PDF para documentos ingeridos a través de URL.
- Common: Análisis de Llamadas a Herramientas de Gemini: Se corrigieron las claves entre comillas dobles en los argumentos de llamada a herramientas de LLM que causaban fallos de análisis con modelos Gemini.
- Common: Compatibilidad con Amazon Nova: Se corrigieron los mensajes tool_call rechazados por Amazon Nova debido a campos de texto vacíos.
- Common: La Ejecución del Agente no Termina: Se corrigió que las ejecuciones del agente no llamaran a endRun de manera confiable en el contexto del service worker, dejando pestañas del navegador y estados sin limpiar.
- macOS: Reanudación de Audio de Voz: Se corrigió que el audio de voz no se reanudara después del modo de suspensión de la aplicación macOS o la minimización en el dock.
- macOS: Capturas de Pantalla no Aparecen: Se corrigió que las capturas de pantalla de macOS no aparecieran en la UI del asistente debido a una detección de contexto incorrecta.
- macOS: Ubicación no Funciona: Se corrigió la ubicación rota en Safari y en la aplicación nativa de macOS al agregar el puente CoreLocation y corregir el respaldo de IP.
- macOS: Falta de Permiso de Ubicación: Se corrigió la falta del permiso (entitlement) de ubicación y se aumentó el tiempo de espera de ubicación nativa.
- iOS: Selector de Archivos Roto: Se corrigió que el selector de archivos no se abriera en iOS WKWebView al agregar el delegado runOpenPanel.
- Extension: Exceso de Concesión de Alcance OAuth: Se eliminó include_granted_scopes de la ventana emergente web y de las rutas OAuth posteriores al inicio de sesión para evitar la inflación no intencionada del alcance.
- Extension: Omisión de la Pantalla de Consentimiento OAuth: Se corrigió la elevación del alcance OAuth que omitía la pantalla de consentimiento durante las solicitudes de alcance incremental.
- Desktop: Ventana de Consola Visible en Windows: Se corrigió la aparición de la ventana de consola al iniciar el sidecar de Tauri en Windows.
- Desktop: Compilación de Windows Rota: Se corrigió la resolución de la ruta binaria de node y se aplanó node_modules para las compilaciones de Tauri en Windows.
- Server: Procesamiento de Webhooks Duplicados: Se corrigió el procesamiento de webhooks varias veces cuando había varios clientes conectados.
- Server: Códigos de Promoción en Compras de Créditos: Se desactivaron los códigos de promoción para compras de créditos en el checkout de Stripe.
Versión 0.9.714 (29 de marzo de 2026)
Nuevas Funciones
- Common: Onboarding Rediseñado: La nueva pantalla de onboarding presenta 6 rutas claras de acceso a la AI, facilitando que los nuevos usuarios comprendan sus opciones para conectarse con proveedores de AI.
- Common: PDF desde Markdown: Los nuevos documentos creados desde cero ahora pueden exportarse como PDF, convirtiendo el contenido markdown en un archivo PDF con formato.
- Common: Google OAuth Unificado: La conexión de la cuenta de Google ahora utiliza una única aplicación OAuth verificada con todos los alcances (scopes), reemplazando la configuración anterior de múltiples aplicaciones. Flujo de conexión más sencillo con menos avisos.
- Common: Meta-parámetro Save to Slate: Las herramientas ahora pueden enviar resultados directamente a un documento slate a través del parámetro
_save_to_slate, capturando resultados estructurados sin necesidad de copiar y pegar. - Common: Enlaces de Anclaje en Slate: Los mensajes de chat con referencias a slate ahora incluyen enlaces de anclaje clicables que se desplazan hasta la sección relevante dentro del documento.
- Common: Sandbox Data Bridge: Los sandboxes de artefactos HTML ahora pueden acceder dinámicamente a los datos de slate a través de un puente postMessage, permitiendo dashboards en vivo y visualizaciones interactivas.
- Common: Insignias de Nivel (Tier Badges): Los ajustes, herramientas y funciones de automatización ahora muestran insignias de nivel que indican qué nivel de acceso se requiere, brindando visibilidad a los usuarios de acceso ampliado sobre las restricciones.
- macOS: Speech-to-Text Nativo (WhisperKit): Reconocimiento de voz en el dispositivo a través de WhisperKit y CoreML, reemplazando el STT basado en navegador con una implementación nativa, privada y más rápida.
- macOS: Auto-actualización Sparkle: Actualizaciones automáticas listas para producción para la aplicación de macOS y la extensión de Safari a través de Sparkle, con feed appcast y actualizaciones delta.
- macOS: Contexto de Pestañas Nativo: La extracción de contexto de pestañas basada en AppleScript proporciona a la aplicación de macOS conocimiento sobre las pestañas del navegador en primer plano.
- macOS: Streaming de Tecla de Acceso Rápido de Voz: La tecla de acceso rápido de voz ahora muestra una superposición de streaming en tiempo real durante la grabación con carga automática del modelo WhisperKit.
- Safari: Mensajería Nativa: La extensión de Safari ahora se comunica con la aplicación de macOS a través de mensajería nativa en lugar de sondeo HTTP, mejorando la capacidad de respuesta y la fiabilidad.
- iOS/Android: Diálogos de Guardado Nativos: La exportación JSON ahora utiliza diálogos de guardado nativos (NSSavePanel en macOS, SAF en Android) en lugar de descargas de blobs fallidas.
- Web: Página de Destino para Equipos: Nueva página /teams con mensajes para equipos y empresas destinados a clientes potenciales.
- Web: Sección de Blog: Nueva sección de blog en el sitio web de caiioo.
- Web: Activación de Prueba Gratuita: La página de cuenta ahora admite la activación de la prueba gratuita con un flujo de onboarding alineado.
- Common: Soporte para Unidades Compartidas: Google Picker y todas las llamadas a la API de Drive ahora admiten unidades compartidas, permitiendo el acceso a documentos compartidos del equipo.
Mejoras
- Common: Saludo Adaptativo: El saludo adaptativo ahora se basa en los mensajes de bienvenida personalizados en lugar de ignorarlos, preservando el tono personalizado del usuario.
- Common: Limpieza de Callback de OAuth: Las pestañas de callback de OAuth ahora se cierran automáticamente con un temporizador de cuenta regresiva en lugar de permanecer abiertas.
- Common: Guía de OAuth: Cuando una herramienta necesita una conexión de cuenta, el mensaje de error ahora incluye una guía práctica sobre qué cuenta conectar.
- Common: Sobrescritura Forzada de Drive Sync: El flujo de trabajo de Drive Sync ahora admite una opción de sobrescritura forzada para volver a sincronizar todos los archivos.
- macOS: Visor de Registros de Depuración Unificado: La vista de registros de depuración ahora agrega los registros del servidor, Swift y la interfaz de usuario en un único flujo cronológico.
- macOS: Almacenamiento de Ajustes por Cubetas (Bucketed): El adaptador de almacenamiento del servidor se ha refactorizado a una arquitectura por cubetas con migración robusta, marcadores persistentes, atomicidad multi-perfil y resolución de conflictos de "el primer escritor gana".
- macOS: Extensión de Safari Notarizada: La extensión de Safari ahora está firmada con Developer ID y permisos compatibles con la notarización, eliminando el requisito de "Permitir extensiones no firmadas" para las versiones distribuidas.
- iOS: Apple Reminders por Defecto: iOS y macOS ahora utilizan Apple Reminders por defecto y los recuperan en la vista de sincronización automáticamente.
- Common: Elevación de Alcance de OAuth: Las solicitudes de alcance incremental ya no muestran los 22 alcances; solo se muestran los alcances recién solicitados, con avisos de selección de cuenta más limpios.
- Common: Reintento Automático de Cuenta de Google: Cuando un documento devuelve un error 404, se prueban automáticamente otras cuentas de Google conectadas antes de mostrar un error.
- Common: Navegación por Enlaces Profundos en Ajustes: Todas las secciones de ajustes ahora están registradas correctamente para la búsqueda y la navegación por enlaces profundos.
Corrección de Errores
- Common: Enrutamiento Incorrecto de Herramientas: Se corrigió el enrutamiento incorrecto de herramientas cuando los modelos usan el formato
tool:actionseparado por dos puntos en sus respuestas. - Common: Formato de Celdas de Tabla: Se preservó el formato y los enlaces en las celdas de las tablas y se eliminó la numeración de listas heredada que se filtraba entre celdas.
- Common: Desplazamiento de Resaltado en Slate: Se corrigió el desplazamiento de resaltado en el editor TipTap para pestañas en segundo plano, modo de vista previa y vistas nativas utilizando un posicionamiento confiable basado en ProseMirror.
- Common: Búsqueda de Texto en Bloques de Código: Se corrigió el respaldo a la búsqueda de texto cuando falla el mapeo estructural de bloques para bloques de código en documentos slate.
- macOS: Ajustes Perdidos al Cambiar de Modo: Los ajustes globales (claves API, conexiones) ya no se borran al cambiar de modo en macOS/iOS; ahora una lista de permitidos explícita controla qué ajustes se restablecen.
- macOS: Paridad de Purga de Almacenamiento: La purga completa de almacenamiento ahora borra todos los campos de estado de manera consistente, coincidiendo con el comportamiento de chrome.storage.local.clear(). La eliminación de perfiles y la limpieza de retención también se enrutan correctamente a través de las cubetas.
- macOS: Concurrencia de Ajustes: Las lecturas de ajustes en applyModeDefaults ahora adquieren el bloqueo primero, evitando condiciones de carrera. Las estadísticas de almacenamiento se leen de las cubetas en lugar de un caché plano obsoleto.
- macOS: Robustez de Migración: La migración de almacenamiento se reintenta en caso de fallo, utiliza marcadores de finalización persistentes y limpia automáticamente los datos obsoletos previos a la migración.
- macOS: Procesos Zombie del Servidor MCP: Los procesos secundarios del servidor MCP ahora se terminan correctamente cuando se cierra la aplicación de macOS.
- macOS: Calendario/Recordatorios en Agenda: Se corrigió que los eventos de Apple Calendar y los Recordatorios no aparecieran en el modal de la agenda.
- macOS: Flujo de Google OAuth: Se corrigió el fallo del inicio de sesión de Google en macOS WKWebView enrutando OAuth a través del flujo web del servidor de relevo.
- macOS: Navegación al Cerrar Sesión: Se corrigió que el cierre de sesión no regresara a la pantalla de inicio de sesión en macOS.
- macOS: Autenticación de Acceso Remoto: Se corrigió el error 401 en el endpoint set-remote-access al eliminar un requisito de autenticación incorrecto.
- Server: Entrega de Respuestas de WhatsApp: Se corrigió que las respuestas de WhatsApp no se enviaran de vuelta a WhatsApp y solo permanecieran en el hilo de chat de PF.
- Server: Tiempo de Espera de Relevo de WhatsApp: Se extendió el tiempo de espera de relevo de WhatsApp de 120s a 10 minutos y se corrigió la resolución en errores de generación.
- Server: Re-autenticación de Sincronización Privada: Se corrigió el flujo de re-autenticación de sincronización privada, la protección OAuth del lado del servidor y la limpieza al cerrar sesión en macOS.
- Server: Autenticación de Sincronización de Carpetas Locales: Se corrigió el error de autenticación 401 en las operaciones de sincronización de carpetas locales/de red.
- Server: Re-autenticación de Sesión de Google: El diálogo de desbloqueo ahora activa la re-autenticación al expirar la sesión de Google en lugar de mostrar un error sin salida.
- Safari: Firma de la Extensión: Se corrigió que la extensión de Safari apareciera como no firmada mediante el uso de permisos de lanzamiento sin
get-task-allowpara versiones firmadas con Developer ID. - Common: Desajuste de Cuentas OAuth: Se corrigió que OAuth creara conexiones desajustadas al crear correctamente nuevas conexiones en lugar de sobrescribir las existentes con cuentas diferentes.
- Common: Inflación de Alcance de OAuth: Se corrigió que las conexiones desajustadas heredaran los alcances de la cuenta original, causando una concesión excesiva de alcances no intencionada.
- Common: Borrado de Lista de Hilos: Se corrigió que el tiempo de espera/reintento de STATE_UPDATE usara un nombre de campo incorrecto, lo que podía borrar la lista de hilos.
- Common: Precisión de Insignias de Nivel: Se corrigió que las insignias de nivel mostraran incorrectamente "Tester" en funciones de nivel gratuito.
- Common: Desbordamiento del Panel de Ajustes: Se corrigió el desbordamiento de flex en las filas de tarjetas del panel de ajustes que causaba problemas de diseño.
- Server: Pérdida de Claves API en Sincronización Privada: Se corrigió la pérdida de claves API en la sincronización privada al sincronizar entre dispositivos.
- Server: Puente de Mensajería: Se corrigieron los chats archivados, el botón de parada y la selección de modo en el puente de mensajería.
- macOS: Ajustes de Modo Personalizado Perdidos: Se corrigió la pérdida silenciosa de ajustes de modo personalizado en macOS/iOS debido a una ruta de guardado sin operación.
- macOS: Cabeceras de OpenRouter Bloqueadas: Se corrigió el bloqueo de CORS de relevo en las cabeceras de atribución de OpenRouter en macOS/iOS.
- macOS: Cambio de Contexto de Pestañas: Se corrigió que el contexto de las pestañas no se actualizara al cambiar entre pestañas del navegador.
Versión 0.9.713 (28 de marzo de 2026)
Nuevas Funciones
- Common: Sub-Agents: Sistema completo de sub-agentes con agentes nombrados persistentes, historial de conversación, ejecución paralela (patrón de comité), modos secuencial y de interjección, cascada de aborto y renderizado de UI dedicado con seguimiento de estado cronológico.
- Common: MCP Tool Approval: Las herramientas MCP registradas ahora aparecen en el sistema de aprobación de herramientas, brindando a los usuarios visibilidad y control sobre qué herramientas MCP pueden invocar los agentes.
- macOS: Sidepanel Push Mode: El panel lateral ahora admite el modo push junto con el de superposición, con un ancho predeterminado de 425px y persistencia del ancho acoplado entre sesiones.
- Server: WhatsApp Rich Messages: La conexión de WhatsApp ahora admite el uso compartido de ubicación, contactos, reacciones y mensajes de stickers, además de texto y multimedia.
- Server: API Key Encryption at Rest: Las API keys almacenadas en el almacenamiento D1 del relay ahora están cifradas en reposo. Las claves OAuth del lado del servidor se eliminan después de guardarse localmente.
Mejoras
- Common: Model Alias Display: Los argumentos de llamada a herramientas de sub-agentes ahora muestran alias de modelos anotados para una identificación más sencilla.
- Common: BYOA Connection Priority: Las solicitudes OAuth de alcance ampliado ahora prefieren conexiones alternativas BYOA sobre las conexiones Basic, reduciendo las solicitudes de re-autenticación innecesarias.
- Common: Thought Signature Preservation: Las firmas de pensamiento/razonamiento ahora se preservan correctamente tanto para la OpenAI Responses API como para los flujos de llamada a herramientas de múltiples turnos de Gemini.
- macOS: Debug Log Propagation: El interruptor de registro de depuración ahora se propaga al subproceso del servidor Node.js.
- Common: Bengali Language Support: La plataforma y el sitio web ahora son compatibles con el bengalí, además de actualizaciones en el descargo de responsabilidad de marca registrada y publicaciones de medios en el sitio web.
Corrección de Errores
- Common: Safari/WKWebView Streaming: Se aplicó un polyfill a la iteración asíncrona de ReadableStream para kokoro-js, corrigiendo fallos de streaming de TTS en Safari y WKWebView.
- Common: Custom Mode Creation: Se corrigió un cierre de React (closure) desactualizado que causaba que la creación de modos personalizados fallara en el primer intento.
- macOS: Agent Storage Mutations Lost: Las mutaciones de almacenamiento del subproceso del agente (creación de modos, ajustes, habilidades) se perdían silenciosamente en macOS debido a la falta de un puente de persistencia.
- macOS: Clipboard Copy: Se corrigió el fallo silencioso de la copia al portapapeles en macOS WKWebView.
- macOS: WASM/WebGPU en WKWebView: Se forzó el backend WASM para TTS/STT y rutas locales ONNX en la aplicación nativa de macOS — las importaciones de origen cruzado de CDN y las importaciones de módulos JSEP de WebGPU fallan en el WKWebView de localhost.
- macOS: Transport Request Collisions: Se corrigió la colisión de requestId que interrumpía la aprobación de herramientas en macOS, además de mejorar los nombres de visualización de MCP.
- macOS: WhatsApp Auto-Reply: Se corrigió el cableado de extremo a extremo para la respuesta automática de WhatsApp en el servidor relay de macOS, incluyendo la visibilidad de los hilos.
- iOS: Voice Dictation Stuck: Se corrigió el dictado de voz bloqueado en estado de grabación cuando se omitía la limpieza de stopRecording.
- Safari: Browser Commands Timeout: Se corrigió el tiempo de espera agotado en los comandos del navegador Safari debido a APIs de WebExtension colgadas tras la suspensión del service worker.
- Safari: Heartbeat Stale Check: Se omite la comprobación de heartbeat desactualizado para los navegadores Safari con sondeo HTTP para evitar desconexiones falsas.
- Server: Private Relay Stability: Se corrigió la hibernación de Durable Object, el tiempo de espera de inactividad (1006), los retrasos de reconexión, el manejo de sockets obsoletos y los problemas de readyState zombi. Se eliminó la inconsistencia (split-brain) entre serverState y ctx.state.
- Server: Webhook Broadcast: Los webhooks ahora se transmiten a todos los sockets del servidor después del despertar de la hibernación del DO, solucionando el problema del readyState zombi.
- Server: MV3 Messaging Race: Se corrigió una condición de carrera en el puente de mensajería de inicialización diferida (lazy-init) al llegar un webhook, evitando bloqueos del service worker MV3.
- Server: Webhook Verify CORS: Se enrutó la prueba de verificación de webhook a través del servidor para evitar el rechazo de CORS en el navegador.
- Extension: Logout Cleanup: El cierre de sesión ahora borra correctamente la sesión del servidor relay local en macOS, detectando el contexto de localhost.
- Common: Security — Thread Isolation: Las transmisiones de estado ahora filtran los hilos por el perfil actual, evitando la filtración de datos entre perfiles.
Versión 0.9.712 (26 de marzo de 2026)
Nuevas Funcionalidades
- Common: Diagnóstico de Conexión de WhatsApp: La función Test Connection para WhatsApp ahora verifica el estado de la suscripción al webhook y la validez del app secret además del token de la API, detectando fallos de entrega silenciosos por parte de Meta.
- macOS: Flujo de OAuth Nativo: La aplicación para macOS ahora utiliza ASWebAuthenticationSession para OAuth en lugar de redirecciones del navegador, con actualización automática de conexiones obsoletas que carecen de tokens de actualización.
Mejoras
- Common: Robustez de Búsqueda/Reemplazo en DOCX: La búsqueda y reemplazo en documentos DOCX ahora gestiona espacios dobles, espacios de no separación, comillas inteligentes, entidades numéricas y discrepancias de mayúsculas. Incluye una alternativa insensible a mayúsculas cuando falla la coincidencia exacta y advertencias cuando se reemplazan múltiples instancias.
- Common: Numeración de Listas en DOCX: La exportación a DOCX ahora genera una numeración de listas de Word adecuada (w:numPr) en lugar de caracteres de viñeta literales, para que Word reconozca correctamente las listas numeradas y con viñetas.
- Common: Rendimiento de Inicio del Agente: Se eliminaron los retrasos de inicio del agente de 30-50s causados por servidores MCP fantasma, tiempos de espera de disponibilidad HTTP y obtención redundante de modelos. El caché del modelo ahora se pasa a los subprocesos del agente.
- Server: Refuerzo de Seguridad: Corrección de inyección de comandos en el manejador de URL, comparación de tokens segura contra ataques de tiempo, cabecera Content-Security-Policy en el servidor de relay, limitación de tasa (rate limiting) en el endpoint de sesión, CORS restringido a orígenes conocidos y cifrado de transmisión E2E en paralelo.
- Server: Verificación de Firma de Webhook: Las cargas útiles de los webhooks ahora utilizan el cuerpo sin procesar codificado en base64 para evitar la corrupción por el procesamiento de JSON que invalidaba las firmas HMAC.
- Server: Persistencia de Tokens OAuth: Se corrigió la inconsistencia entre objetos de estado del servidor que causaba que las conexiones OAuth (Google Drive, etc.) se perdieran tras reiniciar la aplicación.
- macOS: Rendimiento y Estabilidad: Sondeo de la bandeja del sistema basado en menús (antes era un temporizador incondicional de 3s), guardado del estado de la ventana con debounce, registro de logs no bloqueante, recuperación de bloqueos de WKWebView con retroceso exponencial y corrección de fugas de memoria en los manejadores de mensajes de scripts.
- macOS: Registro de Logs Centralizado: La salida del servidor de relay y los eventos del ciclo de vida de la aplicación ahora se registran en
~/Library/Logs/caiioo/con rotación automática de 10MB, reemplazando la salida descartada silenciosamente.
Corrección de Errores
- Common: Instrucciones del Selector de Archivos: La herramienta
pick_filesahora devuelve instrucciones claras para el usuario en lugar de una señal de acción de UI muerta que fallaba silenciosamente. - Server: Spam de Sondeo de Pestaña Activa: El sondeo de pestaña activa en modo relay ya no genera errores de tiempo de espera interminables cuando no hay ninguna extensión de navegador conectada. Utiliza un retroceso exponencial (de 30s a 5min) en fallos consecutivos.
- Server: CORS para Aplicación Nativa: Se corrigió el bloqueo del origen 127.0.0.1 por la lista blanca de CORS, que interrumpía el OAuth de Google desde el WKWebView de la aplicación nativa de macOS.
- Server: Procesos de Agente Huérfanos: Los subprocesos del agente ahora se limpian correctamente al apagar el servidor y ante excepciones no capturadas.
- macOS: Spam de Logs del Orquestador del Navegador: Se corrigieron las advertencias de "Unhandled message type" para los mensajes del protocolo del navegador en las conexiones de la extensión.
Versión 0.9.711 (24 de marzo de 2026)
Nuevas Funcionalidades
- Common: Guardado Automático de Ajustes: Los campos de configuración ahora se mantienen mientras editas con un debounce de 500ms para campos de texto y guardado inmediato para selectores y botones de alternancia, evitando la pérdida de datos en caso de error o navegación.
Mejoras
- Common: Preservación de Numeración DOCX: Los caracteres de tabulación en secciones numeradas de DOCX (por ejemplo, documentos legales con "3.2.3 → Encabezado") ahora se preservan durante todo el ciclo de edición en lugar de eliminarse silenciosamente.
- Common: Selección Inteligente de Herramientas: El selector dinámico de herramientas ahora gestiona consultas fácticas (horarios comerciales, precios, direcciones) que requieren verificación web, en lugar de limitarse a coincidir con palabras clave estrictas.
- Common: Cambios de Idioma del Agente: Los cambios de idioma iniciados por el agente ahora se aplican de inmediato en lugar de requerir un cambio manual en los ajustes.
- Common: Respaldo de OAuth para Cuentas Múltiples: Cuando la cuenta de Google primaria carece de los alcances necesarios, se verifican las cuentas secundarias conectadas antes de solicitar una nueva autenticación. Corrige errores no detectados cuando los tokens de cuentas secundarias caducan.
- Server: Validación de Ajustes de Modo: El Server ahora valida los permisos de nivel al guardar la configuración, evitando que los usuarios de nivel gratuito conserven ajustes del nivel pro.
- Common: Refuerzo de Seguridad: Sanitización con DOMPurify en la salida de la vista previa de razonamiento, CORS restringido a orígenes conocidos, búsqueda de geolocalización por IP priorizando HTTPS y restricción de web_accessible_resources.
Corrección de Errores
- Common: URLs de Resultados de Búsqueda de Google: La búsqueda de Google en el navegador ahora devuelve enlaces estructurados con URLs reales. Anteriormente, el agente necesitaba 5 llamadas a herramientas para extraer URLs porque AgentMarkdown perdía los href de los enlaces debido al complejo HTML anidado de Google; ahora los enlaces se extraen directamente del DOM y se incluyen en el primer resultado de búsqueda.
- Common: Bucle Infinito de Private Sync: Se corrigió el bucle de sincronización causado por la escritura de archivos de respaldo del manifiesto que activaba continuamente la resincronización. Los objetos de configuración vacíos ahora se propagan correctamente entre dispositivos.
- Common: Actualizaciones del Puente de Mensajería: Los mensajes entrantes, las respuestas del agente y las respuestas de retransmisión ahora se emiten a la UI de inmediato en lugar de aparecer solo después de que el agente termina de responder.
- Extension: Reconexión de Private Relay: Se corrigió el problema por el cual el relay permanecía desconectado tras el reinicio del service worker de MV3, recurriendo al estado habilitado almacenado. También se corrigió la condición de carrera de autoreemplazo durante enable() y la reconexión por cambio de identidad.
- Extension: Condiciones de Carrera en Private Relay: Se reforzaron las carreras de activación/desactivación, se añadieron protecciones contra rechazos no controlados en los callbacks del puente de mensajería y se corrigió la fuga del temporizador al desmontar el panel de ajustes.
Versión 0.9.710 (22 de marzo de 2026)
Nuevas Funcionalidades
- Common: Aplicación de Zero-Day Risk (ZDR): Sincronización de datos ZDR en vivo con un interruptor de aplicación para OpenRouter — visualice el desglose del recuento de proveedores y bloquee modelos marcados con riesgos de día cero.
- Common: Reparación de Llamadas a Herramientas: Los modelos débiles que emiten llamadas a herramientas en XML dentro de bloques de razonamiento ahora se detectan y reparan automáticamente, mejorando la fiabilidad en modelos que no son de frontera.
- Common: Ciclo de Vida de Token Unificado: Refresco simétrico de tokens OAuth en todas las plataformas (extensión, servidor, macOS, iOS) a través de un TokenLifecycleManager unificado, con refresco proactivo antes de la expiración.
- iOS: Escalado de Iconos del Composer: Los iconos de acción del Composer ahora se escalan 1.18x en iOS para mejores objetivos de pulsación, con una clase de cuerpo
native-iosdedicada para estilos específicos de la plataforma.
Mejoras
- Common: Cambios Propuestos en Slate: La navegación entre cambios propuestos, la aceptación/rechazo basada en desplazamiento (hover) y las actualizaciones de contadores ahora funcionan correctamente en el editor Slate.
- Common: Menú Desplegable del Selector de Slate: El selector de tipo de slate ahora utiliza un menú desplegable en línea en lugar de un popover portado, corrigiendo problemas de z-index y posicionamiento.
- Common: Reemplazo Completo en Propose Change:
propose_changeahora permite el reemplazo completo del documento para documentos pequeños (500 caracteres o menos) en lugar de requerir ediciones parciales. - Common: El Envío de Voz Espera a la Transcripción: Al presionar Enviar/Enter mientras se graba, ahora se espera a que la transcripción se complete antes de enviar, evitando mensajes vacíos o parciales.
- Common: Flujo de Configuración de Private Sync: El diálogo de frase de contraseña ahora se muestra automáticamente después de OAuth durante la configuración de Private Sync, agilizando el flujo de incorporación.
- Common: Refresco del Registro BYOA: El registro de proveedores BYOA ahora se reinicializa después de que Private Sync descarga nuevas credenciales, asegurando que las conexiones importadas sean utilizables de inmediato.
- Common: Consistencia en la Terminología: "Cloud Sync" ha sido renombrado a "Private Sync" en el contenido de la guía del usuario con una prueba de protección de terminología para evitar regresiones.
- Server: Estabilidad de Private Relay: Fecha de compatibilidad actualizada, mejora en el manejo de bloqueos de Durable Object y refuerzo de la lógica de reconexión de MV3 para conexiones de larga duración fiables.
- Server: Exclusión de Ajustes de Private Sync: Los ajustes de Private Relay ya no se incluyen en las cargas útiles de cloud sync, evitando conflictos de configuración de relay entre dispositivos.
Corrección de Errores
- Common: Manejo de Imágenes SVG: Los archivos SVG ya no se envían como
image_urla los proveedores, lo que causaba errores HTTP 400 en modelos que no admiten el formato SVG. - Common: Condiciones de Carrera en Private Sync: Se corrigieron los fallos en el relay de mensajería causados por condiciones de carrera durante la inicialización de Private Sync. Se ha reforzado el bucle de sincronización y la lógica de cuarentena.
- Common: Eliminación de Datos de Private Sync: La eliminación de datos en la nube y la auditoría ahora funcionan correctamente tras desactivar Private Sync.
- Common: Contaminación en el Emparejamiento de Modelos: Se corrigió el emparejamiento de modelos entre familias en el sistema de autoajuste que podía mapear incorrectamente modelos entre diferentes familias de proveedores.
- Common: Selector Dinámico de Herramientas: Se ha reforzado el prompt del selector dinámico de herramientas para evitar razonamientos de tipo agente que podrían causar fallos en la selección de herramientas.
- Common: Mensajes de Error de Validación: La validación de campos obligatorios ahora devuelve mensajes de error enfocados en lugar de fallos genéricos.
- Extension: Caídas de WebSocket en Private Relay: Se corrigieron las caídas de las conexiones WebSocket después de ~60 segundos debido a la suspensión del service worker de MV3. Se ha mejorado la lógica de keepalive y reconexión.
- Extension: Alcances Incrementales de Google OAuth: Se corrigió la expansión del alcance de OAuth utilizando
launchWebAuthFlowen el contexto de la extensión en lugar de fallar silenciosamente. - Extension: Recarga de Ajustes al Conmutar Relay: Se suprimió la recarga innecesaria de ajustes al activar/desactivar el relay, evitando el parpadeo de la interfaz de usuario y el ruido de diagnóstico.
- Server: Hibernación de Durable Object: Se corrigió el manejo del cierre de WebSocket tras la hibernación de Durable Object que podía dejar las conexiones en un estado obsoleto.
- Server: Persistencia de Credenciales de Mensajería: Las credenciales de mensajería ahora se persisten inmediatamente al cambiar, en lugar de esperar al siguiente ciclo de guardado.
- iOS: Callbacks de WebSocket Obsoletos: Los manejadores de WebSocket ahora se limpian al cerrar, evitando que se activen callbacks obsoletos tras la reconexión en iOS.
- Desktop: Carga del Instalador NSIS: El instalador NSIS para Windows ahora se carga correctamente a través de la API para las versiones preliminares (draft releases).
Versión 0.9.709 (21 de marzo de 2026)
Nuevas Funcionalidades
- Common: Adaptador de Mensajería de Slack: Nuevo adaptador de Slack Events API para el puente de mensajería con verificación de firma de bot, soporte para descarga de archivos multimedia y configuración de interfaz de usuario en ajustes.
- Common: Ciclo de Archivos en Slate: Abra y guarde archivos locales directamente en Slate con persistencia de identificadores del sistema de archivos y seguimiento de cambios basado en hash. El nuevo botón "Cargar archivo" en el diálogo del selector de Slate preprocesa los documentos y los abre con el editor correcto.
- Common: Reestructuración del Menú de Archivos de Slate: Menú de tipos de archivos reorganizado en categorías de Documentos, Renderizables (HTML/Vega/Mermaid) y Código y Datos con autodetección al renombrar.
- Common: Aplicación de Navegador Remoto: Los clientes de navegador remoto ahora pueden obtener recursos del panel lateral a través del relay privado, permitiendo el acceso basado en navegador sin tener la extensión instalada.
- Common: Identidad de Dispositivo en Relay Privado: Los clientes de relay ahora muestran un nombre de dispositivo legible por humanos. Cuando es desplazado por otro dispositivo, la interfaz de usuario muestra qué dispositivo lo reemplazó.
- Common: Rediseño del Chip de Micrófono del Composer: Botón de micrófono rediseñado como un chip/píldora visible con un indicador claro del estado de grabación, objetivos táctiles mínimos de 44px para móviles y superposición de voz renderizada sobre el área de entrada.
- Common: Enlace a la Guía del Usuario: La guía del usuario ahora está enlazada desde la sección de configuración de Documentación y Legal.
- iOS: Control de Configuración BYOA: El asistente BYOA en dispositivos móviles ahora muestra un mensaje indicando a los usuarios que configuren Private Apps en el escritorio, ya que el flujo de navegador de 8 pasos es inviable en móviles.
- Server: Desafío de Inicio de Sesión: Verificación MFA de 6 dígitos basada en correo electrónico para el inicio de sesión, con seguimiento de consentimiento y revocación de sesión.
Mejoras
- Common: Sincronización Privada Prioritaria de Ajustes: Los ajustes ahora se sincronizan antes que las conversaciones, asegurando que los tokens y la configuración estén disponibles de inmediato mientras la sincronización masiva de hilos continúa en segundo plano.
- Common: Correlación de Solicitudes WebSocket: Los transportes de WebSocket y relay privado ahora esperan correctamente las respuestas del servidor en lugar de resolverse inmediatamente, solucionando más de 40 operaciones de interfaz de usuario en el panel lateral de macOS y clientes de relay (auditoría de Drive, prueba de Ollama, operaciones MCP, etc.).
- Server: Verificación de Firma de Webhook: La verificación de firma de webhook se ha movido al secreto de la aplicación a nivel de ruta para una arquitectura más limpia.
Corrección de Errores
- Common: Entrega de Respuestas de WhatsApp: Se corrigió el error por el cual las respuestas del agente se perdían silenciosamente en lugar de enviarse de vuelta a WhatsApp. La ruta de retorno del relay de mensajería ahora registra detalles de diagnóstico cuando falla la entrega, haciendo que los problemas futuros sean diagnosticables de inmediato.
- Common: Firmas de Bloques de Pensamiento entre Modelos: Se corrigieron los errores de "Firma inválida en bloque de pensamiento" al cambiar de un modelo que no es Claude a Claude con modo de pensamiento. La detección del formato de razonamiento ahora es 'unknown' por defecto en lugar de identificarse erróneamente como formato de Anthropic.
- Common: Editabilidad de Slate para Nuevos Documentos: Los nuevos slates DOCX, PDF, RTF y XLSX ahora se abrén correctamente en sus editores en lugar de renderizarse como HTML estático.
- Common: Alternativa de Exportación de Slate: Los nuevos documentos sin datos binarios originales ahora se exportan correctamente: XLSX recurre a CSV, RTF a conversión HTML, PDF a impresión del navegador.
- Common: Renderizado de Vista Previa en Sandbox: Se corrigieron las vistas previas en blanco de HTML y Vega causadas por una discrepancia de origen del sandbox en el direccionamiento de postMessage.
- Common: Desplazamientos de Columna en Control de Cambios: Las eliminaciones en el control de cambios ahora mapean correctamente los desplazamientos de HTML a texto, corrigiendo cambios mal posicionados en TipTap.
- Common: Recuperación de Autenticación en Sincronización Privada: Los tokens OAuth expirados o revocados durante la sincronización ahora activan automáticamente la reautorización en lugar de requerir una reconexión manual.
- Common: Indicador de Borrador en Streaming de Voz: La superposición de la transcripción de voz ahora muestra el estado "Vista previa" con opacidad reducida para señalar que el texto es provisional hasta que se detenga la grabación.
- Common: Herramientas MCP en Plataformas Nativas: Las herramientas del servidor MCP local ahora se registran correctamente en macOS, Windows y Linux; anteriormente, el controlador iniciaba el proceso MCP pero nunca obtenía ni registraba sus herramientas.
- Common: Actualización del Chip de Contexto de Slate: El chip de contexto de la pestaña activa ahora se actualiza desde el almacenamiento cuando el título de una pestaña de slate cambia después de cargar desde Drive o GitHub. El texto de entrada del título en modo oscuro ya no es ilegible.
- Extension: Polyfill de Stub de Chrome: Las pestañas del navegador Chrome en localhost con
window.chromepero sin las API de extensión ahora reciben la inyección de stub adecuada en lugar de ser omitidas. - Extension: Error de Cierre del Paquete del Cliente Relay: Se corrigió el error de
import.meta.enven el paquete IIFE del cliente relay definiendo variables de entorno en tiempo de compilación. - Extension: Inicio de Sesión en Aplicación Remota: Se ha depurado el inicio de sesión de la aplicación de navegador remoto con Google OAuth como método principal y correo electrónico/contraseña como una opción secundaria colapsada.
Versión 0.9.708 (19 de marzo de 2026)
Mejoras
- Common: Coordinación del Indicador de Generación: Los puntos de escritura por mensaje ahora se coordinan con el indicador de respaldo a nivel de hilo, eliminando la duplicidad de puntos intermitentes durante la generación. Los puntos ahora persisten durante las fases de razonamiento y ejecución de herramientas, ocultándose solo una vez que la respuesta final comienza a transmitirse.
- Common: Cursor de Streaming: Ahora aparece un cursor parpadeante al final del texto en streaming, proporcionando un indicador visual claro de que la respuesta aún se está generando.
- Common: Formato de Vista Previa de Razonamiento: Los bloques de razonamiento colapsados ahora renderizan el formato de negrita e cursiva en línea en lugar de la sintaxis markdown sin procesar.
- Common: Listado de Documentos Slate:
list_slatesahora muestra correctamente el tamaño del contenido para archivos DOCX, PDF y XLSX que fueron cargados mediante consultas de hilos ligeros. Los listados también incluyen guías de flujo de trabajo para editar documentos DOCX y XLSX. - Common: Sección de Ajustes de Private Sync: Los ajustes de Private Sync se encuentran ahora en su propia sección dedicada para una organización más clara, separados de los ajustes generales.
- Extension: Reestructuración de Ajustes de Conexiones: La sección de Private Relay se ha reorganizado en dos subsecciones claras: Private Relay (interruptor de acceso remoto, siempre visible) y Caiioo Bridge (servidores MCP locales y herramientas del sistema). El interruptor de acceso remoto ya no requiere que el Bridge esté en ejecución.
- Desktop: Binario Unificado de Tauri: La aplicación de escritorio para Windows/Linux se ha consolidado de variantes de tiempo de compilación a un único binario con restricción de nivel en tiempo de ejecución; la visibilidad del panel lateral se determina por el nivel de suscripción en tiempo de ejecución.
Corrección de Errores
- Extension: Private Relay sin Bridge: Private Relay ahora se conecta de forma independiente sin la aplicación Caiioo Bridge. Anteriormente, la autenticación solo se inicializaba mediante la conexión del Bridge, lo que dejaba a los usuarios que solo usaban la extensión (incluyendo Linux/Windows) sin poder recibir webhooks de mensajería o usar el acceso remoto.
- Extension: Enrutamiento de Google OAuth: Se corrigieron los fallos de las ventanas emergentes de OAuth en Chrome al omitir
getAuthTokencuando no está disponible y recurrir a las credenciales BYOA. La resiliencia de las ventanas emergentes COOP evita ventanas en blanco en sitios restrictivos. - Common: ElevenLabs Streaming STT: Se corrigió la caída o fallo de la transcripción de voz cuando el streaming de ElevenLabs encuentra interrupciones de conexión. La entrada de voz de la aplicación nativa ahora cuenta con un sistema de respaldo fluido.
- iOS: Enlaces Externos en WKWebView: Los enlaces que deberían abrirse en Safari ahora se abren correctamente de forma externa en lugar de cargarse dentro de la WebView de la aplicación.
- Common: Reglas Huérfanas de Ad-Blocker: Se corrigieron las reglas dinámicas de bloqueo de anuncios DNR que persistían tras el reinicio del service worker.
disableAllBlockingahora consulta y elimina directamente las reglas huérfanas incluso cuando la instancia del bloqueador es nula. - Common: Sincronización de Licencia al Cambiar de Perfil: Al cambiar de perfil, ahora se sincroniza la licencia desde el servidor, asegurando que las herramientas restringidas por nivel se actualicen inmediatamente en lugar de requerir un reinicio.
- Common: Actualización de Token antes del Aprovisionamiento: Los tokens OAuth expirados ahora se actualizan antes del aprovisionamiento de las API keys, evitando fallos silenciosos. Los servidores nuevos ahora pueden adoptar conexiones de identidad existentes.
- Web: Menú Móvil en iOS Safari: El menú de hamburguesa en el sitio web de marketing ya no es transparente en iOS Safari.
- Common: Carrera de Loteo en React-18: Se añadió el indicador de generación a nivel de hilo como respaldo para casos en los que el procesamiento por lotes del estado de React-18 impedía que aparecieran los puntos de escritura por mensaje.
Versión 0.9.707 (17 de marzo de 2026)
Mejoras
Precompletado de reconfiguración BYOA: Al reconfigurar una aplicación privada de Google o Microsoft existente, ahora se precompletan el secreto del cliente y el ID del inquilino, para que no tenga que volver a introducirlos.
Ordenación de la lista de modelos: Los modelos dentro de cada grupo de proveedores ahora se ordenan por fecha de lanzamiento (los más recientes primero), garantizando un orden coherente en todas las plataformas.
Corrección de errores
Recuperación de autenticación de sincronización privada: Los fallos de los tokens OAuth (sesiones caducadas, tokens revocados, tokens de perfil de Chrome) durante la inicialización de la sincronización privada ahora se muestran correctamente en la interfaz de usuario en lugar de entrar silenciosamente en un estado de error.
Fiabilidad de cambios controlados en Slate: 10 correcciones críticas para los cambios controlados: condición de carrera en la fusión de revisiones, persistencia de la base de diferencias en todas las rutas de actualización, preservación del formato en la exportación a DOCX, eliminación de etiquetas HTML para la coincidencia con TipTap, orden de aceptar/rechazar todo, y correcciones de convergencia para el escape de entidades y la coincidencia de etiquetas mediante regex.
Integridad de datos en Slate: Se corrigió el problema de las imágenes pegadas que se escribían en una caché local inactiva, la metainformación de fuentes en la nube que no persistía y el respaldo de BroadcastChannel para actualizaciones de IA en vivo en modo relay/móvil.
Seguridad en Slate: Se corrigió la inyección XSS en el visor de imágenes y se reemplazaron los orígenes postMessage de comodín con URLs de extensión con ámbito definido.
Versión 0.9.706 (16 de marzo de 2026)
Nuevas funciones
- Banners de error del proveedor: Cuando un proveedor de IA devuelve un error (402 pago requerido, falta la clave API, límite de velocidad), ahora aparece un banner interactivo con instrucciones claras en lugar de un mensaje de error genérico.
Mejoras
Edición de DOCX entre tramos: La herramienta
propose_changeahora gestiona correctamente las operaciones de buscar/reemplazar que abarcan múltiples formatos (por ejemplo, texto parcialmente en negrita). La intención se transmite para que el agente pueda realizar ediciones contextuales.Rendimiento de guardado de PDF: El guardado nativo de PDF es significativamente más rápido: se eliminó el análisis redundante, se almacenaron en caché los módulos de importación y se omitió la limpieza innecesaria de operadores.
Nombre del modo en mensajería: El selector de modo en los ajustes de mensajería ahora muestra el nombre comercial del modo en lugar del ID interno.
Corrección de errores
Actualización de tokens de Google OAuth: Se corrigieron los errores de "No autorizado" al actualizar los tokens de Google OAuth que podían bloquear el acceso a Calendar, Gmail y Drive.
Mensaje de error de clave aprovisionada: Los usuarios con claves API aprovisionadas ya no verán un mensaje de error engañoso de "Añadir fondos"; el mensaje ahora explica el problema real y los siguientes pasos.
Condición de carrera en hilos concurrentes: Se corrigió un error donde cambiar de hilo durante la generación podía causar que los eventos GENERATION_COMPLETE/ERROR se aplicaran al hilo equivocado.
Botón de restaurar historial de revisiones: El botón de restaurar en el historial de revisiones de Slate ahora aparece correctamente cuando el contenido actual difiere de la revisión seleccionada.
Doble ventana emergente de OAuth: Los nuevos usuarios de la extensión de Chrome ya no verán dos ventanas emergentes de OAuth al iniciar sesión por primera vez.
Versión 0.9.705 (15 de marzo de 2026)
Nuevas funciones
- Agrupación de categorías de ajustes: 19 secciones de ajustes ahora están organizadas en 5 categorías colapsables para una divulgación progresiva. La sección de Modos de Agente muestra un indicador transversal con enlaces de navegación a las secciones afectadas (Configuración de herramientas, Configuración de modelos, Apariencia). La sección de Proveedor de API se abre por defecto con una advertencia de capacidad del modelo.
Corrección de errores
- Duplicación de calendarios en sincronización de agenda: Las cuentas de Google Calendar ya no aparecen dos veces en la pestaña de Sincronización cuando existen tanto una conexión de inicio de sesión (identidad) como una Conexión Privada para el mismo correo electrónico. Las conexiones ahora se deduplican antes de renderizarse.
- Categorías de ajustes i18n: Las etiquetas de las categorías de ajustes ahora están traducidas en todos los idiomas admitidos.
Versión 0.9.704 (14 de marzo de 2026)
Nuevas Funcionalidades
- Base de Integración con Microsoft 365: Enrutamiento de scopes de Microsoft, cliente de Graph API y servicio de cuentas con soporte para BYOA. Definiciones de jerarquía de scopes y extensiones de registro de tool-scope para el proveedor Microsoft. Se ha añadido Microsoft como proveedor con relay-proxied.
- Rich Inline Rendering (RIR): Nueva arquitectura de códecs para renderizar contenido enriquecido directamente en los mensajes del chat. Incluye códecs para HTML, Markdown y DOCX con una interfaz de códec extensible.
- Árbol de Estructura PDF y Análisis de Diseño: Analizador de árbol de estructura para PDF etiquetados para la comprensión semántica de documentos. La agrupación heurística de párrafos para PDF no etiquetados proporciona un análisis de diseño de respaldo. Detección de desbordamiento de contenido e inserción/reemplazo de imágenes.
- Selección de Modo de Mensajería: Los ajustes del puente de mensajería ahora incluyen un selector de modo predeterminado, permitiendo que el agente responda con la personalidad adecuada al gestionar mensajes entrantes.
Mejoras
- Reintento por Límite de Tasa del Proveedor: Todos los proveedores de LLM ahora reintentan automáticamente ante respuestas 429 (límite de tasa) y 529 (sobrecarga) con un retroceso exponencial, en lugar de fallar inmediatamente. Hasta 3 reintentos con jitter.
- Coincidencia de Superconjunto de Scopes de Google OAuth: Los scopes de escritura ahora satisfacen los requisitos de los scopes de lectura (por ejemplo,
drivecubredrive.readonly). Evita re-autorizaciones innecesarias cuando ya se ha concedido un scope más amplio. - Autenticación Inicial de Scope Completo en BYOA: Cuando se requiere una Conexión Privada, el flujo de autenticación inicial ahora solicita todos los scopes necesarios por adelantado en lugar de preguntar dos veces (una para lo básico y otra para lo ampliado).
- Promoción de Error 404 de Google a Acceso Ampliado: Cuando una conexión BYOA recibe un error 404 en un archivo de Google Workspace, el error se promociona a un aviso de acceso ampliado en lugar de un mensaje de error sin salida.
- Sincronización Privada de Credenciales de Mensajería: Las credenciales del puente de mensajería ahora se sincronizan entre dispositivos a través de una sincronización privada con cifrado E2E en lugar de ser específicas del dispositivo. El manifiesto de sincronización se ha actualizado a la v10.
- Tiempo de Espera Extendido para OAuth: Los flujos de OAuth para BYOA y acceso ampliado ahora tienen un tiempo de espera de 5 minutos (frente a los 2 minutos anteriores), otorgando a los usuarios tiempo suficiente para completar los pasos en la Google Cloud Console.
- Firma del Sparkle Framework: Las compilaciones de distribución para macOS ahora firman correctamente los binarios anidados del framework Sparkle en orden de adentro hacia afuera, solucionando fallos de notarización.
- Empaquetado de Binarios de Node en Tauri: Las configuraciones de Tauri ahora empaquetan el binario de Node.js como un recurso para la ejecución de sidecars en Windows/Linux.
- Búsqueda en Ajustes de Mensajería: La sección del puente de mensajería ahora se puede encontrar a través de la barra de búsqueda de ajustes con palabras clave como "whatsapp", "telegram", "webhook".
- Reenvío de Ajustes al Relay: Los cambios guardados en los ajustes ahora se reenvían al servidor relay a través del puente WebSocket, asegurando que las credenciales de mensajería y otros cambios de configuración lleguen al archivo de estado del servidor.
Corrección de Errores
- Slate Currency vs Math: Las cantidades en dólares como
$9/moen tablas de markdown ya no se malinterpretan como delimitadores de matemáticas inline de LaTeX. La regex de matemáticas ahora respeta los símbolos de moneda escapados. - ToastProvider en Página de Conversación: Las pestañas de conversación emergentes carecían de
ToastProvider, lo que causaba que las funciones dependientes de notificaciones toast fallaran silenciosamente. El árbol de proveedores ahora coincide con el del panel lateral.
Versión 0.9.703 (14 de marzo de 2026)
Nuevas Funcionalidades
- Integración de Google Picker: Selector de archivos de Google Drive completo con un híbrido de ventana emergente/iframe, filtros de vista múltiple (Docs, Sheets, Slides, PDFs) y etiquetas de referencia de Drive en el compositor. Los archivos seleccionados a través de Google Picker reciben automáticamente acceso
drive.file. - Sincronización Nativa de Google Sheets: Abra Google Sheets en Slate con edición completa de ida y vuelta a nivel de celda. El códec de Sheets convierte los datos de la cuadrícula de la hoja de cálculo a tablas HTML de TipTap y viceversa, con detección de conflictos a través de
modifiedTimede Drive. Soporta lectura, actualizaciones de celdas por lotes y cambios estructurales (añadir/eliminar hojas, combinar celdas). - Vista de Solo Lectura de Google Slides: Las presentaciones de Google Slides se renderizan en Slate con miniaturas de diapositivas y contenido de texto extraído para facilitar la búsqueda.
- Obtención por Lotes de Gmail y Conversión a Markdown: La herramienta de Gmail ahora obtiene metadatos de mensajes por lotes (hasta 100 a la vez) en lugar de uno por uno, con una caché de nombres de etiquetas de 5 minutos y conversión automática del cuerpo de HTML a markdown para un consumo más limpio por parte del LLM.
- Superposición de Selección: El botón "Añadir al prompt" aparece al seleccionar texto en cualquier página web, permitiéndole añadir rápidamente el contenido seleccionado a la conversación.
- Gestor de Superposición Relay: Los comandos de superposición del agente ahora se enrutan a través de la extensión del navegador, permitiendo superposiciones de UI impulsadas por el agente en la página web activa.
- Selector de Modelo para Tareas Rápidas Integrado: La selección de modelo para tareas rápidas ahora está incrustada directamente en el menú desplegable del selector de modelos en lugar de un menú separado.
- Exportación de Slate a DOCX desde Google Drive: Los Google Docs cargados en Slate ahora se exportan como DOCX (vía
readFileContentAsBinary), activando el editor visual completo de TipTap con control de cambios en lugar de abrirse como markdown plano. - Asistente de Configuración de Private Connection: Asistente BYOA mejorado con un paso dedicado de "Añadir Usuario de Prueba" que coincide con el flujo actual de Google Cloud Console. Los subpasos de la pantalla de consentimiento ahora siguen el acordeón real de 4 pasos de Google. Las instrucciones por correo electrónico se personalizan cuando se conoce la identidad del usuario.
- Banner de Promoción de Private Connection: Cuando el agente necesita permisos ampliados de Google (Gmail, Calendar, etc.) y no existe una Private Connection, aparece un banner animado con una ruta de un solo clic hacia el asistente de configuración. El agente permanece en pausa mientras el usuario completa la configuración y se reanuda automáticamente cuando se guarda la conexión.
- Advertencias de Fidelidad de Exportación: Antes de exportar un documento a un formato diferente (por ejemplo, de PDF a DOCX), un diálogo de fidelidad advierte sobre posibles pérdidas de formato con elementos categorizados por gravedad (información, advertencia, crítico).
- Extracción de Anotaciones de PDF: Las anotaciones de texto y marcas en PDF ahora se extraen y preservan durante el procesamiento y reconstrucción del documento.
- Sincronización de Calendario para Recordatorios: El modal de recordatorios ahora soporta la sincronización de calendario con control de acceso ampliado.
Mejoras
- Fidelidad de Sincronización de Google Docs: Mejora en la extracción de tramos de formato con coincidencia de etiquetas adecuada (maneja etiquetas de autocierre y anidamiento incorrecto) y detección de conflictos para ediciones concurrentes.
- Detección de Discrepancia de Cuenta en Sincronización Privada: El menú desplegable de cuenta en los ajustes de sincronización ahora detecta cuando el correo de sincronización configurado no coincide con ninguna cuenta de Google conectada y muestra un indicador de "no conectado" con la opción de cambiar.
- Nivel Efectivo de Teams/Enterprise: La validación de licencias ahora utiliza
effectiveTierde la delegación de equipo/empresa, asegurando el acceso correcto a las funciones cuando el nivel de un usuario se hereda de un plan de equipo. - "Private App" renombrada a "Private Connection": Todas las referencias de cara al usuario ahora utilizan "Private Connection" en lugar de "Private App", lo cual es más claro para los no desarrolladores que no asocian las integraciones OAuth con "apps".
- Alineación de Permisos de Google OAuth (
drive.file): Todos los permisos elevados de Google Drive (drive,drive.readonly,documents.readonly,spreadsheets.readonly,presentations.readonly) ahora se reemplazan con el permiso más restringidodrive.filepara usuarios que no son BYOA, cumpliendo con los requisitos de aplicaciones verificadas de Google. Los usuarios BYOA conservan los permisos completos. - Permisos de Gmail Visibles en el Selector de Alcance: Los permisos de lectura, redacción y modificación de Gmail ahora son visibles para todos los usuarios en el editor de Permisos de Google bajo "Permisos altamente sensibles" en lugar de estar ocultos solo para BYOA. Estos permisos se aprueban en la pantalla de consentimiento y se solicitan vía JIT cuando las herramientas de Gmail los necesitan.
- Recuperación de Consentimiento de Google Picker: Cuando los permisos de Google se revocan externamente (por ejemplo, desde la configuración de la Cuenta de Google), la aplicación ahora detecta automáticamente los permisos caducados, los invalida, vuelve a autorizar y reintenta, en lugar de fallar silenciosamente con errores 403.
- Guía del Agente para Google Drive: Los mensajes de error de herramientas y las sugerencias de resultados vacíos ahora instruyen al agente para que le pida al usuario que haga clic en el botón + en el compositor y seleccione Google Drive, en lugar de sugerir acciones de herramientas no disponibles.
- Selector de Drive en Slate Simplificado: La función "Cargar desde Google Drive" de Slate ahora carga archivos directamente, saltándose la pantalla de elección estilo panel lateral entre "Trabajar en Drive" vs "Añadir a la conversación".
- Logo Oficial de Google Drive: Las etiquetas de Drive y el menú de adjuntos ahora utilizan el logo oficial de Google Drive en lugar del triángulo verde genérico.
- Selector de Modelo Unificado: La selección del modelo auxiliar recae en el modelo predeterminado, con un único menú desplegable de modelos consolidado.
- Transferencia de Elementos No Textuales en DOCX: La reconstrucción de DOCX preserva elementos no textuales (imágenes, gráficos, objetos incrustados) que no forman parte del flujo de edición de texto.
- Edición de Líneas de Múltiples Segmentos en PDF: El editor WYSIWYG de PDF maneja líneas divididas en múltiples segmentos de texto.
- Aumento del Límite de Tasa de Autenticación: El límite de tasa del endpoint de autenticación aumentó de 10/min a 30/min para dar cabida a los intercambios rápidos de tokens OAuth durante la configuración de BYOA.
- Reclasificación del Endpoint de Token OAuth: El intercambio de tokens OAuth se movió del grupo de límite de tasa de autenticación al general, evitando la ralentización durante los flujos de autorización de múltiples permisos.
Corrección de Errores
- Apilamiento de Modales en iOS: Se corrigió el cierre inesperado al presentar selectores de archivos o superposiciones de Slate mientras ya se mostraba otro modal (por ejemplo, la superposición del navegador). Los selectores y superposiciones ahora se presentan en el controlador de vista superior.
- Validación de Rango de Líneas en Slate:
get_slate_contentahora devuelve un error claro cuandostartLineestá más allá de la longitud del documento en lugar de devolver contenido vacío silenciosamente. - Salto de Directorio en el Servidor (Path Traversal): Las claves de almacenamiento ahora se validan contra escapes de directorio, previniendo ataques de salto de directorio en el endpoint de almacenamiento de sincronización.
- Límite de Regex para Bloqueadores de Anuncios: El convertidor DNR ahora limita las reglas regex al límite de 1000 reglas de Chrome y descarta cuantificadores acotados grandes que exceden el límite de memoria de RE2, evitando fallos en la instalación de la extensión.
- Tiempo de Espera de OAuth en Acceso Ampliado: Se corrigió el tiempo de espera de 120 segundos cuando el agente necesita permisos ampliados de Google (Gmail, Calendar). La espera de OAuth pendiente ahora se extiende a 5 minutos para la configuración de BYOA, y completar la conexión en los ajustes reanuda automáticamente al agente pausado.
- Bloqueos de la Interfaz de Chat: Se corrigieron intervalos asíncronos superpuestos y errores de difusión silenciosos que podían congelar la interfaz de chat.
- Lote de Descarga de Sincronización en la Nube: Se corrigieron errores de comprobación de nulos de TypeScript en el manejador de lotes de descarga de sincronización en la nube.
- Importaciones Dinámicas en Service Worker: Se convirtieron las importaciones dinámicas en importaciones estáticas para la compatibilidad con el service worker de Chrome MV3.
- Cumplimiento de Permisos Solo BYOA: Las acciones
convert_to_google_docyconvert_to_google_sheetahora requieren correctamente solodrive.fileen lugar de permisos amplios de escritura de editor. - Formato de Etiqueta de Drive: Formato de tres segmentos para las etiquetas de referencia de Drive con control de permisos adecuado solo para BYOA.
- CORS en Google Picker: El selector ahora se aloja en el relay privado para resolver problemas de origen cruzado con el flujo de alcance de la ventana emergente.
Versión 0.9.701 (6 de marzo de 2025)
Mejoras
- Indicador de Ventana de Contexto de Ollama: El círculo de uso de la ventana de contexto ahora se renderiza para los modelos de Ollama consultando el endpoint
/api/showparanum_ctx, en lugar de depender de la lista de modelos de OpenRouter que no incluye modelos locales. - Llamada a Herramientas de Ollama: Se corrigió la selección dinámica de herramientas para Ollama: pasa
tool_choicea la API (soportado desde Ollama v0.5.1), desactiva el modo de pensamiento cuando las herramientas están activas para evitar JSON corrupto, y recurre a un modelo ayudante ligero sin transmisión cuando el modelo principal no admite llamadas a herramientas. - Caché de Razonamiento de OpenRouter: Se corrigió que el texto de razonamiento se borrara prematuramente por el proveedor de transmisión. El ciclo de vida de la caché ahora es propiedad de
agent-runneren los límites de iteración, de forma consistente con los proveedores de Anthropic y Google. - Fiabilidad WYSIWYG de PDF: La alineación de texto global maneja los operadores de división de PDF.js a través de múltiples TextItems. Edición de bloques desactivada en tramos no coincidentes (texto de anotación/encabezado) para evitar errores de exportación. La decodificación CMap de 2 bytes ya no corrompe los PDF generados por Word con fuentes ASCII de 1 byte. La comprobación de límites de coincidencia de operadores evita índices fuera de rango en elementos de texto vacíos.
- Detección de Plataforma de Escritorio: El selector dinámico de herramientas usa la capacidad
localFolderSyncen lugar decaiiooReminderspara la detección de escritorio, yappleScript/appleNotesen lugar de Calendar/Reminders para la detección de macOS (Calendar/Reminders son multi-Apple vía EventKit).
Version 0.9.700 (March 5, 2025)
New Features
- File Manager: Sistema completo de gestión de archivos con carpetas anidadas, etiquetas de usuario, destacados y una interfaz de usuario dedicada para el File Manager. Organice archivos adjuntos en jerarquías de carpetas, filtre por tipo (capturas de pantalla, imágenes de AI, fotos), busque, ordene y visualice archivos en modo cuadrícula o lista. El etiquetado automático de hilos vincula los archivos con las conversaciones. Soporte de sincronización privada mediante manifest v9.
- Local Folder Sync: Sincronización bidireccional entre carpetas del sistema de archivos local y el File Manager. La resincronización impulsada por mutaciones propaga automáticamente eliminaciones, eliminaciones masivas y movimientos al disco con un debounce de 2 segundos. La detección de movimiento de subcarpetas reubica los archivos en el disco cuando se reorganizan en caiioo. Navegar en cualquier subcarpeta dentro de un árbol de sincronización activa la resincronización automática.
- Cross-Filetype Tracked Changes: Flujo de trabajo unificado de aceptar/rechazar en DOCX, PDF y Markdown. Las ediciones en DOCX ahora se registran como cambios realizados con el mismo motor de diferencias utilizado por Markdown y los slates de código. Los cambios realizados en PDF se integran con el editor visual. La acción
resolve_tracked_changespermite al agente aceptar o rechazar revisiones mediante programación. - PDF WYSIWYG Editing: Edición directa de texto en páginas PDF renderizadas con estilos adaptados al documento. La capa de texto vincula las ediciones con los operadores de flujo de contenido de origen a través de
textItemIndexpara una reconstrucción quirúrgica al exportar. Incluye una línea base de plainText para la detección de cambios. - DOCX Rendering Fidelity: Vista previa enriquecida de DOCX con alineación de párrafos, hipervínculos, color/tamaño de fuente, interlineado, sangría y sombreado de celdas de tabla. La vista de código muestra la conversión a markdown para un consumo de tokens eficiente por parte del LLM.
- Universal Messaging (solo pruebas internas): Envíe y reciba mensajes a través de WhatsApp, Telegram y Slack con privacidad local-first. El agente puede redactar y enviar mensajes, listar conversaciones y responder a hilos, todo enrutado a través de su propio dispositivo.
- Google Meet Integration: Herramienta de recuperación de reuniones multi-acción con
list_meetings(descubrir reuniones recientes con filtrado por rango de fechas) yget_meeting(obtener transcripciones). Implementado a través de todo el pipeline de OAuth/JIT/aprobación de alcance con soporte para el almacén de credenciales. - Gmail Send Email: Envío directo de correos electrónicos a través de la API de Gmail, restringido tras la aprobación de herramientas de alto riesgo. Las anulaciones de nivel de riesgo por acción permiten que
send_emailrequiera confirmación explícita, mientras que las acciones de borrador permanecen en riesgo medio. - Microsoft BYOA: Soporte de Bring Your Own App para Microsoft 365. Registre aplicaciones en Azure AD para conexiones OAuth de Microsoft. Registro BYOA multi-proveedor (Google + Microsoft) con soporte para ID de inquilino y un asistente de configuración de 3 pasos en Azure Portal.
- Poe Provider: Nueva integración de proveedor LLM para Poe, con listado de modelos, selector de modelos agrupados por proveedor, detección de capacidades de visión/tools/reasoning y visualización de precios.
- What's New Dialog: El pipeline de contenido servido por API entrega notas de lanzamiento y páginas de la guía del usuario. El diálogo asíncrono "What's New" muestra los aspectos destacados de la versión al actualizar.
- Private Sync Account Selector: Elija qué cuenta de Google usar para la sincronización privada, en lugar de usar la cuenta principal por defecto.
- Native TipTap Diff Marks: Se reemplazó la capa de renderizado independiente de marked.js para vistas previas de revisión de AI con marcas nativas de ProseMirror (DiffAdded/DiffRemoved). Las revisiones ahora se renderizan como cambios realizados en línea con tipografía consistente, además de objetivos de aceptar/rechazar a nivel de fragmento.
- Mermaid Diagrams: Renderizado de diagramas Mermaid en vivo en bloques de código dentro del modo de vista previa TipTap de Slate.
- Fuzzy Section Search in Help Tool: La herramienta de ayuda ahora admite coincidencias difusas al buscar secciones específicas dentro de las páginas de documentación.
Improvements
- File Manager UX Polish: Indicadores de iconos de sincronización de carpetas, diálogos de confirmación de eliminación, selección de rango con shift-click, la barra de herramientas se ajusta en lugar de desbordarse en anchuras estrechas y persistencia de etiquetas corregida tras las recargas.
- Responsive Composer Layout: El diseño flex de tres zonas evita que el botón de nuevo hilo sea desplazado fuera de la pantalla en anchuras estrechas. Los selectores de modo y modelo utilizan puntos de interrupción escalonados para ocultar texto. Los iconos personalizados de agente y chip de AI reemplazan los valores predeterminados genéricos.
- Settings UX: Se reordenaron las secciones para un mejor flujo (Personalization → Credentials → Tool Approvals → Agent Modes → Tool Configuration → Skills Library → Tool Servers → Document Processing → Voice).
- Revision State Integrity: Se corrigió la corrupción al eliminar grandes bloques de contenido durante revisiones activas de AI: inmutabilidad de sourceContent, el umbral de reubicación de fragmentos se aumentó a 0.7, los fragmentos obsoletos se rechazan automáticamente y comprobaciones de integridad del historial de versiones.
- Agent Loop Reliability: Se corrigió una condición de carrera del controlador de aborto donde las ejecuciones antiguas podían eliminar el controlador de la nueva ejecución. La señal de cancelación ahora se propaga a las herramientas en cola. Los estados de ejecución huérfanos emiten errores en lugar de dejar mensajes en blanco.
- Interjection Handling: Recorrido de
getActiveBranchMessagesunificado en el servidor y la interfaz de usuario para omitir interjecciones de manera consistente. Se corrigió la desaparición de la respuesta después del seguimiento cuando el parentId del streaming apuntaba a la interjección en lugar de al mensaje del usuario. - macOS Native Stability: Se corrigió la condición de carrera al reiniciar con el seguimiento de época del proceso, fuga de URLSession al reconectar y carrera de datos de LineBuffer entre el manejador de tubería y la parada.
- Google Sheets Fix:
create_tableahora escribe los nombres de los encabezados de las columnas en lugar de dejar la primera fila en blanco. - Middleware Cleanup: Se extrajo el middleware
requireAuthde 10 comprobaciones de autenticación en línea en apple-routes, mcp-routes y attachment-routes. - Image Type Filtering: El File Manager distingue entre capturas de pantalla, imágenes generadas por AI y fotos de usuario con opciones de filtro separadas e iconos distintos.
- Mode/Model Picker Parity: Se igualó el grosor de la fuente y el trazo del icono entre el selector de modo y el selector de modelo.
- Beta Tier Gating: El almacén de credenciales restringe las funciones beta según las comprobaciones de nivel.
- CIDFont Re-Encoding: La reconstrucción de PDF admite la codificación CIDFont con tablas ToUnicode CMap y respaldo de identidad para caracteres que no están en el mapa.
- PDF Export Renamed: "Download" se renombró a "Export" en todo el flujo de trabajo de PDF para mayor claridad.
Bug Fixes
- PDF Text Disappearing: Se corrigió la desaparición del texto en la vista PDF al perder el foco y el contenido confuso al exportar desde la edición WYSIWYG.
- PDF Tracked Changes Routing: Se evitó que los cambios realizados en PDF se enrutaran a través del motor de diferencias unificado, lo que corrompía los datos del operador específicos de PDF.
- PDF Export Integrity: La descarga de PDF ahora falla explícitamente con diagnósticos en lugar de recurrir silenciosamente a la exportación a markdown.
- Markdown Table Line Breaks: Las etiquetas
<br>en las tablas de markdown ahora se renderizan como saltos de línea reales en lugar de texto literal. - DOCX Tracked Deletions Preserved: Se corrigió la eliminación de las eliminaciones registradas en DOCX al cambiar entre la vista visual y la de código.
- Tracked Changes on Stored Markdown: Se corrigió que
propose_changeen slates de markdown no mostrara líneas rojas cuando se cargaba desde el almacenamiento. - Reject Reverts Content:
resolve_tracked_changescon rechazo ahora revierte correctamente el contenido para slates de markdown y código. - Slate Save Loop: Se corrigió el bucle de guardado infinito activado cuando el seguimiento de cambios estaba activo.
- Messaging Stability: Se corrigieron el enrutamiento, el hilo de respuestas, el manejo de perfiles, la resiliencia de la cola, las firmas de webhook, la sanitización del remitente y los límites de carga útil.
Versión 0.9.662 (27 de febrero de 2025)
Nuevas Funciones
- Bring Your Own App (BYOA): Utilice sus propias credenciales de Google OAuth en lugar de la aplicación integrada de caiioo. El soporte multi-app permite que los equipos compartan un único cliente OAuth en toda la organización manteniendo las claves API individuales. Las conexiones BYOA detectan automáticamente tokens caducados y solicitan la reautenticación.
- Navegación por Wikilinks: Wikilinks de doble corchete al estilo Obsidian entre documentos de Slate para construir bases de conocimiento interconectadas. Haga clic en un wikilink para navegar entre Slates instantáneamente.
- Menú de Skills: Inserción de skills mediante la tecla Tab, menú desplegable de altura dinámica, edición en línea con chips de variables y un componente SkillForm compartido para un CRUD completo desde el compositor.
- Descarga DOCX: Descargue documentos de texto y markdown de Slate como archivos DOCX preservando el control de cambios.
- Autocompletado de Tablas:
insert_componentahora rellena automáticamente las celdas de las tablas a partir de datos estructurados, eliminando las tablas con marcadores de posición vacíos. - Gemini 3.1 Flash: Añadido como opción de modelo generador de imágenes junto con los modelos Gemini, FLUX y Seedream existentes.
- Guardado en Google Drive para todas las cuentas: El guardado en Google Drive ahora está disponible para cualquier cuenta de Google conectada, no solo para la principal.
- Motor de Diff Unificado: Reescritura completa del sistema de diff para el seguimiento de cambios de Slate (fases 0–7) con seguridad TOCTOU, almacenamiento en caché, widgets de aceptar/rechazar por cada cambio y soporte de toque para alternar en dispositivos móviles.
Mejoras
- Sincronización Privada Adaptativa: La tasa de sondeo de sincronización se ajusta dinámicamente según la actividad. La optimización del bloqueo de solo descarga reduce los conflictos.
- Captura de Email en OAuth: Google OAuth siempre incluye alcances de identidad para que el email del usuario se capture en cada conexión, solucionando el problema de emails en blanco en algunas cuentas.
- Refuerzo de Seguridad: Se han reforzado los flujos OAuth PKCE, los límites de los subprocesos del agente y el bloqueo por fuerza bruta por cuenta para intentos fallidos de autenticación repetidos.
- Diseño de Chips del Navegador: Los chips del selector de navegador son más pequeños y se ajustan a la línea en lugar de desbordar el contenedor.
- Proveedores de Imágenes Basados en Registro: Se reemplazó la lista de proveedores de imágenes codificada estáticamente por un registro dinámico, facilitando la adición de nuevos modelos.
- Pipeline de i18n de Contenido: Sincronización de contenido unificada mediante seguimiento de hash para todas las páginas de documentación con soporte de traducción incremental.
Corrección de Errores
- Expresiones Matemáticas en Vista Previa: Se corrigió la corrupción de expresiones matemáticas al cambiar de la vista previa de TipTap a la vista de código.
- Wikilinks en Vista Previa: Se corrigió la eliminación de la sintaxis de wikilink al alternar entre la vista previa de TipTap y la vista de código.
- Desaparición de Mensajes de Hilos: Se corrigió la eliminación de mensajes de hilos por STATE_PATCH o su desaparición al cambiar de modelo a mitad de una conversación.
- Huérfanos por Interjección: Se corrigieron los parentIds huérfanos tras el filtrado de mensajes de interjección que causaban errores de renderizado.
- Bucle Infinito en Sincronización Privada: Se resolvió el bucle infinito de sincronización causado por conflictos de reloj en elementos de colección concurrentes y la polución del prefijo thread_data_.
- Casos Críticos de BYOA: Se corrigió que la configuración BYOA no se restaurara al limpiar, las colisiones de guardado asíncrono, el uso de ventanas emergentes de localhost inactivas en la extensión en lugar de launchWebAuthFlow, y la precedencia de issuedByClientId obsoleta.
- Recuperación de Alcance en Sincronización Privada: Se corrigió el fallo silencioso del desbloqueo de sincronización privada cuando los alcances de Google Drive habían expirado o faltaban.
- Skills Duplicadas: Se evitó que aparecieran skills duplicadas después de las fusiones de sincronización privada.
- Enrutamiento de Seguimiento de Cambios: Se conectaron
get_tracked_changesyget_commentsen el enrutamiento de acciones de SlateTool para que el agente pueda leer el estado de las revisiones. - Origen de Descarga DOCX: Se corrigió que downloadAsDocx utilizara contenidos de artefactos obsoletos en lugar del estado del editor en vivo.
- Abreviatura Inteligente de Nombres de Modelos: Se corrigió el desbordamiento de nombres de modelos largos en el selector compacto mediante abreviaturas inteligentes.
- Renderizado de Enlaces Markdown: Se corrigió el bloqueo de URLs chrome-extension: y Caiioo: en los enlaces markdown renderizados.
- Velocidad de Creación de Hilos: Se redujo a la mitad el tiempo de creación de hilos eliminando búsquedas redundantes en la cascada de ajustes.
- Título de Pestaña de Chrome: Se restauró el título dinámico de la pestaña de Chrome basado en el hilo de conversación activo.
- Tokens de Saludo Adaptativos: Se aumentó max_tokens para los saludos adaptativos para evitar el truncamiento en modelos de razonamiento.
Versión 0.9.661 (25 de febrero de 2025)
Nuevas Funcionalidades
- Interjección del Agente: Guíe a la AI a mitad de la ejecución escribiendo un mensaje y presionando Enter mientras está trabajando. El agente verá su guía en su próximo punto de decisión y ajustará el rumbo; no es necesario cancelar y reiniciar. Aparece un botón de envío con distintivo ámbar junto al botón de parada cuando tiene texto para enviar.
- Gestión de Herramientas API: La herramienta de integración de API ahora admite
save_tool,list_toolsydelete_toolcomo acciones de primer nivel, lo que facilita la gestión de las API descubiertas por el agente directamente desde las conversaciones. Los usuarios gratuitos ven GET y list_tools; los usuarios Pro obtienen el conjunto completo. - Contador de Tokens en Vivo: El uso de tokens y el coste ahora se actualizan en tiempo real durante el streaming, mostrándose en el pie de cada mensaje. Los costes especializados (generación de imágenes, búsqueda web) se integran incrementalmente a medida que se completa cada herramienta.
- Auto-expansión de Tarjetas de Herramientas: Las tarjetas de herramientas se expanden automáticamente cuando comienzan a recibir argumentos de streaming o necesitan aprobación, y se colapsan automáticamente al completarse con éxito. Los errores y las herramientas denegadas permanecen expandidos para su revisión.
- Editor de Diferencias Monaco: Las revisiones de código en Slate ahora utilizan el editor de diferencias integrado nativo de Monaco con botones de aceptar/rechazar por cambio, reemplazando el sistema de decoración personalizado anterior.
Mejoras
- Recuperación de Autenticación de Private Sync: Los errores de sincronización privada por tokens de Google expirados o revocados ahora muestran botones accionables de "Reconectar Google" y "Otorgar Permisos" en lugar de un mensaje de error pasivo. La reconexión solicita los permisos correctos de Drive y preselecciona la cuenta de Google adecuada.
- Multicuenta en Private Sync: Private sync ahora se autentica con la cuenta de Google que coincide con el correo electrónico de configuración en lugar de recurrir a cualquier cuenta que se conectara primero. Corrige la sincronización en el Drive incorrecto cuando hay varias cuentas de Google conectadas.
- Renovación de Marca: Nueva paleta de colores azul río y gris roca derivada del logotipo de Caiioo, reemplazando el tema púrpura anterior en toda la aplicación y el sitio web.
- Seguridad OAuth: Se han eliminado los secretos de cliente OAuth de Google, GitHub y Slack del paquete de la extensión. El intercambio de tokens ahora se enruta a través de un proxy de relevo seguro de Cloudflare, eliminando los secretos del código del cliente.
- Inicio más Rápido: El contenido de los archivos adjuntos (imágenes, texto extraído) ahora se carga bajo demanda en lugar de al arrancar, reduciendo significativamente el tiempo de carga inicial para conversaciones con muchos adjuntos.
- Streaming más Rápido: El uso de la ventana de contexto ahora se transmite a través de la ruta de difusión rápida en lugar de pasar por el almacenamiento, ofreciendo actualizaciones en tiempo real sin I/O asíncrono por ciclo del agente.
- Velocidad de Private Sync: El caché de IDs de archivos de Google Drive se mantiene entre reinicios, eliminando una llamada a la API de listado de archivos completo en el primer ciclo de sincronización.
- Ruta de Renderizado de Streaming Unificada: El contenido en streaming y el final ahora fluyen a través de una única ruta de renderizado, eliminando el parpadeo cuando se completa la generación y preservando los mensajes de interjección.
- Cambio entre Modelos: Cambiar entre proveedores de AI a mitad de un hilo (por ejemplo, de Gemini a Claude) ya no causa errores de "Firma inválida en bloque de pensamiento". Los artefactos de razonamiento externos se aplanan automáticamente a texto narrativo, preservando el contexto sin firmas criptográficas incompatibles.
- Guía de Herramientas Deshabilitadas: Cuando la AI intenta usar una herramienta deshabilitada, ahora recibe sugerencias accionables (herramientas habilitadas similares, cómo habilitarlas) en lugar de un error genérico de "no encontrado".
- Diseño de Composer Responsivo: La barra de herramientas del Composer utiliza una divulgación progresiva escalonada: el selector de modo, el selector de modelo, los ajustes, la agenda y los iconos de ayuda aparecen según el espacio disponible en lugar de recortarse.
- Codificación por Colores en Ajustes: Las secciones de ajustes ahora utilizan un sistema de 3 colores: tinte de acento para secciones de personalización y neutrales alternos para el resto, para una agrupación visual más clara.
- Errores de Onboarding: La provisión de claves gratuitas ahora muestra mensajes de error descriptivos debajo de los botones de acción en lugar de fallar silenciosamente.
- Ajustes del Proveedor de AI: Se ha renombrado la sección "API & Provider" a "AI Provider" para mayor claridad.
- Prueba Gratuita Extendida: El periodo de prueba Pro se ha extendido de 7 a 14 días, dando a los nuevos usuarios más tiempo para explorar las funciones Pro.
- Cambio de Rama Optimista: Cambiar entre ramas de mensajes y recargar mensajes ahora actualiza la interfaz de usuario instantáneamente en lugar de esperar a los ciclos de almacenamiento.
- Configuración de Herramientas MCP: Autocorrección de esquemas y configuración mejorada de herramientas MCP para una configuración de herramientas más fiable.
Corrección de Errores
- Costes por Mensaje: Los costes de los mensajes individuales ahora coinciden acumulativamente con el total del encabezado del hilo. Los costes de Helper, OCR, generación de imágenes y búsqueda se atribuyen a mensajes individuales en lugar de solo al resumen del hilo.
- Renderizado de Interjecciones: Los mensajes de interjección ahora se renderizan como anotaciones ámbar compactas en línea en la línea de tiempo del asistente en lugar de perderse cuando se completa la generación.
- Detección de Bucles: Se ha corregido la detección de repetición de falsos positivos en respuestas con muchas citas donde las URL se repiten naturalmente más de 3 veces.
- Alineación de Diferencias en Slate: Se ha corregido la desalineación de líneas rojas/verdes en el modo de vista previa para fragmentos multilínea donde el bucle de superposición avanzaba solo 1 línea independientemente de la extensión del fragmento.
- Posiciones de Eliminación en Slate: Se ha corregido el doble conteo del desplazamiento de inserción que causaba que las eliminaciones se renderizaran después de sus inserciones emparejadas en lugar de antes.
- Correcciones de Private Sync: Se ha corregido que la solicitud de alcance JIT no se activara en fragmentos de código divididos y el bucle de sincronización infinito después de las subidas.
- Flujo de Onboarding: El flujo OAuth ahora completa el onboarding correctamente, se admiten IDs de modo con guiones en la detección de disparadores y 0 días restantes ya no se convierte a nulo.
- Restablecimiento de Contraseña: Restablecer la contraseña mediante el enlace de correo electrónico ahora verifica la dirección de correo electrónico. Se ha añadido un endpoint de reenvío de verificación para usuarios con correos de verificación caducados.
- Nivel de Licencia: Los usuarios con un nivel otorgado por el administrador pero sin una fila de licencia ya no se quedan bloqueados en la barrera de actualización.
- Desplazamiento en Ajustes: Al hacer clic en el icono del cerebro para una página aprendida, ahora se desplaza a la sección de ajustes correcta en lugar de detenerse antes debido a las secciones cargadas de forma diferida arriba.
- Eliminación de Monaco: Se ha corregido el orden de eliminación del modelo del editor de diferencias para evitar referencias colgantes y que Monaco se vea a través de la vista previa de TipTap.
- Objetivo de Guías: Los pasos de las guías interactivas ahora omiten elementos ocultos por consultas de contenedor responsivas en lugar de resaltar un píxel de 16x16 en la esquina superior izquierda.
- Kokoro TTS: Se ha corregido el texto a voz que no funcionaba en la extensión; la detección del tiempo de ejecución de ONNX fallaba en documentos fuera de pantalla, causando errores de "no se encontró un backend disponible".
- Guardado de Herramientas API Personalizadas: Se ha corregido el error al guardar las API descubiertas por el agente como herramientas personalizadas en la extensión debido a la prohibición de
import()dinámico en el contexto del Service Worker. - Rendimiento de Arranque: Se ha corregido la migración de sesión que se ejecutaba en cada acceso a los ajustes (más de 20 veces al arrancar), causando escrituras en disco innecesarias y un inicio más lento.
- Difusiones de Almacenamiento Duplicadas: Se han suprimido las notificaciones dobles de cambio de almacenamiento en modo relay/server que podían causar parpadeo en la interfaz de usuario.
- Recuperación de Textura Cairn: Se ha corregido el fallo en la generación de texturas cuando el caché del mundo en memoria se desalojaba entre la carga y el renderizado, y se ha corregido que el renderizador mostrara negro para texturas respaldadas por adjuntos.
- Parches de Seguridad: Se han actualizado fast-xml-parser (DoS mediante expansión de entidades DOCTYPE) y tar (vulnerabilidad de escape de hardlink).
- Cumplimiento de MV3: Se ha reemplazado vega-embed cargado por CDN con paquetes de proveedores locales, asegurando que todo el código de renderizado de gráficos pase la política de código remoto de Chrome Web Store.
- Gráficos Vega-Lite: La AI ahora genera visualizaciones Vega-Lite directamente en Slate en lugar de HTML cargado por CDN, permitiendo gráficos interactivos sin dependencias de scripts remotos.
- Guardado en Google Drive: Se han corregido los errores 403 al guardar en Google Drive desde Slate causados por comprobaciones de alcance OAuth obsoletas en controladores de Drive que no son del agente.
- Onboarding de Nuevos Usuarios: Se ha corregido que la pantalla de onboarding se omitiera por completo para los nuevos usuarios cuando se aprovisionaba automáticamente una clave API durante el inicio de sesión.
- Ventana Emergente OAuth de OpenRouter: Se ha corregido el indicador de carga "Connecting..." que se quedaba bloqueado indefinidamente cuando los bloqueadores de ventanas emergentes cerraban silenciosamente la ventana de OAuth.
- Texto del Banner de Prueba: El banner de prueba ya no afirma que los modelos están restringidos por nivel; se ha actualizado para describir con precisión las funciones Pro (acceso de escritura, generación de imágenes, modos personalizados).
- Barra de Herramientas de Revisión DOCX: Se ha corregido el parpadeo de la barra de herramientas al mostrar los controles de revisión de documentos al posponer el desplazamiento hasta la visibilidad inicial.
- Superposición de Añadir al Prompt: Se ha corregido el logotipo de la superposición bloqueado por la Content Security Policy y la opacidad del fondo que no coincidía con el tema.
- Estado de Edición/Recarga de Mensajes: Se ha corregido el estado en memoria que quedaba obsoleto después de editar un mensaje, recargar una respuesta o cambiar de rama.
- Bloqueo de Inicio de Sesión en Servidor: Se ha corregido el fallo de las operaciones de almacenamiento WebSocket durante el flujo de inicio de sesión en el servidor. La autenticación ahora está desacoplada para que la sesión local funcione inmediatamente mientras la identidad del servidor se resuelve en segundo plano.
- Bloqueo de Conexión WebSocket: Se ha corregido una condición de carrera donde AUTH_STATE: ready llegaba durante la conexión inicial de WebSocket y podía dejar huérfana la promesa de autenticación, impidiendo que la conexión se completara.
Versión 0.9.655 (19 de febrero de 2025)
Nuevas Funciones
- Integración con Slack: Conecte su espacio de trabajo de Slack para habilitar herramientas de Slack impulsadas por IA con autorización completa OAuth V2
- Credenciales de Herramientas de API: Las API descubiertas por el agente ahora se pueden guardar como herramientas MCP personalizadas con credenciales almacenadas, lo que permite su reutilización en todas las conversaciones
- Insignia de API Guardada: Las herramientas de API creadas por el agente muestran una insignia de "API guardada" en la configuración para una fácil identificación
- Importación de Conversaciones: Importe conversaciones desde ChatGPT, Claude, Gemini, Perplexity y Grok; cargue su archivo de exportación y Caiioo lo convertirá con el historial completo de mensajes, archivos adjuntos y metadatos
Mejoras
- Anidamiento de API Aprendidas: Las herramientas de API aprendidas ahora se agrupan bajo una sección plegable en la configuración para una organización más limpia
- Branding de Caiioo: Las herramientas integradas ahora muestran el icono de Caiioo para una consistencia visual
- Enlaces Conscientes del Navegador: Las URL abiertas por el agente ahora se inician en el navegador que haya seleccionado en la configuración
- Carga de Slate Cloud: Cargar un documento de Slate desde Google Drive ahora activa un aviso de OAuth JIT en lugar de fallar con un error críptico
Corrección de Errores
- Edición de DOCX: Se corrigió la coincidencia de expresiones regulares de ejecución de párrafos en tramos anidados, que causaba corrupción de contenido al editar texto DOCX formateado
- Seguridad de Buscar/Reemplazar: Se restauró la protección de patrones HTML estructurales perdida durante la refactorización; evita que las ediciones corrompan el marcado interno de XLSX/DOCX
- Bucle de Aprobación de Herramientas: Se corrigió una condición de carrera que causaba avisos de aprobación repetidos para la misma herramienta dentro de una sola ejecución del agente
- Identidad Caducada: Se corrigió que la identidad de usuario caducada no se borrara en el error 401 durante la sincronización de la licencia, con escape de cierre de sesión en la incorporación de usuarios recurrentes
Versión 0.9.651 (17 de febrero de 2025)
Nuevas Funcionalidades
- Permisos de Privilegio Mínimo: Las herramientas de Google Workspace ahora solicitan solo los scopes exactos necesarios para cada acción en lugar de un acceso amplio. La lectura de correos electrónicos solicita solo lectura; la creación de eventos solicita únicamente acceso de escritura en el calendario.
- Diálogo de Permisos Mejorado: El diálogo de autorización just-in-time muestra exactamente qué permisos se están solicitando, por qué son necesarios y si la operación es de solo lectura o de lectura y escritura.
- Selector de Permisos: Al conectar manualmente una cuenta de Google, puede elegir qué servicios (Calendar, Gmail, Drive, Docs, Sheets, Slides) y niveles de acceso (solo lectura frente a lectura y escritura) otorgar por adelantado. Botón de Editar Permisos en las conexiones existentes.
- Resultados de Imagen: Las imágenes generadas y las capturas de pantalla ahora se renderizan de forma destacada entre los pasos del proceso colapsados y la respuesta final, eliminando la necesidad de expandir las llamadas a herramientas para ver el resultado visual.
Mejoras
- Seguridad de Private Sync: Las ediciones concurrentes ahora se descargan para su fusión en lugar de cargarse, la actualización del bloqueo verifica la propiedad y la fusión del manifiesto evita la pérdida de datos por operaciones de papelera prematuras.
- P2P Sync Eliminado: Se eliminó la sincronización en tiempo real P2P, eliminando más de 100 MB de tráfico WebSocket innecesario y mejorando el rendimiento de la extensión.
- Rendimiento de Ajustes: Memoización del panel de ajustes y aislamiento del contexto de colapso para un renderizado más rápido.
- Renderizado de DOCX: Mejora en el renderizado de párrafos, numeración y soporte de estilos en el analizador de documentos.
Corrección de Errores
- Scope de Google Docs: Se corrigió el error de "insufficient authentication scopes" al indexar Google Docs —
index_documentrequería scope de escritura para rangos con nombre. - Lectura de Google Docs: Se corrigió el fallo de
read_documentyget_document_infocuando solo se otorgaban scopes de Docs — estas acciones también requieren acceso de lectura a Drive. - Copia de Calendario: Se corrigió la acción
copy_eventque faltaba en el registro de scopes, lo que impedía las solicitudes de permiso JIT. - Persistencia de API Key: Se corrigió la pérdida silenciosa de la API Key de BYOK cuando
saveCustomModeinterrumpía la ruta de guardado de ajustes durante la activación de la prueba Pro. - Conflicto de Recarga de Ajustes: Se corrigió el borrado de la API Key no guardada cuando al colapsar/expandir secciones de ajustes se activaba un ciclo de recarga de almacenamiento.
- Cancelación de Chrome Identity: Se corrigió que la cancelación del usuario durante las solicitudes de scope incremental no se distinguiera de los errores, y el método de autenticación ahora transiciona correctamente tras obtener un token de actualización OAuth web.
- Sobrescritura de Private Sync: Se corrigió que el private sync sobrescribiera turnos recientes cuando ocurrían ediciones concurrentes.
- Capturas de Pantalla del Viewport: Se dejó de mostrar las capturas de pantalla del viewport por encima del texto de la respuesta final.
- Coordinación del Agente: Se corrigieron 7 problemas relacionados con la coordinación de turnos, percepción y gestión de estado.
- Control de Cambios: Se corrigió el modo de control de cambios que se rompía tras la descomposición de slate debido a la desincronización de variables de estado dual.
- Administrador de Archivos: Las acciones de eliminar y descargar ahora están disponibles en todos los modos, no solo para archivos huérfanos.
- Nombres de Herramientas MCP: Se corrigió que las herramientas usaran IDs internos del servidor en lugar de nombres legibles para humanos.
- Herramienta Agenda: Se corrigió que la tarjeta de sincronización siempre mostrara permisos faltantes; ahora está conectada al sistema de conexión Google OAuth.
Versión 0.9.642 (16 de febrero de 2025)
Mejoras
- Creación de nuevos documentos: Los nuevos archivos DOCX, XLSX, PDF y RTF creados desde el menú desplegable "Nuevo archivo" ahora son totalmente editables con soporte para control de cambios y formato adecuado
- Estabilidad de Gemini: Se agregó detección de repetición de razonamiento para romper automáticamente los bucles de pensamiento de Gemini y evitar que el texto de pensamiento filtrado aparezca en el chat
- Manejo de imágenes: Las vistas previas de fotos RAW DNG ahora respetan la orientación EXIF para una visualización correcta, evitando la distorsión en las imágenes subidas.
Corrección de errores
- Editabilidad de nuevos documentos: Se corrigió que los documentos en blanco creados a través de "Nuevo archivo" se renderizaran como vistas previas estáticas en lugar de editores de texto enriquecido editables
- Detección de clave API: Cambiar a su propia clave API (BYOK) ahora tiene efecto inmediatamente sin requerir una actualización de página
- Estabilidad de capturas de pantalla: Se corrigió el manejo de ID de archivos adjuntos para evitar que los datos de capturas de pantalla se pierdan o corrompan
- Agrupación de pestañas: Se corrigió el bloqueo cuando el navegador tenía ventanas no normales (p. ej., herramientas de desarrollo, ventanas emergentes)
- Ruido de consola: Se eliminó el sondeo innecesario de llms.txt que estaba enviando errores 404
- Tiempos de espera de herramientas: Se eliminaron soluciones de keepalive frágiles que podían interferir con llamadas de herramientas de larga duración como la generación de imágenes 4k con Gemini
- Caché de prompts: Se corrigió que el contenido multimodal (imágenes/capturas de pantalla) se descartara durante la optimización de la caché de prompts
Interno
- Mejoras significativas en la calidad del código base en el manejo de errores, seguridad de tipos y capas arquitectónicas
- Modularización del analizador de documentos central en módulos enfocados y mantenibles
Versión 0.9.641 (14 de febrero de 2025) - ¡Feliz Día de San Valentín!
Mejoras
- Medallas de Nivel del Selector de Modelos: Se reemplazaron las insignias de recomendación codificadas por 5 medallas de nivel impulsadas por API (Mejor para Caiioo, Calidad, Fiabilidad, Velocidad, Valor) que muestran clasificaciones de oro/plata/bronce directamente de los datos de referencia
- Sistema de Habilidades: Las habilidades ahora tienen un botón de restaurar valores predeterminados para volver a añadir las habilidades integradas
- Almacenamiento en Caché de Prompts: Se optimizó aún más el almacenamiento en caché de prompts para ahorrar costos
Corrección de Errores
- Compatibilidad de Navegador: El inicio de sesión OAuth y la conexión automática ahora funcionan en Vivaldi y otros navegadores que no son Chrome
- Seguimiento de Costos: Se corrigió una condición de carrera donde la cancelación de una ejecución podía arruinar los datos de costo y uso; los datos de costo/uso ahora se preservan en ejecuciones canceladas y con errores
- Sincronización Privada: Se reescribió purgeAllStorage para un borrado total, se corrigió la carrera del oyente de sincronización y se consolidó la interfaz de sincronización privada
- i18n: Se añadió la inicialización de traducción faltante a la página emergente conversation.html
- Seguridad: Se parchearon vulnerabilidades de dependencias (qs, @casl/ability, axios, markdown-it)
- Página de Benchmarks: Se migró el backend de la página de benchmarks a la autenticación de Cloudflare
Versión 0.9.65 (13 de febrero de 2025)
Mejoras
- Benchmarks de MiniMax M2.5: Suite de benchmarks completa — precisión de la herramienta 91%, fiabilidad 95% (puesto n.º 2), puesto compuesto n.º 5 con nivel de valor oro
- API de Inteligencia de Modelos: Se aumentó el límite de respuesta predeterminado de 100 a 500, asegurando que todos los modelos con insignias obtenidas sean visibles para los clientes
Corrección de errores
- Insignias de modelo faltantes: Se corrigieron 35 modelos con insignias de nivel obtenidas (oro/plata/bronce) que no aparecían en la lista de modelos de la extensión, incluyendo Claude Opus 4.6 (oro compuesto), Claude Sonnet 4.5 (plata compuesto) y Claude Haiku 4.5 (bronce compuesto). Causa raíz: la API devolvía por defecto solo 100 modelos ordenados por fiabilidad, pero los niveles se calculaban a partir de los 367 modelos. Los modelos fuera de los 100 mejores por fiabilidad perdían sus insignias silenciosamente.
Versión 0.9.64 (12 de febrero de 2025)
Mejoras
- Paridad del Proveedor Ollama: Paridad total de funciones con OpenRouter — soporte de señal de aborto, manejo de errores, detalles de razonamiento, model ID resuelto y procesamiento de etiquetas think a través de streaming mixin.
- Propagación de AbortSignal: Los procesos secundarios SIGTERM/SIGINT ahora cancelan las llamadas a la API de LLM en curso.
- Validación de Esquema en Tiempo de Compilación: La validación del esquema de configuración en el tiempo de compilación detecta entradas de
SETTING_METADATAfaltantes. - Caché de Capacidades de la Plataforma: Almacenadas en caché para mejorar el rendimiento en lugar de recalcularse en cada acceso.
- i18n del Sitio Web: Sincronización de las traducciones de la página de confianza y la reestructuración de precios en los 22 idiomas.
Corrección de Errores
- Autenticación del Sitio Web: Se reemplazó la autenticación heredada de Supabase con llamadas directas a la API de Cloudflare Worker para el inicio de sesión con Google, inicio de sesión por correo electrónico, registro y restablecimiento de contraseña.
- Localización de Stripe Checkout: Se corrigió el error "Invalid locale" en el proceso de pago y en el portal mediante el mapeo de
navigator.language(por ejemplo,en-US) a los locales compatibles con Stripe, con respaldo aauto. - Longitud Mínima de Contraseña: Se sincronizó el mínimo de 12 caracteres en el registro del servidor, el restablecimiento de contraseña y la página de restablecimiento del sitio web.
- Deduplicación de Perfiles de Private Sync: El inicio de sesión ahora detecta y elimina perfiles duplicados causados por errores de sincronización anteriores.
- Condición de Carrera en la Inicialización del State Manager: Se corrigió la condición de carrera de inicialización en el state-manager.
- Limpieza de Subprocesos de Agentes: Limpieza de subprocesos zombies al finalizar el agente.
- Protecciones de API de Tab Group/Storage: Protecciones adecuadas para las API de grupos de pestañas y almacenamiento en todas las plataformas.
- Manejo de Errores de Geolocalización: Manejo fluido de los errores de permisos de geolocalización.
- Bloqueo de Actualización de OAuth: Evita intentos concurrentes de actualización de tokens OAuth.
- Mutex de Guardado de Configuración: Los guardados de configuración concurrentes ya no se sobrescriben entre sí.
- Aislamiento de Parseo JSON del Agente: Las salidas malformadas del agente ya no bloquean el analizador.
- Condición de Carrera en Búsqueda de Hilos: Se corrigió la condición de carrera en los resultados de búsqueda de hilos.
- Obsolescencia de Versión en Streaming: Comprobación de versiones obsoletas durante las respuestas en streaming.
- Tiempos de Espera de Content Script: Se agregaron tiempos de espera para el paso de mensajes del content script.
- Poda de Contexto para Multimodal: Mejora de la poda de contexto cuando hay contenido multimodal presente.
Versión 0.9.63 (12 de febrero de 2025)
Corrección de errores
- Variables de modo de sincronización privada: Se corrigió la migración de configuraciones heredadas que se ejecutaba en cada ciclo de sincronización, sobrescribiendo silenciosamente ediciones locales recientes (por ejemplo, cambios en variables de modo) con datos obsoletos de Drive.
Versión 0.9.62 (12 de febrero de 2025)
Nuevas Funcionalidades
Configuración de OpenRouter OAuth en un Clic
- Creación de Claves PKCE: El nuevo flujo de OpenRouter OAuth en un clic permite a los usuarios crear y vincular una API key sin salir de caiioo.
- Onboarding Rediseñado: Flujos de incorporación y actualización optimizados con la integración de OpenRouter OAuth.
- Advertencia de Privacidad: La opción de onboarding para modelos gratuitos ahora muestra una advertencia clara sobre privacidad y datos de entrenamiento.
Sync Privada Granular
- Sincronización por Elemento: Los servidores MCP, aprobaciones de herramientas, perfiles, skills, modos, overrides y recordatorios ahora se sincronizan a nivel de elemento individual en lugar de sobrescribir colecciones completas.
- Sincronización de Ajustes por Clave: Los ajustes se sincronizan de forma granular por clave, evitando que los cambios remotos sobrescriban cambios locales no relacionados.
- Lecturas Deduplicadas: Las lecturas de almacenamiento WebSocket en curso se deduplican para reducir el tráfico de red innecesario.
Mejoras
- UX de Ajustes de Modo: Los overrides ahora se guardan automáticamente, y la opción Restore Defaults restaura correctamente las variables de modo eliminadas.
- Composer Responsivo: El botón de Skills se colapsa a solo icono en anchuras estrechas; se eliminó el espaciador de diseño de la sección Skills.
- Tickets de Soporte: La versión de la compilación y la fecha/hora ahora se incluyen automáticamente.
- Búsqueda en Slate: Se añadió la nueva acción
search_documenta la herramienta Slate.
Corrección de Errores
- Google Slides/Sheets OAuth: Ahora lanza correctamente el error
OAuthAuthorizationRequiredErroren lugar de devolver texto de configuración, permitiendo la autorización just-in-time. - Actualización de UI de Configuration Tool: Las mutaciones de agentes a través de la configuration tool ahora emiten
STORAGE_CHANGEDpara que la UI se actualice inmediatamente. - Modal de Aprobación de Herramientas: Se corrigió la violación del orden de los hooks de React (useMemo por encima del retorno temprano).
- Localhost HTTPS: La herramienta de integración de API ahora gestiona certificados autofirmados para servidores HTTPS locales.
- Persistencia de Variables de Modo: Se corrigió el problema con las propiedades getter de i18n que no se materializaban antes del almacenamiento, causando que las variables desaparecieran al recargar.
- Seguridad de Hilos en Slate: Se resolvió una condición de carrera en las herramientas de Slate que causaba slates duplicados durante turnos de AI paralelos.
- Slate DOCX: Se corrigió la visibilidad de eliminaciones y la corrupción de la línea base en los cambios controlados.
- Estabilidad de Sync Privada: Se eliminaron los rebotes y las ediciones que desaparecían debido a conflictos de sincronización.
Versión 0.9.61 (10 de febrero de 2025)
Mejoras
i18n del editor Slate
- Barra de herramientas y menús traducidos: Todos los botones de la barra de herramientas, menús contextuales y cadenas de diálogo del editor Slate ahora están completamente traducidos
Corrección de errores
- Tiempos de espera de OAuth: Todas las solicitudes de intercambio y actualización de tokens OAuth ahora tienen un tiempo de espera de 15 segundos, evitando bloqueos infinitos por interrupciones de red
- Correo electrónico privado de GitHub: Se corrigió el fallo de conexión con GitHub cuando el correo electrónico del perfil del usuario es privado (ahora se obtiene de la API
/user/emails) - Diálogo de conexión OAuth: Se generalizó el diálogo de conexión OAuth y se corrigieron múltiples errores de tokens/conexión
- Consistencia en la longitud de contraseñas: Se sincronizó el requisito mínimo de 12 caracteres para la contraseña en todas las interfaces de registro y restablecimiento
Versión 0.9.6 (8 de febrero de 2025)
Nuevas Funcionalidades
Internacionalización (más de 20 idiomas)
- Soporte completo de i18n: Caiioo ahora está disponible en más de 20 idiomas, incluyendo inglés, español, francés, alemán, japonés, coreano, chino, árabe, hebreo, hindi y más.
- Soporte para idiomas RTL: Diseño completo de derecha a izquierda para árabe, hebreo y urdu.
- Configuración de idioma de la UI: Elija su idioma preferido en Settings — todos los elementos de la interfaz, etiquetas de herramientas y mensajes de estado están traducidos.
Mejoras
Rendimiento del Panel de Settings
- Secciones con Lazy-Loading: Las secciones del panel de Settings ahora se cargan bajo demanda, reduciendo el tiempo de renderizado inicial.
- Almacenamiento Modular: Los ajustes se almacenan en claves granulares por sección en lugar de un único bloque monolítico, mejorando el rendimiento de lectura/escritura.
- Getters Tipados: El acceso interno a los ajustes utiliza getters fuertemente tipados con seguimiento de granularidad de cambios.
Fiabilidad de Track Changes en Slate
- 17 correcciones en el Revision Manager: Refuerzo integral del sistema de seguimiento de cambios en el cálculo de diferencias (diff), aceptación, rechazo y persistencia.
- Diferenciación de texto plano: Los cambios de redline ahora comparan texto plano en lugar de markdown puro, produciendo resaltados de cambios más limpios y precisos.
- Cambios de usuario persistentes: Los cambios rastreados realizados por el usuario ahora sobreviven a la actualización de la página.
- Corrección de condición de carrera: Forzado de consolidación (force-bake) de los cambios rastreados antes de guardar para evitar la pérdida de datos.
Corrección de Errores
- Cierres inesperados del Service Worker: Se reemplazaron más de 112 llamadas dinámicas a
import()por importaciones estáticas para evitar cierres inesperados del service worker en Chrome. - Mensajes de bienvenida de modo: Se corrigieron problemas de idioma, detección de claves provisionadas y persistencia en los mensajes de bienvenida de los modos.
- Selección de cuenta en herramientas de Google: El selector de cuentas ahora refleja dinámicamente las cuentas realmente conectadas.
- Listas anidadas en DOCX: Se corrigieron los marcadores de visualización y la corrupción de exportación en los procesos de ida y vuelta (round-trip) de listas anidadas.
- Renderizado de matemáticas en LaTeX: Se corrigió el escape del símbolo de dólar de moneda que interrumpía las expresiones matemáticas de LaTeX que comenzaban con números.
- Creación de grupos de pestañas: Se pospuso la creación diferida (lazy) de grupos de pestañas hasta que la herramienta de navegación web se utilice realmente.
- OAuth de Agenda: Re-lanzamiento de errores de OAuth para que la autorización justo a tiempo se active correctamente.
- Persistencia de Settings: Se añadieron entradas de metadatos faltantes para 6 ajustes que fallaban silenciosamente al guardar.
Versión 0.9.5 (6 de febrero de 2025)
Refuerzo de Seguridad
- Validación de Origen de Content Script: Los mensajes de páginas web a la extensión ahora están restringidos únicamente a orígenes de caiioo.ai, con comprobaciones estrictas de mismo origen que evitan la inyección de mensajes entre distintos orígenes
- CSP Restringida: Se eliminaron las fuentes de scripts de localhost (solo para desarrollo) de la Política de Seguridad de Contenido de las páginas de la extensión
- Delimitación de Respuestas de Autenticación: Las respuestas de autenticación de la extensión ahora se envían al origen de la página específica en lugar de transmitirse a todos los marcos
Versión 0.9.4 (4 de febrero de 2025)
Nuevas funciones
Conversión de voz a texto multilingüe
- Selección de idioma: Elija su idioma de STT en Ajustes para una entrada de voz precisa en idiomas distintos al inglés
- Más de 90 idiomas compatibles: Funciona con Whisper y ElevenLabs para una cobertura lingüística completa
Detección de actividad de voz en tiempo real
- VAD de baja latencia: La nueva integración de Silero VAD v5 detecta el habla en tiempo real con un retraso mínimo
- Grabación más inteligente: La grabación se inicia y detiene automáticamente según la actividad de voz
- Reducción de falsos positivos: Mejor distinción entre el habla y el ruido de fondo
Alternar visibilidad de sugerencias
- Ocultar/Mostrar sugerencias: Nuevo interruptor para ocultar las sugerencias de seguimiento de la IA cuando desee una interfaz más limpia
- Estado persistente: Su preferencia se guarda y recuerda entre sesiones
Mejoras
Auto-guardado de control de cambios
- Seguimiento basado en diff: Seguimiento de cambios más eficiente mediante algoritmos de diff
- Auto-guardado: Los cambios se guardan periódicamente para evitar la pérdida de datos durante sesiones de edición largas
- Instantánea al salir: Salir del modo de control de cambios guarda automáticamente todos los cambios pendientes
Streaming de proveedores mejorado
- Mejoras en Gemini: Mejor capacidad de streaming y razonamiento para los modelos de Google Gemini
- Comportamiento consistente: Comportamiento de streaming unificado entre OpenRouter y los proveedores nativos
Versión 0.9.3 (31 de enero de 2025)
Nuevas Funciones
Recorrido de Incorporación Guiado
- Tour Interactivo de la IU: Un nuevo recorrido paso a paso guía a los nuevos usuarios a través de cada parte de la interfaz después de ingresar su clave de API
- Tres Fases: Cubre el compositor (11 pasos), el panel de configuración (7 pasos) y el sistema de modos (5 pasos)
- Efecto de Foco: Cada paso resalta el elemento de la interfaz relevante con un foco de atención
- Incorporación Conversacional: Creación de perfil guiada por IA para personalizar su experiencia desde el principio
Historial de Prompts
- Acceso a Prompts Anteriores: Sus prompts recientes se guardan y se puede acceder a ellos en el compositor
- Reutilización Rápida: Reutilice o modifique fácilmente mensajes anteriores
Niveles de Bloqueador de Anuncios
- Control Granular: El bloqueo de anuncios ahora admite múltiples niveles en lugar de solo encendido/apagado
- Elija su Protección: Seleccione el nivel de bloqueo que mejor se adapte a sus necesidades de navegación
Barra de Herramientas de Revisión de DOCX
- Controles de Control de Cambios: Nueva barra de herramientas al visualizar documentos de Word con cambios realizados
- Acciones de Aceptar/Rechazar: Revise y resuelva fácilmente las ediciones del documento
Mejoras
Configuración de Retención de Hilos
- Limpieza Configurable: Establezca cuánto tiempo conservar los hilos antiguos antes de la limpieza automática
- Gestión de Almacenamiento: Mejor control sobre su historial de conversaciones
Animación de Caiioo
- Optimizaciones de Rendimiento: Animación más fluida con renderizado mejorado
- Efectos de Humedad: Nueva superposición visual que muestra la saturación de agua
- Renderizado Directo de Partículas: Visuales más limpios con dibujo de partículas optimizado
Cambio de Perfil
- Gestión de Estado Mejorada: Cambio de perfil más confiable con manejo de protocolos mejorado
- Mejor Sincronización: Los cambios de perfil se sincronizan correctamente en toda la extensión
Google Calendar
- Gestión de Tokens: Manejo mejorado de tokens de acceso para operaciones de calendario
- Sincronización más Confiable: Mejor flujo de OAuth para la integración del calendario
Versión 0.9.2 (26 de enero de 2025)
Nuevas Funciones
Bloqueo de Anuncios y Rastreadores
- Bloqueador de Anuncios Integrado: Bloquee anuncios y rastreadores utilizando el motor Ghostery con declarativeNetRequest compatible con MV3
- Alternar en Configuración: Active o desactive el bloqueo de anuncios desde el panel de Configuración
- Actualizaciones de Listas de Filtros: Almacenamiento en caché automático de listas de filtros para un bloqueo confiable
Permisos de Google Justo a Tiempo
- Autorización Incremental: Los permisos de las herramientas de Google ahora se solicitan solo cuando son necesarios, no por adelantado
- Gestión de Alcance más Clara: Los alcances faltantes activan mensajes de error útiles con opciones para otorgar acceso
- Mejor Privacidad: Solo solicita los alcances específicos de Google requeridos para cada herramienta
Mejoras
Animación de Caiioo
- Física Mejorada: Dinámica de partículas mejorada con mejores fuerzas de elevación, velocidad y densidad
- Flujo más Suave: Las partículas ahora siguen la dirección del canal al aparecer, reduciendo la acumulación
- Apilamiento Realista: Las partículas se apilan de forma natural cuando son bloqueadas por guijarros o presas
Flujo de Google OAuth
- Inicio de Sesión más Rápido: Ahora prioriza la recuperación del token de ID para una autenticación más rápida
- Fiabilidad Mejorada: Un mejor manejo de tokens reduce los fallos de autenticación en navegadores que no son Chrome
Incorporación y Configuración
- Modo de Vista Previa: Pruebe los flujos de incorporación sin borrar los datos del usuario
- Nivel Gratuito más Limpio: Se eliminó la interfaz de usuario de restauración de claves de API aprovisionadas obsoleta
Interno
- Sistema de Minijuegos: Nueva infraestructura MinigameContainer para experiencias de introducción interactivas
- Huevo de Pascua Oculto: El estado de visibilidad del minijuego persiste entre sesiones
Version 0.9.1 (25 de enero de 2025)
Nuevas Funcionalidades
Simulación de Agua Interactiva
- Caiioo Intro: Nueva simulación de fluidos interactiva en la pantalla de carga: observa cómo fluye el agua a través de un canal dinámico en forma de S.
- Pebbles Arrastrables: Mueve los pebbles para redirigir el flujo de agua y crear presas.
- Dinámica de Sedimentos: Erosión y deposición realistas: el agua rápida recoge sedimentos, el agua lenta los deposita.
- Adaptación al Tema: Los colores del agua coinciden automáticamente con el tinte del tema elegido.
Soporte para Gráficos Vega/Vega-Lite
- Visualizaciones Interactivas: Visualiza y edita gráficos Vega y Vega-Lite directamente en Slate.
- Visualización de Datos: Crea gráficos de barras, gráficos de líneas, diagramas de dispersión y visualizaciones complejas de múltiples capas.
- Edición de Especificaciones: Edita la especificación JSON y observa los cambios renderizados en tiempo real.
Soporte para Diagramas Mermaid
- Tipos de Diagramas: Crea diagramas de flujo, diagramas de secuencia, diagramas de clases, diagramas de estado y más.
- Vista Previa en Vivo: Edita la sintaxis de Mermaid con una vista previa visual instantánea.
- Opciones de Exportación: Los diagramas se renderizan como SVG para una salida nítida en cualquier tamaño.
Plantillas de Creación de Archivos
- Menú de Creación Rápida: Nuevo menú desplegable al crear archivos en Slate con plantillas para tipos de archivos comunes.
- Categorías de Plantillas: Markdown, archivos de código, formatos de datos, diagramas y más.
- Inicio con un Clic: Salta directamente a un nuevo documento con la estructura adecuada.
Mejoras
Manejo de Errores de API
- Notificaciones Visuales: Los errores de API ahora se muestran como notificaciones toast descartables.
- Auto-descarte: Los errores no críticos (como cancelaciones) se borran automáticamente después de unos segundos.
- Mensajes más Claros: Mejores mensajes de error ayudan a identificar y resolver problemas más rápido.
Capacidades de la Plataforma
- Detección Inteligente de Funciones: Las funciones que requieren plataformas específicas (como Apple Calendar en macOS) ahora se detectan automáticamente.
- Alternativas Flexibles: Las herramientas se adaptan a tu entorno en lugar de fallar silenciosamente.
- Mejoras en Herramientas de Apple: Apple Reminders ahora admite acciones de desmarcar como completado y acciones de lista.
Safari y Navegadores No-Chrome
- Mejor Flujo de OAuth: Detección de navegador mejorada para el inicio de sesión de Google.
- Mecanismo de Respaldo: Los navegadores que no son Chrome ahora tienen una ruta de autenticación más confiable.
Versión 0.9.0 (22 de enero de 2025)
Nuevas Funciones
Limpieza Automática de Datos
- Gestión de Almacenamiento: Los hilos y archivos adjuntos antiguos se limpian automáticamente según sus preferencias de retención
- Políticas Configurables: Establezca cuánto tiempo conservar los datos antes de la limpieza automática
Sincronización con GitHub
- Copia de Seguridad en GitHub: Sincronice sus datos de Caiioo con un repositorio de GitHub para copias de seguridad y acceso desde múltiples dispositivos
- Resolución Inteligente de Conflictos: Los cambios de múltiples dispositivos se fusionan automáticamente sin pérdida de datos
- Sincronización Selectiva: Controle qué datos se sincronizan con patrones al estilo
.gitignore
Herramienta de GitHub
- Integración de IA con GitHub: La IA ahora puede interactuar con GitHub en su nombre: crear problemas, navegar por repositorios, gestionar solicitudes de extracción y más
- Navegación por Repositorios: Pida a la IA que explore bases de código, encuentre archivos y comprenda la estructura del proyecto
Mejoras
Automatización del Navegador
- Interacción de Página Mejorada: Clics, desplazamientos y llenado de formularios más confiables en páginas web complejas
- Selección de Herramientas más Inteligente: La IA ahora elige las herramientas adecuadas para cada tarea con mayor precisión
Manejo de Documentos
- Mejores Documentos de Word: Manejo mejorado de tablas, listas y formato en archivos DOCX
- Google Slides: Más control sobre el formato de las diapositivas, formas y diseños
Configuración e IU
- Panel de Configuración Ampliado: Más opciones de configuración con mejor organización
- Lista de Hilos Mejorada: Mejor clasificación y filtrado de sus conversaciones
- Permiso de Ubicación: Flujo más claro al otorgar acceso a la ubicación para consultas basadas en la ubicación
Versión 0.8.9 (19 de enero de 2025)
Nuevas funciones
Integración con Google Slides
- Presentaciones impulsadas por IA: La nueva herramienta de Google Slides permite a la IA crear, leer y modificar presentaciones de diapositivas
- Control total de diapositivas: Cree diapositivas, agregue cuadros de texto, imágenes, formas y tablas
- Soporte de plantillas: Use plantillas integradas o trabaje desde presentaciones en blanco
- Edición colaborativa: Funciona con su conexión de cuenta de Google existente
Mejoras
Calidad del código
- Correcciones de TypeScript: Se limpiaron errores de tipo e importaciones no utilizadas en toda la base de código
- Cobertura de pruebas: Se actualizaron las pruebas para que coincidan con las definiciones de tipo actuales
Versión 0.8.8 (17 de enero de 2025)
Nuevas funciones
Texto a voz de Resemble.ai
- Síntesis de voz profesional: Nueva integración de Resemble.ai para generación de voz por IA de alta calidad
- Audio en streaming: Streaming de audio en tiempo real para una salida de voz receptiva
- Voces configurables: Seleccione entre múltiples opciones de voz profesional
- Advertencias de truncamiento: Comentarios claros cuando el texto largo se trunca para la síntesis
Servicio de sincronización de calendario
- Sincronización en segundo plano: Sincronización automática de calendario con Google Calendar
- Actualizaciones incrementales: Solo se sincronizan los eventos modificados para mayor eficiencia
- Programación basada en alarmas: Programación de sincronización fiable mediante alarmas de Chrome
Mejoras
Aplicación de escritorio (Electron)
- Detección de activación: El sistema ahora detecta cuando su Mac se activa del modo de reposo y actualiza los tokens OAuth automáticamente
- Fiabilidad mejorada: Las conexiones OAuth permanecen frescas incluso después de periodos de reposo prolongados
Entrada del compositor enriquecido
- Composición mejorada: Entrada de mensaje mejorada con mejor soporte de formato
- Autocompletado con Tab: Sugerencias de referencia de pestañas más receptivas
Version 0.8.71 (15 de enero de 2025)
Nuevas Funcionalidades
Thread Search
- Busque en sus conversaciones: Nuevo cuadro de búsqueda en la lista de hilos para encontrar rápidamente hilos por título o contenido.
- Filtrado instantáneo: Escriba para filtrar; los hilos coincidentes aparecen de inmediato con resaltado de búsqueda.
- Smart Debouncing: La búsqueda está optimizada para no presentar retrasos incluso con cientos de hilos.
Physics Simulation Tool
- Física impulsada por AI: Nueva herramienta de física que permite a la AI realizar cálculos y simulaciones físicas.
- Movimiento de proyectiles: Calcule trayectorias, prediga colisiones y resuelva problemas de movimiento.
- Análisis estructural: Analice el estrés, la flexión de vigas, el pandeo y la estabilidad de las estructuras.
- Propiedades de materiales: Base de datos integrada de materiales de ingeniería comunes (acero, aluminio, madera, hormigón, etc.).
- Fórmulas físicas: Cálculos de energía cinética, momento, fuerza e impulso.
Mejoras en Cairn World Builder
- Motor de física: Integración completa de física Rapier3D para simulaciones realistas.
- Articulaciones y restricciones: Cree bisagras, deslizadores, rótulas y conexiones fijas entre cuerpos.
- Sensores y activadores: Defina regiones de sensores que detectan cuando los objetos entran o salen.
- Controlador de personajes: Personaje en primera persona con gravedad, salto y respuesta a colisiones.
- Modo de juego: Física en tiempo real con paso de tiempo fijo para exploración interactiva.
Mejoras
Private Sync v2
- Sincronización incremental: Cada hilo y archivo adjunto se sincroniza ahora individualmente en lugar de como un único archivo grande.
- Sincronización más rápida: Solo se cargan los elementos modificados, lo que reduce drásticamente el tiempo de sincronización para bibliotecas grandes.
- Mejor manejo de conflictos: Los relojes vectoriales por elemento permiten una resolución de fusiones más precisa.
- Reducción de llamadas a la API: El diffing inteligente significa menos solicitudes a la API de Google Drive.
Fiabilidad de sincronización
- Paridad Extensión/Servidor: Se corrigió el almacenamiento de archivos adjuntos para rastrear correctamente los relojes vectoriales en ambas plataformas.
- Filtrado de Tombstones: Los perfiles eliminados ahora se ocultan correctamente tanto en la extensión como en el servidor.
Versión 0.8.70 (14 de enero de 2025)
Nuevas funciones
Sincronización privada (Nivel GRATIS)
- Sincronización entre dispositivos: Sincroniza tus hilos, configuraciones y archivos adjuntos en todos tus dispositivos a través de Google Drive.
- Cifrado de extremo a extremo: Todos los datos sincronizados se cifran con tu frase de contraseña antes de salir de tu dispositivo.
- Sincronización automática en segundo plano: Los cambios se sincronizan automáticamente cada 30 segundos con un debounce inteligente.
- Resolución de conflictos: Los relojes vectoriales estilo CRDT aseguran que los cambios se fusionen correctamente entre dispositivos.
Mejoras
Eficiencia de la sincronización privada
- Polling reducido: El intervalo de sincronización aumentó de 3s a 30s para reducir las llamadas a la API.
- Debounce inteligente: Espera 10 segundos después de que los cambios se asienten antes de sincronizar.
- Protección durante el proceso: Los hilos que están siendo procesados activamente por la IA se excluyen de la sincronización hasta que se completen.
Versión 0.8.69 (14 de enero de 2025)
Nuevas funciones
Navegación de revisiones de Slate
- Navegar entre cambios: Nuevos botones de navegación para saltar entre fragmentos de revisión pendientes en el editor
- Contador de cambios: El indicador visual muestra la posición actual (por ejemplo, "2 de 5") dentro de las revisiones pendientes
- Atajos de teclado: Use Alt+Arriba/Abajo para navegar rápidamente entre fragmentos sin dejar el teclado
Mejoras
Procesamiento de documentos
- Respaldo de OCR remoto: Cuando la extracción de texto PDF local falla o produce resultados deficientes, los documentos se procesan automáticamente mediante OCR en la nube para mejorar la precisión
- Estado de procesamiento: Los comentarios en tiempo real muestran cuándo se están procesando los documentos de forma remota
Soporte de modelos de razonamiento
- Razonamiento de múltiples turnos: Mejor almacenamiento en caché de los detalles de razonamiento en los turnos de conversación, mejorando la continuidad para modelos de pensamiento extendido
- Mensajes más limpios: Las notas internas del sistema ahora se eliminan de los mensajes renderizados, evitando la fuga de instrucciones
Versión 0.8.68 (11 de enero de 2025)
Nuevas funciones
Memoria a largo plazo
- Persistencia de contexto: La IA ahora mantiene una memoria a largo plazo entre conversaciones, recordando contexto importante sobre tus preferencias y flujos de trabajo
- Seguimiento de uso: Seguimiento mejorado del uso de tokens y costos con registros detallados
Inteligencia de modelos
- Selección inteligente de modelos: Las nuevas funciones de inteligencia de modelos ayudan a identificar los modelos óptimos según tus patrones de uso
- Sistema de clasificación: Los modelos se clasifican según métricas de rendimiento y valor
Mejoras
Fiabilidad del almacenamiento
- Almacenamiento multiplataforma: La caché de modelos, las aprobaciones de herramientas y las páginas aprendidas ahora funcionan de forma fiable en los modos de extensión, servidor y LAN
- Tiempo de espera de autenticación: Se corrigió un posible bloqueo al conectar con el servidor de retransmisión; ahora el tiempo de espera es de 5 segundos en lugar de esperar indefinidamente
- Velocidad de carga de ajustes: Los ajustes y el selector de modelos ahora se cargan más rápido tras recargar la extensión
Paginación de contenido
- Tamaño de página adecuado: El contenido de las páginas web ahora se divide según la ventana de contexto real del modelo (p. ej., 131k tokens), no un valor predeterminado fijo. Esto significa que verás fragmentos de página más grandes y menos páginas al usar modelos de contexto alto.
Corrección de errores
- Persistencia de clave API: Se corrigió el problema por el cual la clave API de OpenRouter se "olvidaba" después de activar y desactivar brevemente el modo LAN
Versión 0.8.67 (7 de enero de 2025)
Nuevas funciones
Kokoro TTS - Texto a voz neuronal local
- Voces de alta calidad: Kokoro es un modelo de TTS neuronal local con voz natural en múltiples voces
- No requiere clave API: Se ejecuta completamente en el dispositivo usando WebGPU/WASM; no necesita servicios en la nube ni claves API
- Múltiples voces: Elige entre opciones de acento estadounidense, británico y otros con variantes masculinas/femeninas
- Soporte para texto largo: Maneja correctamente textos largos mediante síntesis en streaming; sin cortes a los 30 segundos
- Voz limpia: Elimina automáticamente el formato markdown (negrita, cursiva, etc.) antes de hablar
Mejoras
Ajustes de voz
- Sección de voz unificada: Ajustes de TTS y STT consolidados en un diseño más limpio
- Vista previa de voz: Prueba la voz seleccionada antes de usarla
Versión 0.8.66 (7 de enero de 2025)
Mejoras
Búsqueda en el panel de ajustes
- Búsqueda con filtros: Nuevo cuadro de búsqueda en la parte superior de Ajustes para filtrar rápidamente las secciones por palabra clave
- Resultados instantáneos: Escribe para filtrar; las secciones coincidentes aparecen inmediatamente
- Amigable con el teclado: La búsqueda se enfoca automáticamente al abrir los ajustes
Fiabilidad del servidor MCP
- Verificación de inicio: Los servidores MCP ahora se verifican como en ejecución antes de devolver el éxito
- Mejores mensajes de error: Cuando los servidores MCP fallan durante el inicio, se muestra el error real en lugar de un fallo genérico
- Ejemplos corregidos: Se corrigieron los nombres de paquetes de ejemplo para usar
@modelcontextprotocol/server-*(no@anthropic/mcp-server-*)
Autenticación de la aplicación macOS
- Tokens de autovalidación: Se corrigieron los errores 401 al añadir servidores MCP antes de la sincronización del estado de WebSocket
- Autenticación más rápida: Los puntos finales HTTP ya no requieren esperar a la conexión WebSocket
Versión 0.8.65 (6 de enero de 2025)
Nuevas Funciones
Integración de Voz de ElevenLabs (BYOK)
- TTS en la Nube: Texto a voz de alta calidad utilizando ElevenLabs; elija entre múltiples voces y modelos
- STT en la Nube: Transcripción Scribe con transmisión en tiempo real (latencia de ~150 ms) y soporte para más de 90 idiomas
- Selección de Voz: Explore y seleccione de la biblioteca de voces de ElevenLabs directamente en Configuración
- Opciones de Modelo: Elija entre Flash v2.5 (ultrarrápido ~75 ms), Turbo v2.5 o Multilingual v2 (mejor calidad)
- Traiga su propia clave: Utiliza su clave de API de ElevenLabs; sin costo adicional por parte de Caiioo
Modelo Whisper Multilingüe
- Whisper Tiny Multilingual: Nueva opción de STT local que admite 99 idiomas (descarga de ~39 MB)
- Mismo tamaño que la versión solo en inglés: Mismo tamaño compacto de 39 MB que Whisper Tiny English
- Detección de Idioma: Detecta automáticamente el idioma hablado
Lectura y Escritura Mejoradas en Google Docs
- Markdown por Defecto: El texto ahora se formatea como markdown por defecto al escribir. Use
useMarkdown: falsepara inserciones de texto plano que preserven el formato existente. - Formato Enriquecido: Convierte encabezados de markdown, negrita, cursiva, tachado y enlaces a estilos nativos de Google Docs
- Listas y Tablas: Admite listas ordenadas/desordenadas con anidamiento y tablas de markdown
- Seguimiento de Sugerencias: Las sugerencias pendientes se muestran con etiquetas semánticas:
<ins>texto añadido</ins>para inserciones,<del>texto eliminado</del>para eliminaciones. Las etiquetas adyacentes indican reemplazos. - Comentarios en Línea: Los comentarios aparecen en línea con atribución de autor:
<comment author=\"Nombre\" on=\"texto citado\">contenido</comment>con etiquetas<reply>anidadas para hilos
Mejoras
Pensamiento Extendido de Gemini
- Firmas de Pensamiento Mejoradas: Mejor manejo de la firma de pensamiento de Gemini a través de fragmentos de transmisión, mejorando la continuidad del pensamiento extendido con el uso de herramientas en múltiples turnos
Versión 0.8.64 (5 de enero de 2025)
Nuevas funciones
Metadatos de celdas en Google Sheets
- Leer hipervínculos y notas: Utilice
includeMetadata: truepara recuperar hipervínculos, notas y reglas de validación de datos de las celdas - Añadir hipervínculos: Nueva acción
update_cell_metadatapara añadir hipervínculos clicables con texto de visualización personalizado - Añadir notas: Adjunte notas/comentarios a las celdas mediante programación
- Validación de datos: Cree menús desplegables, rangos numéricos, validación de texto y reglas de fórmulas personalizadas en las celdas
Mosaico en Safari (macOS)
- Posicionamiento inteligente de ventanas: Al abrir enlaces desde el panel lateral, las ventanas de Safari se posicionan automáticamente junto al panel lateral para facilitar la navegación lado a lado
- Optimización del espacio en pantalla: La lógica de mosaico calcula la ubicación óptima de Safari según el espacio disponible en pantalla
- Reajuste de mosaico al cambiar de modo: Las ventanas de Safari se reposicionan automáticamente cuando el panel lateral cambia de modo
Copiar/Pegar en el panel lateral de macOS
- Soporte completo de copiar/pegar: Copiar y pegar ahora funciona de forma fiable en la aplicación del panel lateral de macOS
- Atajos de teclado del sistema: Los atajos estándar ⌘C/⌘V funcionan como se espera
Mejoras
Fiabilidad del servidor en macOS
- Gestión de señales: Mejora en la gestión de señales de tubería (pipe signals) para evitar la terminación inesperada de la aplicación
- Fiabilidad de reinicio: Las operaciones de parada y reinicio del servidor son ahora más fiables con una limpieza adecuada
- Estabilidad de la conexión: Mejor gestión de la actualización de tokens OAuth con lógica de reintento y retroceso exponencial
Extensión de Safari
- IDs de navegador estables: La extensión de Safari ahora genera IDs de navegador estables para evitar entradas duplicadas durante las reconexiones
- Reconexión más limpia: El registro del navegador en el lado del servidor utiliza IDs estables proporcionados por el cliente para una gestión de reconexión más limpia
Selector de modelos
- Desplazamiento al elemento seleccionado: Al abrir el menú desplegable de modelos, ahora se desplaza automáticamente al modelo seleccionado actualmente
Referencias de pestañas en la aplicación de macOS
- Funciona en el panel lateral: Las referencias de pestañas y el contexto ahora funcionan en el panel lateral nativo de macOS, no solo en la extensión de Chrome
Versión 0.8.63 (31 de diciembre de 2025)
Nuevas Funciones
Salida de Voz (Texto a Voz)
- Leer en voz alta: Las respuestas de la IA ahora se pueden leer en voz alta utilizando Microsoft Edge TTS
- Opción de Reproducción Automática: Habilite la lectura automática de nuevas respuestas de IA en Configuración
- Control de Velocidad: Ajuste la velocidad de reproducción de 0.5x a 2x
- Pausa/Reanudación: Controle la reproducción con botones de pausa y reanudación en cada mensaje
Voz a Texto Local (Whisper)
- Actualización de Whisper: Opte por la transcripción local de Whisper para una entrada de voz más precisa
- Descarga de Modelo: Descargue el modelo Whisper Tiny (~40 MB) para uso sin conexión
- Privacidad: El audio se procesa localmente, nunca se envía a servidores externos
- Respaldo: Recurre a la Web Speech API si Whisper no está disponible
Herramienta de Agenda Unificada
- Herramienta Única: La nueva herramienta
agendaconsolida las operaciones de calendario y recordatorios - Multi-proveedor: Funciona con Google Calendar, Apple Calendar, Apple Reminders y recordatorios de Caiioo
- Más Simple para Agentes: Una interfaz de herramienta para todas las necesidades de programación
Mejoras
Panel de Configuración
- Estado de Plegado Persistente: Los estados abierto/cerrado de las secciones ahora se recuerdan entre sesiones
- Configuración de Voz: Nueva sección para configurar las preferencias de TTS y STT
Versión 0.8.62 (31 de diciembre de 2025)
Nuevas funciones
Soporte de listas DOCX
- Listas numeradas: Los documentos de Word con listas numeradas ahora se renderizan correctamente con el formato adecuado
- Listas con viñetas: Las listas con viñetas se conservan y muestran con precisión
- Listas anidadas: La sangría de listas de varios niveles se mantiene en la vista previa HTML
Exportación CSV para hojas de cálculo
- Exportar como CSV: Los archivos XLSX ahora se pueden exportar como CSV para facilitar la extracción de datos
- Selección de formato: Elige entre XLSX o CSV al descargar archivos adjuntos de hojas de cálculo
Versión 0.8.61 (30 de diciembre de 2025)
Nuevas funciones
Flujo de trabajo de aprobación de herramientas
- Aprobación interactiva: Ciertas herramientas ahora requieren la aprobación del usuario antes de ejecutarse; verá un modal solicitando aprobar o denegar la acción
- Seguimiento de estado: Las ejecuciones de herramientas ahora muestran los estados 'pendiente de aprobación' y 'denegado' en la línea de tiempo
- Seguro por defecto: Las operaciones sensibles esperan el consentimiento explícito del usuario antes de proceder
Variable de ubicación actual
- {{currentLocation}}: Nueva variable para añadir el contexto de su ubicación actual a los prompts
- Permiso de geolocalización: Requiere permiso de geolocalización del navegador cuando se utiliza por primera vez
- Consciente del contexto: Ideal para consultas basadas en la ubicación como "restaurantes cerca de mí" o planificación de viajes
Gestión de hilos por lotes
- Modo de selección múltiple: Active el modo de selección para elegir varios hilos a la vez
- Eliminación por lotes: Elimine los hilos seleccionados en una sola acción
- Archivo/Exportación por lotes: Archive o exporte múltiples hilos simultáneamente
Visor de imágenes en Slate
- Visor dedicado: Las imágenes ahora se abren en un visor de pantalla completa dentro de Slate
- Controles de zoom: Acerque/aleje y desplácese por imágenes grandes
- Opción de descarga: Botón de descarga rápida para guardar imágenes localmente
Mejoras
Visualización de razonamiento
- Mejor agregación: Los bloques de pensamiento/razonamiento del modelo ahora se combinan correctamente sin duplicación
- Visualización más limpia: El contenido de razonamiento de los modelos de pensamiento extendido se muestra de forma más fiable
Integración con Ollama
- Razonamiento en streaming: Streaming en tiempo real del contenido de razonamiento/pensamiento de los modelos locales de Ollama
- Mejor manejo de modelos: Compatibilidad mejorada con modelos Mistral y requisitos estrictos de orden de mensajes
Gestión de archivos adjuntos
- Limpieza de archivos huérfanos: Nuevo diálogo en Configuración para gestionar archivos adjuntos huérfanos que no están vinculados a ningún hilo
- Asignar a hilo: Mueva archivos adjuntos huérfanos a hilos existentes
- Eliminación masiva: Limpie archivos huérfanos para liberar espacio de almacenamiento
Valores predeterminados de Slate
- Markdown por defecto: Al crear un nuevo Slate sin especificar el tipo, markdown (.md) es ahora el formato predeterminado
Versión 0.8.6 (19 de diciembre de 2025)
Nuevas funciones
Acción de espera para automatización del navegador
- Tipos de espera discretos: Nueva acción
waiten la automatización del navegador con 4 modos de espera especializados:timeout- Retraso simple (predeterminado 1000ms, máx 30000ms) para temporización básicaselector- Esperar a que un elemento aparezca o desaparezca (útil para spinners/cargadores)network_idle- Esperar a que las solicitudes fetch/XHR se estabilicen (solo extensión)animation- Esperar a que las animaciones y transiciones CSS se completen
- Visibilidad inteligente de elementos: La espera por selector verifica display, visibility, opacity y offsetParent para una detección precisa de visibilidad
Mejoras
Arquitectura de automatización del navegador
- Ejecución de scripts unificada: La nueva abstracción
executeInPagegarantiza un comportamiento consistente en los contextos de extensión de Chrome y retransmisión/servidor - Ejecución en el mundo MAIN: Ejecución adecuada de scripts en el mundo MAIN para operaciones que necesitan interceptar JavaScript a nivel de página (fetch, XHR)
- Degradación elegante: Las funciones exclusivas de la extensión ahora proporcionan mensajes de error útiles con alternativas cuando se usan en modo retransmisión
Corrección de errores
Actualización de token OAuth
- Actualización de token de extensión de Chrome: Se corrigió el problema de tokens obsoletos donde los tokens OAuth en caché de Chrome no se actualizaban correctamente. Los tokens ahora se verifican y los obsoletos se borran antes de reintentar.
- Flujo de autorización PKCE: La ventana emergente de OAuth ahora usa el flujo de código de autorización con PKCE en lugar del flujo implícito, permitiendo el soporte adecuado de tokens de actualización sin requerir un secreto de cliente.
- Actualización directa de token: Las conexiones con tokens de actualización ahora se pueden actualizar directamente usando el punto final de token de Google, sin requerir un servidor backend.
- Validación de token: Se añadió un paso de verificación de token para detectar tokens revocados/inválidos pronto y activar la reautenticación automática.
Versión 0.8.5 (19 de diciembre de 2025)
Nuevas funciones
Integración con Apple Calendar
- Acceso nativo al calendario: La nueva herramienta Apple Calendar proporciona un acceso nativo y rápido a tus calendarios de macOS a través de EventKit
- Agenda unificada: Vista combinada de recordatorios y eventos de calendario de todas las cuentas conectadas (Google Calendar + Apple Calendar)
- Soporte multicuenta: Extrae eventos de múltiples cuentas de Google Calendar y calendarios de Apple simultáneamente
Páginas aprendidas (Learned Pages)
- Aprendizaje inteligente de páginas: Enseña a Caiioo sobre sitios web específicos capturando su estructura
- Coincidencia de patrones de URL: Los patrones aprendidos se aplican automáticamente a páginas similares en el mismo sitio
- Almacenamiento de instantáneas DOM: Las estructuras de página capturadas ayudan a la IA a comprender mejor e interactuar con aplicaciones web complejas
Soporte para documentos RTF
- Edición de texto enriquecido: Carga y edita documentos RTF (Rich Text Format) directamente en Slate
- Conversión bidireccional: Convierte entre RTF y HTML manteniendo el formato
- Opciones de exportación: Descarga documentos editados como RTF para usar en Pages, Word u otros procesadores de texto
Mejoras
Seguridad de la aplicación de escritorio
- Autenticación de relevo (Relay): Autenticación segura HMAC-SHA256 entre la extensión y el servidor de escritorio
- Tokens por usuario: Los tokens de autenticación ahora están vinculados a la identidad del usuario para seguridad multiusuario
- Endpoints protegidos: Todos los endpoints sensibles de la API ahora requieren autenticación
Rendimiento
- Ayudantes en Swift: Binarios nativos en Swift para Apple Reminders, Calendar y Notes proporcionan un acceso 10 veces más rápido que AppleScript
- Llamadas directas: Al ejecutarse en el contexto de escritorio, las herramientas de Apple omiten el relevo HTTP para una menor latencia
- Utilidades compartidas: El cliente de API de relevo consolidado elimina la duplicación de código
Corrección de errores
- Deduplicación de eventos de calendario: Los eventos que aparecen en múltiples calendarios ahora se deduplican correctamente en la vista unificada
- Caché de prompts: Se corrigió el error por el cual los marcadores de control de caché se eliminaban durante la estimación de tokens
Versión 0.8.45 (18 de diciembre de 2025)
Nuevas funciones
- Deduplicación de imágenes: Cuando subes la misma imagen varias veces en una conversación, la IA ahora la reconoce como duplicada y hace referencia a la original en lugar de procesarla de nuevo. Esto ahorra tokens de contexto y ayuda a la IA a entender que te refieres a la misma imagen.
Mejoras
- Deduplicación de documentos: Coincidencia de documentos entre fuentes mejorada; el mismo contenido de documento ahora se reconoce tanto si proviene de una carga de usuario, un archivo adjunto de Gmail o la ingesta de una página web.
Corrección de errores
- Errores de autenticación PDF: Se corrigió el problema donde los errores de autenticación (401, 403) al obtener PDFs protegidos se enmascaraban como fallos de extracción genéricos. El error de autenticación real ahora se muestra correctamente con orientación útil.
Versión 0.8.44 (18 de diciembre de 2025)
Corrección de errores
- Botón Recargar/Regenerar: Se corrigió el problema donde hacer clic en recargar en un mensaje del asistente mostraba la respuesta antigua en lugar de la nueva que se estaba generando. La interfaz ahora cambia correctamente a la nueva rama durante el streaming.
Mejoras
- Gestión de la ventana de contexto: Ahora se utiliza una estimación de tokens más conservadora (3 caracteres/token) de forma consistente en todos los cálculos de paginación y contexto, reduciendo la posibilidad de errores de desbordamiento de contexto con páginas web grandes.
Versión 0.8.43 (17 de diciembre de 2025)
Mejoras
Visualización de línea de tiempo y razonamiento
- Colapso automático al finalizar: Los bloques de razonamiento y la línea de tiempo del proceso ahora se colapsan automáticamente cuando termina la generación, manteniendo la conversación limpia pero accesible
- Pensamientos intermedios visibles: El "pensar en voz alta" del agente entre llamadas a herramientas ahora se muestra en línea en la línea de tiempo, dando una mejor visión del proceso de toma de decisiones del agente
- Etiquetas de acción de herramienta: Las llamadas a herramientas ahora muestran la acción específica en la etiqueta (p. ej., "Web Browse → click" en lugar de solo "Web Browse")
Resultados de herramientas
- Corrección de visualización de capturas de pantalla: Las capturas de pantalla e imágenes ya no se expanden automáticamente en los resultados de las herramientas; solo el contenido de texto renderizado (como los resultados de búsqueda) se expande automáticamente
Corrección de errores
- CORS de Ollama: Se corrigieron los problemas de conexión al usar Ollama desde la extensión de Chrome; los encabezados CORS ahora se manejan automáticamente
Versión 0.8.41 (15 de diciembre de 2025)
Mejoras
- Seguridad de Tipos: El adaptador de almacenamiento del servidor ahora usa tipos de TypeScript adecuados en lugar de
anypara hilos, habilidades, perfiles, servidores MCP e información de licencia - Sistema de Construcción: El directorio de respaldo ahora es opcional mediante la variable de entorno
caiioo_BACKUP_DIR(ya no está codificado)
Versión 0.8.4 (15 de diciembre de 2025)
Nuevas funciones
Soporte para imágenes DNG/RAW
- Archivos RAW de cámara: Suba archivos DNG (Digital Negative) directamente desde su cámara o biblioteca de fotos
- Extracción automática de vista previa: Las vistas previas JPEG integradas se extraen de los archivos RAW para un procesamiento rápido
- Preservar calidad original: Los datos RAW originales se conservan mientras la IA trabaja con la vista previa de alta calidad
Manejo mejorado de imágenes
- Compresión del lado del servidor: Las imágenes grandes que exceden los límites de compresión local ahora son procesadas por el servidor de escritorio
- Mejor retroalimentación de errores: Indicadores visuales de error (borde rojo, icono de alerta) cuando falla el procesamiento de imágenes
- Respaldo elegante: La compresión vuelve automáticamente al servidor cuando el documento fuera de pantalla no está disponible
Mejoras
- Arquitectura de agente compartido: Ejecutor de agente unificado compartido entre la extensión y el servidor de escritorio para un comportamiento consistente
- Consolidación del manejador de protocolos: El almacenamiento y el manejo de mensajes ahora utilizan manejadores de protocolos compartidos
Versión 0.8.3 (13 de diciembre de 2025)
Nuevas funciones
Aplicaciones móviles nativas
- Aplicación Android: Aplicación Kotlin nativa (
android-app/) con WebView + canales de puente nativos (CalendarContract, SAF/selector de fotos, AlarmManager, streaming OkHttp). - Interfaz compartida: Las aplicaciones móviles utilizan la misma interfaz React que la extensión web para una experiencia consistente.
- iOS + Android: Swift nativo (iOS) y Kotlin nativo (Android) con APIs de puente coincidentes.
Mejoras
- Sincronización de identidad: Mejora en la sincronización de datos de licencia y perfil entre la extensión y el servidor de escritorio.
- Gestión de archivos adjuntos: Mejor manejo de archivos adjuntos en modo LAN/relay.
- Seguimiento del cliente de extensión: El servidor de escritorio ahora rastrea los clientes de extensión conectados con marcas de tiempo.
Eliminado
- Aplicación Swift Relay: La funcionalidad de relay en macOS ahora es manejada completamente por el servidor de la aplicación nativa (introducido en 0.8.2).
Versión 0.8.2 (12 de diciembre de 2025)
Nuevas funciones
Servidor de escritorio multiplataforma
- Servidor Caiioo: La nueva aplicación de escritorio basada en Electron reemplaza la aplicación de relevo Swift exclusiva para macOS
- Soporte para Windows: Instalador nativo de Windows (NSIS) y ejecutable portátil
- Soporte para Linux: Paquetes AppImage y .deb para distribuciones de Linux
- Integración en la barra de menú: Aplicación en la bandeja del sistema/barra de menú con indicadores de estado y controles rápidos
Ejecución de scripts específica por plataforma
- API de scripts unificada: El nuevo endpoint
/api/scriptdetecta automáticamente la plataforma y utiliza el motor de scripts adecuado - PowerShell en Windows: Ejecuta scripts de PowerShell para la automatización del sistema en Windows
- Bash en Linux: Ejecuta scripts de shell (bash/sh/zsh) en sistemas Linux
- AppleScript en macOS: Se mantiene el soporte existente para AppleScript/JXA
Ayudantes multiplataforma
- Notificaciones de escritorio: Muestra notificaciones utilizando APIs nativas en todas las plataformas
- Acceso al portapapeles: Lee y escribe el contenido del portapapeles de forma multiplataforma
- Detección de ventana activa: Obtiene la aplicación en primer plano y el título de la ventana
- Información del sistema: Recupera información del SO, CPU y memoria
Mejoras
- Flujo de compilación automatizado: La versión, los iconos y las licencias se sincronizan desde el proyecto principal durante la compilación
- Distribución más ligera: Se eliminaron bases de código redundantes de aplicaciones móviles en preparación para compilaciones unificadas
Versión 0.8.1 (11 de diciembre de 2025)
Nuevas funciones
Opciones flexibles de inicio de sesión
- Múltiples métodos de autenticación: Inicie sesión con Google OAuth, correo electrónico/contraseña o clave de licencia: elija lo que mejor le funcione
- Vinculación de cuentas: Vincule su cuenta de Google a una cuenta de correo electrónico/contraseña existente para un acceso fluido entre métodos
OAuth personalizado para servidores MCP
- Traiga sus propias credenciales OAuth: Para servidores MCP que requieren clientes OAuth pre-registrados, ahora puede proporcionar su propio ID de cliente y secreto
- Actualización dinámica de tokens: Los tokens OAuth se actualizan automáticamente, asegurando conexiones ininterrumpidas a los servidores MCP
Mejoras
- Indicadores de procesamiento de documentos: Indicadores visuales claros al procesar archivos PDF, Word y hojas de cálculo de Excel
- Navegación de configuración por nivel: El panel de configuración ahora muestra de forma inteligente las opciones relevantes según su nivel de suscripción
- Mejor manejo de errores OAuth: Mensajes de error mejorados cuando falla la detección de OAuth del servidor MCP
Version 0.8.0 (10 de diciembre de 2025)
Nuevas Funcionalidades
Navegador y Gestión de Servidores MCP
- Explorar Servidores MCP: Busque e instale servidores MCP tanto del MCP Registry como de npm directamente dentro de Settings.
- Servidores MCP Locales: Ejecute servidores MCP localmente en su máquina a través de la relay app para mayor privacidad y control.
- Resolución de Credenciales: Los servidores MCP ahora pueden extraer credenciales del Credentials Vault para una autenticación segura.
- Monitoreo de Salud: Verificaciones automáticas de estado para los servidores MCP conectados con indicadores de estado.
Gestión de Perfiles
- Múltiples Perfiles: Cree y cambie entre múltiples perfiles de usuario.
- Selector de Perfiles: Menú desplegable de fácil acceso para cambiar perfiles en el composer.
- Eliminación de Perfiles: Elimine los perfiles que ya no necesite.
Selección de Cuenta de Google
- Diálogo de Elección de Cuenta: Al conectar servicios de Google, elija entre su cuenta de perfil de Chrome o añada una cuenta de Google diferente.
- Flujo OAuth Web: Opción para autenticarse a través del navegador web para cuentas que no han iniciado sesión en Chrome.
Browser Agent Mejorado
- Acción de Retroceso: El agente ahora puede navegar hacia atrás en el historial del navegador.
- ARIA Snapshot: Captura instantáneas del árbol de accesibilidad para un análisis de página más eficiente con menos tokens.
Aplicaciones Móviles
- App para iOS: Cliente nativo de iOS para acceder a Caiioo en su red local.
- App para Android: Cliente nativo de Android con descubrimiento de servidores y almacenamiento en caché de WebView.
Sincronización Multi-dispositivo
- Identidad del Dispositivo: Cada dispositivo/extensión conectado se rastrea con su propia identidad.
- Sincronización de Estado: Sincronización de estado en tiempo real a través de múltiples extensiones conectadas.
- Autenticación de Cliente Web: Autenticación segura para clientes web que se conectan al relay.
Mejoras
- Gestión de Claves de Proveedores LLM: Gestione las API keys para varios proveedores de LLM directamente en el Credentials Vault.
- Imágenes de Herramientas MCP: Las herramientas MCP que devuelven imágenes ahora se muestran insertadas en la conversación.
- Detección de Texto en PDF: Mejora en la detección de texto distorsionado o con espacios excesivos en la extracción de PDF con evaluación de confianza.
- Bypass de CORS para Imágenes: Las imágenes ahora se obtienen a través de un documento offscreen para omitir las restricciones de CORS.
Corrección de Errores
- Seguimiento del Estado de Generación: Mejora en la captura del estado final para garantizar que la finalización de la generación se detecte con precisión.
Versión 0.7.8 (7 de diciembre de 2025)
Nuevas funciones
Soporte para hojas de cálculo de Excel
- Importación de XLSX: Carga hojas de cálculo de Excel (.xlsx) directamente a tus conversaciones
- Extracción de datos: El contenido de la hoja de cálculo se analiza y se pone a disposición de la IA para su análisis
- Edición de ida y vuelta: Edita hojas de cálculo en Slate y expórtalas de nuevo al formato XLSX
Diálogo "Novedades"
- Notificaciones de actualización: Después de actualizar Caiioo, un diálogo de "Novedades" muestra automáticamente las notas de la versión para la nueva versión
- Notas específicas de la versión: Mira exactamente qué cambió en tu actualización, con listas de funciones y mejoras formateadas
- No intrusivo: El diálogo solo aparece una vez por actualización y no se muestra en la primera instalación
Versión 0.7.6 (3 de diciembre de 2025)
Nuevas funciones
Compatibilidad con documentos de Word con control de cambios
- Importación DOCX: Sube documentos de Word (.docx) directamente a tus conversaciones
- Control de cambios visible: Visualiza inserciones (verde) y eliminaciones (tachado rojo) con autor y fecha al pasar el cursor
- Compatibilidad con comentarios: Los comentarios se resaltan en amarillo con información sobre herramientas que muestra el texto y el autor
- Edición en Slate: Visualiza y edita el contenido DOCX en Slate con todo el estilo de control de cambios
- Compatibilidad con modo oscuro: Todos los estilos de control de cambios y comentarios funcionan tanto en temas claros como oscuros
Versión 0.7.4 (2 de diciembre de 2025)
Nuevas funciones
Generador de imágenes FLUX
- Generación de imágenes por IA: Genera imágenes a partir de descripciones de texto usando modelos FLUX AI a través de OpenRouter
- Edición de imágenes: Edita imágenes existentes en tu conversación proporcionando el ID del archivo adjunto y las instrucciones de edición
- Compatibilidad con referencias múltiples: Combina elementos de hasta 10 imágenes con el modelo flux.2-flex
- Modelos múltiples: Elige entre flux.2-pro (rápido, predeterminado) o flux.2-flex (calidad máxima)
- Almacenamiento automático: Las imágenes generadas se guardan en tu conversación y se muestran en línea
- Seguimiento de costes: Los costes de generación de imágenes se rastrean por separado y se añaden a los totales del hilo
Versión 0.7.3 (1 de diciembre de 2025)
Nuevas funciones
Selector de modelos mejorado
- Selector de modelos unificado: Experiencia de selección de modelos coherente en el compositor y los ajustes
- Indicadores de privacidad: El icono de escudo muestra los modelos con Retención de Datos Cero (ZDR): tus prompts no se usarán para entrenamiento
- Compatibilidad con visión: El icono de ojo indica los modelos que pueden analizar imágenes
- Modelos recomendados: El icono de estrella destaca las opciones recomendadas (Claude Haiku 4.5, Claude Sonnet 4.5)
- Transparencia de costes: Consulta el precio por millón de tokens directamente en la lista de modelos; identifica fácilmente los modelos GRATIS
- Leyenda de iconos: Referencia rápida en los ajustes que explica el significado de cada indicador
Versión 0.7.2 (1 de diciembre de 2025)
Nuevas funciones
Ingesta de documentos PDF
- Sube PDFs directamente: Adjunta documentos PDF a tus mensajes; se procesan automáticamente mediante OCR de Mistral
- Extracción de texto de alta calidad: Tablas, figuras, ecuaciones y formato se conservan como Markdown
- Ingesta de documentos por agentes: Los agentes pueden procesar URLs de PDF que encuentren mientras navegan usando la nueva acción
ingest_document - Almacenamiento persistente: El contenido extraído se guarda para futuras consultas sin costes de reprocesamiento
Corrección de errores
- Archivos adjuntos de imágenes grandes: Las imágenes de más de 5 MB ahora se comprimen automáticamente antes de enviarse a las API de LLM, solucionando los errores de "la imagen supera el máximo de 5 MB" con proveedores como Google/Gemini
Versión 0.7.0 (1 de diciembre de 2025)
Nuevas funciones
Compatibilidad con hilos múltiples
- Ejecuta varios agentes simultáneamente: Ahora puedes tener hasta 3 hilos ejecutándose al mismo tiempo
- Indicadores visuales de ejecución: Aparecen puntos animados junto a los títulos de los hilos en la barra lateral cuando ese hilo está generando activamente
- Procesamiento en segundo plano: Los agentes trabajan en segundo plano sin robar el foco; navega libremente mientras trabajan
- Aislamiento de hilos: Cada hilo rastrea sus propias pestañas y estado de forma independiente
No interferencia de agentes
- Mantén el control: Cuando un agente abre pestañas o navega por páginas, no robará tu foco si te has movido a una pestaña diferente
- Conciencia inteligente de pestañas: Los agentes solo trabajan con las pestañas que crearon o con las que empezaron, sin seguirte a nuevas pestañas a mitad de la ejecución
Integración con Apple (macOS)
- Notas de Apple: Lee, crea, busca y organiza notas en carpetas; la IA puede ayudar a redactar y editar notas directamente
- Recordatorios de Apple: Gestiona listas de tareas y recordatorios; crea, completa y organiza tareas con la asistencia de la IA
Versión 0.6.5 (30 de noviembre de 2025)
Nuevas funciones
Sugerencias de seguimiento por IA
- Prompts inteligentes: Después de que el asistente responda, aparecen sugerencias de seguimiento generadas por IA para ayudar a continuar la conversación
- Consciente del contexto: Las sugerencias se basan en el contexto de la conversación y en lo que podrías querer hacer a continuación
Mejoras
Ajustes de retransmisión LAN
- Mostrar dirección de red: Cuando se conecta al servidor de retransmisión, los Ajustes ahora muestran la dirección IP real y el nombre de host
.localpara una fácil conexión de dispositivos móviles - Instrucciones simplificadas: La información de conexión aparece automáticamente una vez que el servidor está en marcha; no es necesario consultar el terminal
Versión 0.6.4 (29 de noviembre de 2025)
Corrección de errores
Sistema de revisión de Slate
- Aceptar/Rechazar a nivel de palabra: Los cambios de palabras individuales ahora pueden aceptarse o rechazarse de forma fiable sin romper los cambios posteriores
- Control de cambios estable: Se solucionó el problema por el cual aceptar un cambio hacía que otros cambios pendientes no se pudieran hacer clic
- Renderizado de Markdown en vista previa: Las vistas previas de cambios ahora renderizan el formato markdown (negrita, cursiva, etc.) en lugar de mostrar asteriscos sin procesar
- Corrección de bucle infinito: Se solucionó el bloqueo del navegador al aceptar adiciones de texto puro
- Visualización completa de diferencias: La vista previa de cambios ahora muestra todas las palabras eliminadas y añadidas, no solo las diferencias mínimas
Versión 0.6.3 (26 de noviembre de 2025)
Nuevas funciones
- Experiencia predeterminada de usuario básico: Los nuevos usuarios ahora comienzan como usuarios básicos en lugar de administradores
- Actualización de clave de licencia: Se añadió un botón destacado de "Actualizar a Pro" en Ajustes para desbloquear funciones de administrador con una clave de licencia
- Onboarding simplificado: Experiencia de usuario por primera vez más limpia centrada en la funcionalidad principal
Versión 0.6.2 (26 de noviembre de 2025)
Corrección de errores
- Recuperación de tiempo de espera de generación: Se solucionaron los fallos silenciosos durante operaciones largas de Slate donde la interfaz mostraba "generando" indefinidamente
- El backend ahora rastrea la actividad durante la generación y agota el tiempo de espera después de 2 minutos sin progreso
- Los fragmentos de streaming, la ejecución de herramientas y las decisiones del agente reinician el tiempo de espera
- Recuperación automática cuando el service worker se reinicia a mitad de la generación (detección de estado huérfano)
- Mensaje de error mostrado al usuario cuando ocurre un tiempo de espera en lugar de un bloqueo silencioso
Versión 0.6.1 (26 de noviembre de 2025)
Nuevas Funcionalidades
Importación/Exportación de Hilos
- Exportar Hilos Seleccionados: Active el modo de selección para elegir hilos específicos para exportar
- Exportar Todos los Hilos: Exportación con un solo clic de todas las conversaciones con sus archivos adjuntos
- Importar desde Archivo: Importe hilos desde archivos JSON exportados
- Importación Selectiva: Elija qué hilos importar de un archivo
- Detección de Duplicados: Detecta automáticamente hilos que ya existen con la opción de omitir o sobrescribir
- Soporte de Archivos Adjuntos: Todas las imágenes, PDFs y archivos se incluyen en las exportaciones
- Soporte de Hilos Archivados: Tanto los hilos activos como los archivados pueden ser exportados/importados
Prompt Caching Mejorado
- Mejores tasas de acierto de caché para conversaciones largas con modelos Claude
- La estrategia de caché dinámica se adapta a la longitud de la conversación
Integración con Google Workspace
- Google Drive: Busque, cree, copie, mueva y comparta archivos y carpetas
- Gmail: Lea correos electrónicos, gestione etiquetas, cree borradores (seguridad ante todo: solo borradores, sin envío automático)
- Google Calendar: Liste calendarios, consulte eventos, cree/actualice/elimine eventos, encuentre franjas horarias libres
- Autorización Inline: Autorice el acceso a Google directamente desde el chat sin visitar Settings
Mejoras en la Navegación Web
- Nueva acción
click_coordinatespara hacer clic en elementos por posición en pantalla - Las URLs ahora se abren en pestañas nuevas por defecto (evita la sobrescritura de pestañas)
- Pestañas agrupadas automáticamente por hilo de conversación
- Mejor detección de selectores CSS para clics en elementos más fiables
Selección de Modelo
- El selector de modelo se ha movido al área del composer para un cambio rápido
- El modelo persiste globalmente a través de los cambios de modo
- Modelos con capacidad de visión marcados con un icono de ojo
Interfaz de Streaming
- Los parámetros de las herramientas se muestran a medida que se transmiten
- Visualización progresiva de bloques de razonamiento/pensamiento
- Indicador de estado "Generando..." durante la respuesta
Seguimiento de Uso de Tokens y Costes
- Muestra tokens de entrada, salida, razonamiento y caché
- Muestra el coste por mensaje y el coste acumulado del hilo
Mejoras de la Interfaz de Usuario (UI)
- Selector de Modo Disponible para Todos los Usuarios: Los usuarios que no son administradores ahora pueden cambiar entre modos en Settings
- Secciones de Settings Colapsables: Las secciones del panel de Settings pueden colapsarse/expandirse para una navegación más sencilla
- Configuración de AI & Model (LLM Provider, API Key, Model, Temperature, Max Iterations)
- Personalización (Personal Instructions, Profile Variables)
- Configuración de Agent Mode (Mode Selector, Variables, Instructions, Branding, Tools, MCP Servers)
- Ajustes de apariencia
- Backup & Restore
- Documentación
- Colores de Tema Específicos por Modo: Cada modo integrado tiene ahora un esquema de colores por defecto
- Shopping Agent: Verde
- Travel Agent: Azul
- Helper Agent: Rosa
- Caiioo (General): Púrpura
- Modo Cromático: Active la rotación de color para ciclar gradualmente a través del espectro
- Gestión de Sobrescritura de Temas:
- Un indicador visual muestra cuando el tema está personalizado (no se perderá al cambiar de modo)
- El botón "Save as Mode Defaults" (admin) persiste el tema como el nuevo valor por defecto del modo
- "Reset to Mode Defaults" restaura los colores originales del tema del modo
- Nueva imagen de marca e icono de Caiioo
- Selector de modo movido al área del composer
- El botón de nuevo hilo muestra un menú desplegable de selección de modo
- Alternador de lista de hilos en la barra superior del composer
- Efecto de borde de viñeta en las pestañas del navegador controlado
- Botón de parada flotante en las pestañas controladas
- Los menús desplegables se posicionan correctamente cerca de los bordes de la pantalla
Corrección de Errores
- El selector de modelo se actualiza inmediatamente después de un cambio en los ajustes
- El onboarding de nuevos usuarios ahora inicia correctamente el Helper Agent
- El panel de Settings ya no falla con variables personalizadas mal formadas
- Los nombres de los grupos de pestañas se mantienen actualizados cuando cambia el título del hilo
- Los widgets de aceptar/rechazar de Slate se posicionan correctamente
- El pensamiento extendido funciona con más modelos (Haiku 4.5, Gemini, etc.)
- Corregido el error "maximum 4 cache_control blocks"
Versión 0.3.4 (24 de noviembre de 2025)
Nuevas funciones
Contexto de selección de texto
- El botón "Añadir al prompt" aparece al seleccionar texto en páginas web
- El texto seleccionado se muestra como etiquetas en el editor con el contexto de la página
- Ubicación DOM capturada para una interacción precisa del agente
Integración con Google Calendar
- Gestión completa del calendario (listar, crear, actualizar, eliminar eventos)
- Búsqueda inteligente de disponibilidad en todos los calendarios
- Análisis de tiempo en lenguaje natural ("mañana", "la próxima semana")
Corrección de errores
Modo Slate
- Los botones Aceptar/Rechazar ya no se ocultan detrás del contenido del editor
- Resaltado de diferencias a nivel de palabra (no líneas enteras)
- Las múltiples llamadas a
propose_changeahora se acumulan correctamente - El interruptor de vista ya no vuelve a su estado anterior de forma inesperada
Cambio de marca
- Renombrado de "ContextFlow" a "Caiioo"
Versión 0.3.0 (22 de noviembre de 2025)
Nuevas funciones
Acceso móvil y LAN
- Servidor LAN: Accede a Caiioo desde cualquier dispositivo en tu red local
- Barra lateral de conversaciones: Abre conversaciones en una pestaña del navegador para aprovechar una pantalla más grande
- Exportación móvil: Exporta conversaciones como HTML independiente para visualización sin conexión
Corrección de errores
- Se corrigió un error crítico en la lógica de ramificación de mensajes
- Se corrigieron las operaciones en hilos archivados
Versión 0.2.0 (21 de noviembre de 2025)
Nuevas funciones
Soporte extendido de razonamiento (Extended Thinking)
- Los modelos Claude ahora soportan bloques de razonamiento/pensamiento extendido
- Interfaz de razonamiento plegable para ver el proceso de pensamiento del modelo
- Detalles de razonamiento almacenados en caché para continuidad en múltiples turnos
Nuevos proveedores de LLM
- Integración con Ollama: Ejecuta LLMs locales a través de Ollama
- Selección de proveedor en el panel de configuración
Soporte de formatos de imagen
- Soporte HEIC/HEIF: Formatos de imagen de Apple convertidos automáticamente para mayor compatibilidad
Mejoras en la interfaz
- El menú de herramientas se guarda automáticamente al cerrar
- Mejor organización del panel de configuración
Corrección de errores
- Posicionamiento mejorado del autocompletado de variables
Versión 0.1.x (Versiones anteriores)
Funciones principales
- Chat con IA multi-modelo (OpenRouter, Anthropic, OpenAI, Ollama)
- Automatización de navegador y web scraping
- Slate para edición de código y documentos
- Integración con servidor MCP
- Capacidades de captura de pantalla y visión
- Entrada de voz
- Gestión y ramificación de hilos
- Sistema de perfiles y modos