Esta es una traducción automática del documento original en inglés. En caso de cualquier discrepancia entre esta traducción y la versión original en inglés, prevalecerá la versión en inglés. Leer la versión original en inglés
Versión 0.9.724 (18 de junio de 2026)
Una continuación de la versión 0.9.723 que añade a OpenAI como proveedor de voz bajo la modalidad bring-your-own-key, analíticas de uso anónimas opcionales que usted controla totalmente y vistas previas enriquecidas para archivos adjuntos de audio y video, junto con correcciones para aplicaciones del Hub con uso intensivo de herramientas, nombres de habilidades, inicios de sesión en servicios conectados y el bloqueo al iniciar tras el vencimiento de una suscripción.
Nuevas Funciones
- Común: OpenAI es ahora un proveedor de voz bring-your-own-key: El modelo gpt-4o-mini-tts de OpenAI se une al selector de voz por modo para la conversión de texto a voz. Su entrega es direccionable: solicite un acento, tono o ritmo en lenguaje natural (por ejemplo, "lee esto con un cálido acento irlandés") y la voz lo seguirá. Añada su API key de OpenAI en Settings → Voice.
- Común: Los archivos adjuntos de audio y video ahora muestran una vista previa real: Un clip de audio grabado o adjunto renderiza su forma de onda real en la ficha del adjunto en lugar de un icono de archivo genérico, y un adjunto de video muestra un fotograma estático tomado del clip, para que pueda distinguir los clips de un vistazo. La vista previa se genera una vez y se reutiliza.
- Común: Analíticas de uso anónimas opcionales — desactivadas por defecto en el EEE, Reino Unido y Suiza: Puede optar por compartir señales anónimas y sin contenido que nos ayudan a encontrar y solucionar problemas de fiabilidad; por ejemplo, si un turno tuvo éxito o encontró un tipo de error específico, además de sus comentarios explícitos 👍/👎 sobre una respuesta. Nunca incluye sus conversaciones, prompts, identidad, dirección IP ni ningún identificador que le siga entre sesiones; es solo de origen (sin rastreadores de terceros); y los eventos se almacenan sin nada que los vincule con usted. En el EEE, Reino Unido y Suiza permanece desactivado hasta que lo active; en otros lugares está activado con un interruptor de desactivación de un solo toque. Cámbielo en cualquier momento en Settings → Privacy & Diagnostics; no hay cargos, descuentos ni diferencias en las funciones en ninguno de los casos.
Mejoras
- Común: Settings → Voice advierte cuando un proveedor de voz no es de baja latencia: Gemini y OpenAI terminan de generar toda la respuesta antes de que se reproduzca cualquier audio, por lo que el primer sonido puede tardar unos segundos en respuestas largas, a diferencia de ElevenLabs, Cartesia y Resemble, que comienzan a hablar a medida que llega el audio. Al elegir uno de los proveedores más lentos, ahora se muestra una breve nota debajo del selector de voz que explica la compensación y señala las opciones más rápidas, para que el retraso sea esperado en lugar de confuso.
- Común: El interruptor de análisis de audio ahora está oculto a menos que una aplicación lo necesite: El botón de forma de onda junto al micrófono —que adjunta su grabación real para que un modelo con capacidad de audición pueda revisarla junto con su prompt— es un control especializado que no es útil para la mayoría de las tareas. Ahora está oculto por defecto y solo aparece en modos o aplicaciones que optan explícitamente por él, de modo que ya no satura el compositor. Si una grabación estaba configurada previamente para ser capturada, esa captura también se pausa mientras el interruptor está oculto, por lo que no se graba nada sin un interruptor de apagado visible.
Correcciones de Errores
- Común: Las aplicaciones instaladas del Hub ya no envían todas las herramientas en cada turno: En las aplicaciones que preconfiguran a qué herramientas accede el asistente (para Medicina, para Legal y similares), esa configuración se estaba ignorando, por lo que cada turno enviaba silenciosamente la lista completa de herramientas, haciendo que los turnos fueran más lentos y costosos. Ahora se respeta la configuración, por lo que cada turno incluye solo las herramientas pertinentes.
- Común: Las habilidades integradas muestran sus nombres reales: Una habilidad predeterminada podía aparecer con un nombre provisional como "Skill 1781…" en lugar de su título adecuado; las habilidades ahora muestran nombres legibles (por ejemplo, "Summarize Page"), y cualquier habilidad ya creada con un marcador de posición se corrige automáticamente.
- Extensión: Los servicios conectados ya no se desconectan prematuramente cuando se usan a través de su relay privado: Actualizar el inicio de sesión de un servicio conectado a través de su relay privado podía perder el token de sesión y ser rechazado, marcando la conexión como expirada antes de tiempo. El inicio de sesión ahora se actualiza correctamente.
- Común: Se corrigió un bloqueo al iniciar después de que una suscripción expirara: Si su suscripción Pro expiraba o se cancelaba, la aplicación podía quedarse atascada repitiendo la degradación al nivel gratuito mientras se cargaba, bloqueando la interfaz antes de terminar de abrirse. La degradación ahora se completa limpiamente en un solo paso, por lo que la aplicación se inicia normalmente y mantiene todas las funciones del nivel gratuito.
Versión 0.9.723 (12 de junio de 2026)
Una actualización dirigida tras la versión 0.9.722 con un nuevo proveedor de voz BYOK, una nueva aplicación de soporte para decisiones clínicas, edición integrada para aplicaciones personales del Hub, la capacidad de usar Caiioo desde cualquier navegador a través de su propio relay privado, un panel de Configuración más claro, edición de modo duradero con bifurcación (forking) automática, una segunda revisión sustancial del flujo de documentos de ida y vuelta (round-trip), una revisión de fiabilidad de streaming en todos los proveedores de AI y un barrido de refuerzo de seguridad.
Nuevas Funciones
- Common: Cartesia ahora es un proveedor de voz BYOK: Cartesia Sonic para texto a voz (TTS) y Cartesia Ink para voz a texto (STT) ya están disponibles en el selector de voz por modo, en los diálogos de primer uso de TTS / STT y en la ruta de subtítulos en vivo. Agregue su clave de API de Cartesia en Configuración → Voz y elija Cartesia donde sea posible seleccionar un proveedor de voz.
- Common: Edite cualquier aplicación bifurcada del Hub dentro de Caiioo: Configuración → Herramientas, Modos y Aplicaciones incluye ahora un editor por primitiva para aplicaciones personales (aplicaciones bifurcadas del Hub y aplicaciones guardadas por usted). Las tarjetas, vistas, flujos de trabajo, habilidades (skills), modos y variables tienen editores dedicados con valores predeterminados seguros, de modo que una primitiva malformada en una bifurcación ya no puede romper el editor. El agente también puede capturar una sesión útil en un borrador de aplicación personal a través de la nueva herramienta
save_session_as_app; diga "guarda esto como una aplicación" (o similar) y se guardará en su almacén de aplicaciones personales para que pueda perfeccionarla. - Common: Edite el prompt de sistema de cualquier modo — Caiioo lo bifurca por usted: Ahora puede editar el prompt de sistema (o la definición completa) de cualquier modo, incluidos los integrados y los instalados desde el Hub. La primera edición bifurca automáticamente la aplicación del modo en una copia personal, por lo que sus cambios se mantienen al cambiar de modo y se sincronizan con sus otros dispositivos como cualquier aplicación personal. Aparecerá un banner de "Bifurcado de... — su copia" siempre que su copia esté activa, con un botón de Restablecer que restaura el original. Los modos personalizados existentes migran a este sistema automáticamente.
- Common: Caiioo for Medicine (beta): Una nueva aplicación instalable desde el Community Hub que sigue el patrón de Caiioo for Legal — una factoría de soporte para decisiones clínicas que agrupa habilidades de diagnóstico diferencial, interacción de medicamentos y notas SOAP junto con sus materiales de referencia. Instalación con un solo clic, bifurcable como cualquier aplicación del Hub.
- Common: Use Caiioo desde cualquier navegador a través de su propio relay privado: Cuando haya iniciado sesión y su relay de escritorio esté ejecutándose, al abrir caiioo.ai en un navegador sin la extensión, ahora se mostrará la misma interfaz de panel lateral a través de su relay privado. De este modo, puede usar Caiioo desde un Chromebook, una computadora pública o una tableta, mientras que cada llamada a herramientas se sigue enrutando a través de su propia máquina.
- Common: Panel de Configuración reorganizado: El diseño de la configuración avanzada ahora cuenta con siete categorías de intención del usuario — Cuenta, Personalización y Privacidad, Configuración de AI, Herramientas / Modos y Aplicaciones, Datos y Sincronización, Conectividad y Ayuda — en lugar de las cinco históricas. El Perfil de Usuario y el Almacén de Credenciales se mueven a una categoría dedicada de Cuenta; LAN Relay / Acceso a la API / Pasarela de Mensajería se agrupan como Conectividad (el hilo común son las superficies de red entrantes/salientes); Voz se mueve a Configuración de AI (es un comportamiento de AI, no una herramienta); y Copia de Seguridad / Sincronización Privada / Gestión de Datos forman su propia categoría de Datos y Sincronización. La variante de modo simple colapsa los mismos controles en seis categorías con los controles para usuarios avanzados ocultos por completo.
Mejoras
- Common: Ida y vuelta de documentos — segunda revisión de fidelidad: Otro barrido a través de Slate / DOCX / PDF / RTF / Google Docs cerró una larga lista de hallazgos en el proceso de ida y vuelta. Aspectos destacados: los cambios controlados generados ahora emiten IDs de cambio válidos para Word y aplanan los marcadores de cambio anidados (para que Word deje de quejarse de cambios controlados "corruptos" al abrir); los comentarios de DOCX se deduplican por ID en lugar de contarse doble; la exportación de DOCX → Markdown escapa los caracteres
|literales en las celdas de las tablas para que la tabla no se deshaga; el analizador de RTF ahora consume correctamente los segmentos binarios incrustados (\binN) para que los bytes sueltos ya no desincronicen el resto del documento, omite adecuadamente los fallbacks de Unicode\uc, decodifica el hex\'hhvía Windows-1252, preserva las revisiones controladas y renderiza marcadores de posición de imagen; los CMapsToUnicodede PDF decodifican pares sustitutos y formas de matriz bfrange / multi-unidad (los caracteres no-BMP y emojis se extraen limpiamente); la detección de prefijos de cambios controlados maneja marcadores de lista indentados y anidados, además de la numeración con); y la matriz de fidelidad ahora muestra la pérdida de comentarios para docx → md/html/rtf y pdf → docx para que pueda ver de antemano qué no se mantendrá en la ida y vuelta. La exportación a RTF también elimina las eliminaciones controladas pendientes en lugar de incluirlas como texto literal. - Common: Las fórmulas de Google Sheets sobreviven a la sincronización de Slate: Editar una Google Sheet sincronizada desde Slate ya no reescribe las fórmulas como sus valores evaluados. La resolución de cambios controlados en Slate también se ha corregido para que aceptar / rechazar confirme el texto correcto cuando el contenido ya coincide con el objetivo.
- Common: La sincronización de Google Docs ignora los párrafos de celdas de tabla: El escáner de sincronización anteriormente entraba en las celdas de las tablas y producía desplazamientos (offsets) de documento incorrectos. Ahora se omiten las celdas antes del escaneo de párrafos, por lo que las ediciones aterrizan en la posición correcta en documentos que contienen tablas.
- Common: El Pseudonymizer protege los IDs generados por máquina de extremo a extremo: Slate (y cualquier herramienta que emita identificadores generados por máquina) ahora puede envolverlos en un marcador
<!--no-pseudonymize-->que sobrevive a todo el flujo — el pseudonymizer los omite y los marcadores se eliminan antes de llegar a la pantalla. Esto soluciona el caso en el que el ID interno de una llamada a herramienta se seudonimizaba en un turno y se perdía del mapa de sustitución en el siguiente, rompiendo las llamadas a herramientas posteriores que hacían referencia a él. - Common: Self Checker ahora ejecuta el juez en el servidor: Al hacer clic en el botón ⚖, el cálculo del veredicto se traslada al relay en lugar de ejecutarse en el panel lateral, por lo que el resultado se completa incluso si cierra el panel, devuelve los resultados más rápido y se mantiene consistente entre dispositivos. La llamada al juez también se enruta a través del mismo pseudonymizer a nivel de hilo que el turno original, por lo que un veredicto sobre un mensaje seudonimizado nunca filtra la PII real al modelo juez.
- Common: Distintivos de Habilidad / Modo en el inventario de Configuración: Cada habilidad instalada en Configuración → Herramientas, Modos y Aplicaciones ahora muestra a qué modo(s) pertenece, para que pueda ver de un vistazo dónde podrá acceder a ella el agente.
- Common: Los usuarios de nivel gratuito con la clave aprovisionada ya no reciben error 401 en búsquedas web: Las herramientas de búsqueda estaban resolviendo la clave de OpenRouter a través de una ruta de código que omitía el resolutor de credenciales, por lo que los usuarios con la clave aprovisionada (sin BYOK) recibían errores 401 intermitentemente. El resolutor ahora se ejecuta en cada punto de llamada.
- Common: El proveedor de contexto de UI es notablemente más ágil: El proveedor de contexto de la interfaz de usuario de la extensión ha ganado almacenamiento en caché de resultados, carga diferida de modos, resolución de alias y exclusiones más estrictas, por lo que el selector de modelos y el selector de modos no se detienen en espacios de trabajo grandes.
- Common: El control deslizante de velocidad de reproducción de voz ahora funciona para ElevenLabs y Cartesia: El control de velocidad no tenía efecto con ElevenLabs o Cartesia — el habla siempre se reproducía a velocidad normal independientemente del ajuste. Ambos proveedores ahora generan habla a la velocidad elegida. (ElevenLabs admite 0.7–1.2×, Cartesia 0.6–1.5×; el control se ajusta al rango de cada proveedor. Resemble y Gemini no ofrecen control de velocidad y permanecen sin cambios).
- Common: La carga del modelo STT es visible en el compositor: Cuando el modelo de voz en el dispositivo se está descargando o preparando, el compositor ahora muestra el porcentaje de descarga real, y las solicitudes de carga concurrentes se serializan para que dos acciones de "hablar" casi simultáneas no inicien descargas duplicadas.
- Common: El compositor mantiene el botón de enviar en pantalla en anchos estrechos: El botón de enviar anteriormente podía quedar fuera del compositor cuando el panel era muy estrecho. Ahora permanece anclado independientemente del ancho.
- Common: El panel lateral remoto se reconecta limpiamente: Para la nueva capacidad de "Caiioo a través de un navegador vía su relay privado", el relay ahora dirige las respuestas de vuelta al navegador remoto correctamente y lo prepara con una captura de estado inicial al conectar, para que las reconexiones se inicien en el mismo estado en que se dejaron.
- Common: Los controladores de activos de UI devuelven los IDs de solicitud: Las respuestas ahora devuelven el ID de la solicitud original al emisor, corrigiendo una clase de errores de indicadores de carga (spinners) bloqueados donde dos peticiones de activos competían y el segundo resultado era descartado.
- Common: Caiioo for Legal ahora es simplemente "for Legal": El prefijo "Caiioo for" en el nombre de la aplicación Legal era redundante una vez que "for Medicine" llegó sin él. Las instalaciones existentes continúan funcionando a través del ID heredado.
- Common: Revisión de fiabilidad de streaming en todos los proveedores de AI: Una revisión profunda de cómo se transmiten las respuestas desde cada proveedor. Los fragmentos de respuesta que llegaban divididos en paquetes de red podían descartarse silenciosamente — rompiendo el pensamiento extendido de varios turnos con modelos de Anthropic, la continuidad del razonamiento con Gemini y GPT-5, y ocasionalmente perdiendo texto de respuesta por completo con modelos MLX locales — y el texto no inglés o los emojis podían llegar corrompidos como caracteres en las respuestas guardadas. Ambos problemas se han corregido en todas partes. El botón de Detener ahora también cancela una búsqueda de Perplexity en curso en lugar de dejar que termine (y se facture) en segundo plano; detener una ejecución ahora llega a cualquier sub-agente que siga trabajando, y las imágenes adjuntas al chatear con modelos de Mistral ya no se deforman en el tránsito.
- Common: Las habilidades ahora tienen nombres adecuados: Cada habilidad lleva un nombre de visualización explícito, que se muestra en Configuración, en el selector de habilidades del compositor y al propio agente — para que las habilidades cuyos prompts comienzan con una redacción similar ya no se colapsen en filas indistinguibles. Escribir "/" en el compositor busca primero por nombre, y publicar en el Hub ahora requiere un nombre en cada habilidad.
- Common: Los modos de aplicaciones del Hub mantienen su configuración completa: Los modos instalados desde el Community Hub (for Legal, for Medicine, ...) podían volver silenciosamente al modo general en lo profundo del núcleo del agente, perdiendo sus variables y configuración de herramientas a mitad de la ejecución. Ahora se resuelven correctamente en todas partes, y un modo cuya definición no pueda resolverse vuelve al prompt estándar de Caiioo en lugar de uno vacío.
- Common: Correcciones para cuentas con clave aprovisionada (emitida por Caiioo): Reemitir su clave de AI proporcionada por Caiioo ya no borra los créditos comprados — el saldo restante se transfiere a la nueva clave. Revocar una clave ahora realmente la revoca con el proveedor antes de informar del éxito. Las cuentas con saldos ilimitados ahora muestran "Ilimitado" en lugar de un número y ya no activan compras automáticas de crédito. Y un breve contratiempo en el inicio de sesión al restaurar su clave en un nuevo dispositivo ahora reintenta en lugar de fallar.
- Common: Las selecciones de modelos de nivel gratuito se mantienen actualizadas: La lista de modelos de nivel gratuito ya no ofrece modelos gratuitos que el proveedor ha retirado, lo que anteriormente producía errores inmediatos al ser seleccionados.
- Common: La generación de video verifica primero las capacidades reales de cada modelo: La herramienta de video ahora lee la hoja de capacidades en vivo de cada modelo — relaciones de aspecto admitidas, duraciones, resoluciones y si acepta fotogramas de referencia — directamente del proveedor y valida su solicitud antes de enviarla, de modo que una combinación no admitida falla instantáneamente con un mensaje claro en lugar de tras una larga espera. La animación a partir de imágenes de referencia ahora las envía en un formato que todos los modelos aceptan.
- Common: Cobertura del Pseudonymizer — títulos de hilos y llamadas de ayuda: Con el Pseudonymizer activado, los títulos de conversación autogenerados y las pequeñas llamadas internas de ayuda de AI ahora pasan por la misma protección que sus mensajes — tanto en el cliente como en el relay — para que el título de un hilo ya no pueda llevar un nombre real al modelo. Las respuestas de los sub-agentes también muestran ahora los valores reales en pantalla en lugar de sus nombres sustitutos.
- Common: La sincronización de GitHub maneja contenido no inglés y ediciones simultáneas: Los archivos sincronizados desde GitHub que contienen caracteres acentuados o no latinos ya no llegan distorsionados, y enviar un cambio a un archivo que se ha movido en GitHub desde su última sincronización ahora muestra un conflicto en lugar de sobrescribir silenciosamente la copia más reciente.
- Common: Los errores temporales del servidor ya no cierran su sesión: Un error temporal del servidor durante la actualización diaria de sesión en segundo plano podía borrar su sesión y cerrarla. Ahora solo un rechazo genuino de credenciales cierra su sesión; cualquier error transitorio mantiene su sesión bajo una ventana de gracia.
- Common: El cliente de navegador remoto arranca limpiamente: Abrir caiioo.ai desde un navegador convencional (a través de su relay privado) ya no muestra un largo muro de errores de conexión al iniciar sesión, y después de una actualización, la UI siempre se carga de nuevo en lugar de una copia en caché obsoleta.
- macOS, iOS, Android: Precalentamiento de modelos en arranque en frío: Los modelos de voz y STT en el dispositivo ahora se precalientan durante el arranque de la aplicación en lugar de cargarse de forma diferida en el primer uso, ocultando la latencia de varios segundos de la primera llamada. El primer toque del micrófono ahora se siente casi instantáneo.
- iOS: Cumplimiento de la sección §3.1.1 de la App Store sobre enrutamiento de ventas: Todas las superficies de pago externo (botones de pago de Stripe, enlaces de "gestionar facturación" que apuntan fuera de la aplicación) están bloqueadas tras una verificación de iOS, por lo que el cliente de iOS solo ofrece compras de StoreKit dentro de la aplicación para suscripciones digitales, cumpliendo con la política anti-steering de Apple.
- iOS, macOS: Los registros obsoletos de la extensión de Safari ya no bloquean la ruta del relay: Cuando el WebKit de Apple deja múltiples registros de extensión de Safari obsoletos tras las actualizaciones de la aplicación, Caiioo ahora expulsa los duplicados reemplazados en lugar de dejarlos inactivos y bloqueados, para que la extensión de Safari respaldada por el relay siga funcionando sin necesidad de una reinstalación manual.
- Android: Limpieza de permisos de medios obsoletos:
READ_MEDIA_IMAGESse ha eliminado del manifiesto, y los permisos heredados añadidos implícitamente por la biblioteca LiteRT GPU se han suprimido, por lo que la solicitud de permisos en tiempo de ejecución de la aplicación es ahora mínima — más cercana a lo que los usuarios realmente consintieron.
Seguridad
- Common: Barrido de refuerzo en importaciones, renderizado y registros: Los documentos de Word manipulados y los archivos de importación de conversaciones ya no pueden agotar la memoria mediante trucos de descompresión (límites de tamaño estrictos y análisis de documentos más seguro); una exportación de ChatGPT estructurada maliciosamente ya no puede bloquear el importador; se han cerrado tres riesgos de cross-site scripting en la página de documentos (Slate); el servidor ahora se niega a obtener URLs sugeridas por el modelo que apunten a direcciones de red internas o privadas; las reglas de filtrado se rechazan si su patrón pudiera bloquear el motor de búsqueda; y un registro de depuración de webhook de pago ya no registra secretos.
Corrección de Errores
- Common: La clave de API del proveedor de voz aparece en el lugar correcto: Cuando se usaba un proveedor en la nube solo para voz a texto (por ejemplo, Cartesia Ink como motor de dictado), su campo de clave de API quedaba relegado a la sección de Texto a Voz (salida) en lugar de estar junto al selector de voz a texto — y permanecía visible incluso después de cambiar su voz de TTS a un proveedor diferente. El campo de clave de cada proveedor ahora se renderiza bajo el selector que realmente lo utiliza (entrada vs. salida), impulsado por una única definición de proveedor de voz.
- Common: La lectura automática ahora funciona con las voces de Cartesia y Gemini: El interruptor de "leer respuestas en voz alta" silenciosamente nunca se activaba cuando su voz de TTS era Cartesia o Google Gemini — ambos estaban mal clasificados como modelos en el dispositivo esperando una descarga. La lectura automática ahora se activa correctamente una vez que se establece la clave de API del proveedor (y la voz, donde sea necesario).
- Common: El dictado de Cartesia funciona en todas partes: Cartesia Ink como su motor de voz a texto ahora se reconoce correctamente como listo una vez que se establece su clave de API (en lugar de ser tratado como un modelo local esperando descarga) — en la extensión, aplicaciones nativas y configuraciones respaldadas por relay (macOS, o el cliente web a través de su relay privado), donde el relay anteriormente intentaba cargar "cartesia" como un modelo en el dispositivo.
- Common: La voz de Gemini comienza a reproducirse antes: Google Gemini TTS lee las respuestas en voz alta frase por frase ahora, por lo que la reproducción comienza después de la primera frase en lugar de esperar a que se sintetice toda la respuesta — igualando la sensación de ElevenLabs, Cartesia, Resemble y Kokoro. (La API de Gemini genera una locución completa a la vez, por lo que la fragmentación se hace de nuestro lado; el control de velocidad ahora también se aplica a Gemini).
- Common: Los errores de reproducción de voz ahora se muestran, no son silenciosos: Cuando falla la lectura de una respuesta en voz alta (clave de API faltante/inválida, una voz/modelo de Resemble incompatible, un rechazo del proveedor, etc.), el motivo ahora aparece como un mensaje en pantalla en lugar de fallar silenciosamente con solo un registro en la consola. Los mensajes son accionables (por ejemplo, "La voz de Resemble.ai seleccionada no admite el modelo 'chatterbox-turbo' — elija una voz compatible con Chatterbox...").
- Common: Error de voz/modelo de Resemble.ai más claro: Cuando una voz de Resemble seleccionada no admite el modelo elegido, el error ahora indica exactamente eso y cómo solucionarlo, en lugar de mostrar una carga útil de error interno sin procesar.
- Common: Las fotos HEIC/HEIF de iPhones modernos vuelven a convertirse: Adjuntar una foto de iPhone reciente (HEIC/HEIF) fallaba al convertir — daba un error de "formato no admitido" y recurría a un archivo adjunto simple en lugar de una imagen visualizable. El convertidor de imágenes integrado estaba desactualizado por años y no podía leer fotos de iPhones actuales (especialmente tomas de resolución completa y HDR). Ha sido reemplazado por un decodificador actualizado, por lo que los adjuntos HEIC/HEIF se convierten en JPEGs y se muestran en línea nuevamente.
- Common: Las herramientas de video y música siempre anuncian la lista de modelos en vivo: Las herramientas de video y música solo mostraban al LLM sus tres IDs de fallback integrados — el precalentamiento en segundo plano por turno que obtenía los registros de video/música de OpenRouter en vivo dentro del subproceso del relay era lento y rutinariamente perdía el plazo antes de que se enviara la descripción de la herramienta. El estado del registro almacenado en caché ahora prepara los servicios de modelos de video y música al arrancar el subproceso, por lo que la herramienta siempre muestra la alineación actual (Kling, Hailuo, Wan, etc.), y un modelo seleccionado por el usuario se resuelve sin un viaje de red por turno.
- Common: Los benchmarks multimodelo de Test Runner ahora devuelven puntuaciones significativas: Ejecutar un benchmark de "comparar estos modelos" con
runLLMJudge = truesolía producir silenciosamente puntuaciones de cero y una clasificación por orden de entrada, porque la ruta a nivel de suite solo verificaba los ajustes deevaluationpor prueba e ignoraba el flag de toda la ejecución. El control ahora respeta cualquiera de las señales, y cuando el juez está activado pero no se proporcionó una rúbrica, se aplica una rúbrica predeterminada (factualidad + integridad + claridad + utilidad). Las accionesget_resultyexport_transcriptde la herramientatest_runnertambién ya no rechazan conrunId and testId are requiredcuando solo faltaba uno de ellos — el error ahora nombra el campo que realmente falta. - Common: La reproducción de voz podía ser completamente silenciosa en iOS y Safari: Leer respuestas en voz alta a veces no producía ningún sonido hasta que se reiniciaba la aplicación — el motor de audio se iniciaba en un estado suspendido y nunca se despertaba. La reproducción ahora produce sonido de manera confiable.
- Common: Los recordatorios diarios se activan a la hora establecida: Un recordatorio repetitivo creado para, por ejemplo, las 9:00 AM podía desviarse y activarse en el momento en que se creó cada día. Las recurrencias ahora están ancladas a la hora de inicio programada.
- macOS, Desktop: Las notificaciones de tareas programadas realmente llegan: Cuando una tarea programada terminaba e intentaba notificarle, las aplicaciones de escritorio de macOS y Windows/Linux descartaban la notificación silenciosamente. Ahora aparece como una notificación normal del sistema.
- Common: Los fallos en el registro ya no son silenciosos: Si el correo electrónico de verificación no se puede enviar durante el registro, ahora recibirá un error claro de inmediato en lugar de un registro que parece tener éxito pero nunca entrega el correo.
- Common: El menú de adjuntar "+" del compositor reaparece en paneles estrechos: La corrección anterior que mantenía el botón de enviar en pantalla en anchos muy estrechos recortó inadvertidamente el menú de adjuntar hasta hacerlo desaparecer. Ahora ambos caben.
- Common: Los nombres de modelos Claude vuelven a funcionar para usuarios de BYOK Anthropic: Seleccionar ciertos modelos Claude con su propia clave de Anthropic producía un error de "modelo no encontrado" debido a un mapeo interno de nombres de modelos desactualizado. Los nombres de los modelos ahora pasan a Anthropic tal cual.
- Common: Un paso fallido dentro de un flujo de trabajo de aplicación de varios pasos ahora detiene el flujo: Un flujo de trabajo anidado que fallaba se informaba a su padre como un éxito, por lo que la rama de manejo de errores del flujo de trabajo nunca se ejecutaba. Los fallos ahora se propagan correctamente.
Versión 0.9.722 (22 de mayo de 2026)
Esta es la primera versión en la que tres capacidades largamente esperadas —el Pseudonymizer, el Community Hub y el Messaging Gateway— están disponibles para todos. Las tres han sido reforzadas en el programa de probadores durante meses; los aspectos destacados a continuación cubren el lanzamiento público, así como las nuevas funciones y correcciones que se incluyeron simultáneamente.
Nuevas Funciones
- Común: El Pseudonymizer se lanza para todos: El filtro de datos personales en el dispositivo de Caiioo detecta nombres, correos electrónicos, números de teléfono, direcciones, identificaciones, organizaciones, ciudades y otros valores sensibles en lo que escribes y los sustituye por falsificaciones realistas antes de que lleguen al modelo; luego revierte el cambio localmente al regresar, para que la conversación en tu pantalla siga mostrando los valores reales. El modelo nunca ve los valores reales; las llamadas a herramientas (tool calls) se ejecutan sobre los valores reales tras la restauración. Actívalo con el nuevo icono de escudo junto al botón de enviar: gris para desactivado, azul para el Filtro de Datos Personales, verde azulado para PHI / Limited Data Set, esmeralda para PHI / Safe Harbor. Mientras está activo, un anillo fino del color correspondiente al modo activo rodea el editor como recordatorio ambiental, y aparece una etiqueta "🛡 pseudonymized — N substitutions" bajo cada mensaje que tuvo valores intercambiados; haz clic en ella para ver exactamente qué pares real → falso se usaron, con etiquetas de categoría. Incluye un modo estricto PHI / Safe Harbor (HIPAA §164.514(b)(2): también elimina fechas más allá del año, direcciones geográficas completas y edades superiores a 89 años) para casos en los que necesites un conjunto de datos desidentificado que puedas compartir sin un Acuerdo de Uso de Datos. (La función se llamaba anteriormente "Anonymizer". La renombramos a "Pseudonymizer" porque es el término técnicamente correcto: el GDPR Art. 4(5) reserva "anonimización" para transformaciones unidireccionales e irreversibles, y esta es reversible por diseño; tu pantalla sigue mostrando nombres reales).
- Común: Lanzamiento del Community Hub: Un nuevo mercado de un solo clic para instalar herramientas, modos, servidores MCP y aplicaciones completas que extienden Caiioo. Explóralo desde el interior de la extensión o desde caiioo.ai/hub. El catálogo de lanzamiento incluye Slack (inicia sesión una vez con la aplicación Caiioo Slack — sin configuración manual de la aplicación ni modo de desarrollador), Notion, Linear, GitHub, Atlassian, PandaDoc, Microsoft 365, Legal Data Hunter (más de 18 millones de documentos de jurisprudencia, legislación y doctrina en más de 110 países) y 18 servidores MCP adicionales de autorregistro que se autorizan a través del inicio de sesión de su propio proveedor, sin necesidad de copiar y pegar secretos ni configurar el modo de desarrollador. Cada paquete muestra una vista previa de exactamente lo que instala —herramientas, modos, habilidades, servidores MCP y variables— antes de hacer clic en Instalar.
- Común: Tool Network Access — consentimiento explícito cuando una herramienta sale de tu máquina: Cuando eliges un proveedor de chat local (Ollama, MLX), estás tomando una decisión de privacidad intencionada: tu conversación permanece en el dispositivo. Las herramientas que se dirigen a través de un proveedor remoto (generación de imágenes, música, vídeo, búsqueda web de Perplexity) solían cruzar esa línea silenciosamente. Caiioo ahora se detiene en el primer intento, muestra una tarjeta de Aprobar / Cancelar en línea que nombra la herramienta y el proveedor al que se enviaría, y recuerda tu decisión por proveedor. Revócalo en cualquier momento desde Settings → Personalization & Privacy → Tool Network Access.
- Común: Lanzamiento del Messaging Gateway (Pro): Caiioo ahora puede responder mensajes en las plataformas que tus clientes y contactos realmente usan —WhatsApp Business, Messenger, Telegram, iMessage, Signal, Viber y Beeper— a través de una única pasarela configurable en Settings → Messaging. Cada canal utiliza las credenciales estándar de bot / empresa de su proveedor, introducidas una vez por servicio. Para cada conversación, tú eliges cómo aparece el agente: Auto (el agente responde a todos; cualquier cosa que escribas en el mismo hilo se trata como instrucción que da forma a la siguiente respuesta), Direct (el agente sigue respondiendo automáticamente, pero cualquier cosa que escribas llega al interlocutor como si fueras tú), o Takeover (el agente se retira por completo y tú tomas el control). Los archivos adjuntos de imagen, audio y vídeo fluyen hacia el modelo en ambas direcciones, por lo que puedes preguntar "¿qué hay en esta foto que acaba de enviar el cliente?" y responder en el mismo canal. Slack reside en el Community Hub como su propio paquete MCP; instálalo desde allí en lugar de desde el Messaging Gateway.
- Común: My Day (Beta): Una segunda aplicación instalable desde el Hub: un resumen matutino de un solo clic que reúne el calendario de hoy, correos electrónicos no leídos y documentos recientes en un único tablero. El botón del editor ejecuta el resumen; el agente se renderiza en la misma vista de tablero cada vez, con habilidades de seguimiento para expandir cualquier elemento, redactar una respuesta o programar bloques de trabajo profundo.
- Común: Storybook Builder (beta): Otra aplicación instalable desde el Hub: elige un estilo, audiencia, rango de edad y un resumen libre; el agente diseña un elenco, dibuja retratos de referencia para mantener la consistencia de los personajes, genera cada página con prosa e ilustración, deriva una portada de la mejor página y renderiza el libro terminado en un visor de diseño de desplazamiento legible. Se puede bifurcar (fork) como cualquier aplicación del Hub, por lo que puedes personalizar el prompt maestro o cambiar las opciones de estilo.
- Común: El plan gratuito ahora incluye las aplicaciones de escritorio: Las aplicaciones de escritorio para macOS y Windows / Linux solían requerir Pro. Los usuarios gratuitos ahora pueden iniciar sesión en las aplicaciones de escritorio en todas las plataformas —la plataforma en sí es gratuita, y Pro sigue diferenciándose por capacidades exclusivas de Pro (generación de imágenes, servidores MCP remotos, tareas programadas, etc.).
- Común: Pro Mobile retirado — un único nivel Pro de $9 para web, escritorio y móvil: La compra dentro de la aplicación Pro Mobile de $2.99 (iOS y Android) ha desaparecido. El nivel Pro único de $9/mes ahora desbloquea cada cliente de Caiioo en todas las plataformas —Chrome, Edge, macOS, Windows, Linux, iOS, Android— sin un SKU móvil separado y sin gimnasia de derechos entre plataformas. Los suscriptores actuales de Pro Mobile pasan automáticamente a Pro sin coste adicional y mantienen todas las capacidades que tenían. Las nuevas instalaciones móviles verán solo el nivel Pro de $9 en la pasarela de pago de la aplicación, coincidiendo con el sitio web.
- Común: Caiioo for Legal (beta): Una nueva instalación de un solo clic desde el Community Hub activa quince habilidades legales transversales —marcado de contratos, redacción de cambios (redline), redacción transaccional, memorandos y opiniones, defensa, revisión de manuales (playbooks) por lotes y más— respaldadas por dos manuales de negociación exhaustivos (lado del comprador y lado del vendedor) con niveles de Preferido / Alternativo / Retirada en docenas de cláusulas comunes. Las variables permanecen dentro del ámbito del hilo en el que estás trabajando, por lo que cada asunto mantiene su propio cliente, contraparte, jurisdicción y postura sin mezclarse con el siguiente.
- Común: Self Checker — juzga cualquier respuesta con el nuevo botón ⚖: Cada turno del asistente tiene ahora un botón ⚖ en la barra de acciones. Haz clic en él para calificar esa respuesta frente a tu solicitud; el juez ve el turno completo (tu prompt, las entradas y salidas de cada llamada a herramienta, las imágenes adjuntas y la respuesta del asistente), crea comprobaciones deterministas (coincidencia exacta, contiene, regex, rango numérico, aritmética), las ejecuta y muestra una tarjeta de veredicto en línea. Elige cualquier proveedor para el que tengas una clave; el coste de LLM del juez se suma al total acumulado de la conversación para que no haya cargos ocultos.
- Común: Test Runner — prueba Caiioo con tu propia lista de ejemplos (Pro): Entrega a Caiioo una lista de prompts y una forma de calificar cada respuesta —subcadenas que deberían aparecer, un patrón que la respuesta debería cumplir, herramientas específicas que deberían usarse, o un segundo modelo que califique la respuesta del 1 al 10 según los criterios que definas. Caiioo ejecuta cada prompt en su propia conversación nueva, captura la respuesta del asistente, qué herramientas llamó, cuánto tiempo tomó y cuánto costó, y luego genera un informe de aprobado/fallido que puedes exportar como CSV. Útil para comprobar puntualmente que un nuevo modo, modelo o aplicación instalada del Hub sigue comportándose como esperas.
- Común: Las aplicaciones del Hub pueden incluir materiales de referencia listos para usar: Un paquete del Community Hub ahora puede agrupar sus propias plantillas de Slate, PDFs y otros archivos de referencia. Instalar Caiioo for Legal, por ejemplo, coloca los dos manuales de negociación directamente en tu biblioteca para que el agente pueda marcar tus contratos basándose en ellos desde el primer turno.
- Común: My Apps — bifurca cualquier aplicación del Hub y edítala como propia: Un nuevo panel de My Apps en Settings → Tools, Modes & Apps te permite bifurcar cualquier aplicación del Community Hub en una copia personal y editar cualquiera de sus primitivas —herramientas, habilidades, modos, tarjetas, vistas, flujos de trabajo, archivos adjuntos de plantilla y variables— con editores por primitiva. El agente también puede capturar una conversación útil en un borrador de aplicación personal para que la perfecciones.
- Común: Las aplicaciones del Hub ahora se sincronizan entre dispositivos: Instala un paquete del Community Hub en tu Mac y aparecerá en tu iPhone, y viceversa. Las aplicaciones personales (aplicaciones que has bifurcado o guardado como propias) también se sincronizan. Los relojes vectoriales por paquete significan que ninguna instalación sobrescribirá nunca una instalación más reciente de otro dispositivo.
- Común: Hub Settings ahora enumera cada primitiva de la aplicación en su propia sección: Tools, Modes & Apps sumó cuatro nuevas secciones —Cards, Views, Workflows y Template Attachments— junto a las existentes Tool Configuration y Agent Modes. Cada una es un inventario de solo lectura de lo que tus aplicaciones instaladas realmente incluyeron, con atribución de fuente para que puedas ver qué paquete del Hub trajo cada habilidad, modo o tarjeta.
- Común: Las habilidades ahora son visibles para el modelo: Anteriormente, las habilidades eran solo de interfaz de usuario; al hacer clic en una etiqueta de habilidad se pegaba texto en tu mensaje, pero el modelo en sí no tenía conocimiento de ellas. Cada modo ahora inyecta sus habilidades disponibles (nombre, descripción, cuerpo del prompt) en el system prompt, por lo que frases como "usa tu habilidad de análisis de contratos en este PDF" ahora funcionan realmente.
- Común: Las tarjetas de subagentes se renderizan en línea en el chat principal: Cuando un subagente emite una tarjeta (un veredicto de Self Checker, un gráfico generado, una vista de resultado estructurado), la tarjeta se reasigna a la conversación principal y se renderiza en línea junto al resultado de texto del subagente, de la misma manera que ya funcionan los archivos adjuntos de los subagentes.
- Común: Google Sheets — 14 nuevas acciones: Pegar datos (CSV / TSV / HTML), dividir texto en columnas, recortar espacios en blanco, eliminar duplicados, aplicar o limpiar filtros de la barra de herramientas con criterios y reglas de ordenación, mover filas o columnas, insertar y eliminar rangos de celdas, proteger rangos con permisos de editor, definir y actualizar rangos con nombre, adjuntar metadatos de desarrollador, ajustar el formato condicional y usar la paleta ColorStyle moderna — todo sin salir del chat.
- Común: Google Docs recibe comentarios reales, soporte para múltiples pestañas y reconocimiento de smart-chips: Añade, responde, resuelve y elimina comentarios nativos de Docs que aparecen en la interfaz de Docs para todos en el documento. Los documentos con múltiples pestañas ahora funcionan correctamente; el agente lee y escribe en la pestaña correcta en lugar de mezclar todas las pestañas en un solo espacio de posición. Los smart chips (personas, enlaces, ecuaciones, saltos de página, chips de fecha) ahora se reconocen para que las operaciones de búsqueda y edición lleguen al carácter correcto. Las ediciones concurrentes ahora fallan visiblemente con un error claro en lugar de sobrescribirse silenciosamente entre sí.
- macOS: La reproducción de voz (Kokoro TTS) comienza en menos de un segundo: La voz en el dispositivo fallaba silenciosamente en macOS porque el modelo no se cargaba dentro de la WebView. La voz ahora se ejecuta a través del proceso auxiliar de la aplicación de escritorio y se transmite frase por frase, por lo que escuchas la primera frase aproximadamente un segundo después de hacer clic en reproducir, incluso en una máquina con mucha carga.
- Web: Los paquetes del Hub se instalan a través de un enlace
caiioo://: Al hacer clic en Instalar en caiioo.ai, ahora se dirige directamente a cualquier cliente que tengas —la extensión de Chrome o la aplicación nativa— en lugar de activar ambos a la vez. Si tienes ambos instalados, verás un selector. El modal de instalación del Community Hub también desglosa el contenido de cada paquete —herramientas, modos, habilidades, servidores MCP y variables— para que puedas ver exactamente qué se instala antes de hacer clic en Instalar. - Desktop: El AppImage de Linux registra el esquema de URL
caiioo://: Los usuarios de Linux con la versión AppImage ahora pueden instalar aplicaciones del Hub desde caiioo.ai con un solo clic; el esquema de URL se registra en el primer lanzamiento sin necesidad de instalar ningún paquete del sistema.
Mejoras
- Común: Revisión de la estabilidad de Slate y la fidelidad de ida y vuelta: Se cerraron aproximadamente 40 errores individuales en el editor de texto enriquecido, el motor de diferencias (diff), el historial de versiones y la importación/exportación de Word. Los cambios controlados (tracked changes) ya no se corrompen cuando una propuesta de IA llega a un documento que has editado posteriormente; las capturas del historial de versiones son ahora copias congeladas reales; las revisiones se resuelven correctamente cuando el contenido coincide con el objetivo en lugar de detenerse; las propuestas de IA se fusionan con los cambios existentes en lugar de sobrescribir las ediciones de otros autores; aceptar o rechazar cambios en un archivo de Word persiste en el almacenamiento; las exportaciones de texto enriquecido manejan emojis y otros caracteres de planos suplementarios; y el motor de diferencias ya no confunde eliminaciones y modificaciones cuando su texto coincide.
- Común: Slate — aceptar o rechazar todos los cambios controlados dentro de una selección: Los nuevos botones ✓ Sel / ✗ Sel en la barra de herramientas de revisión de Slate imitan el comportamiento de Word de "seleccionar un párrafo, aceptar todos los cambios internos": resalta una región y un solo clic resuelve cada cambio controlado que se solape con ella. El motor de diferencias también agrupa ediciones adyacentes separadas solo por espacios en blanco o puntuación en una única unidad de aceptar o rechazar, para que revisar una reescritura de IA no suponga cien clics individuales.
- Común: Fidelidad de importación / exportación de documentos Word: Una revisión de aproximadamente 110 errores en el analizador .docx corrigió el formato de caracteres que ignoraba los interruptores de "desactivado" explícitos, la herencia de estilos rota, la resolución de colores de tema faltante, la pérdida de sangría de párrafo, el manejo incorrecto de superíndice / subíndice / texto oculto, la numeración de listas incorrecta tras los encabezados, la falta de separadores de tabulación y salto de línea en el texto extraído, las imágenes incrustadas que no se extraían en absoluto y la pérdida de referencias de imágenes incrustadas al exportar. La exportación a Markdown ahora utiliza la sangría de lista correcta según CommonMark.
- Común: Auditoría de renderizado e ida y vuelta de PDF: Una auditoría del flujo de PDF preserva imágenes en línea, cadenas hexadecimales y espaciado de letras en el proceso de ida y vuelta; resuelve correctamente los recursos de página heredados; preserva las máscaras de transparencia, los indicadores de decodificación, intención e interpolación al reemplazar imágenes; rescata caracteres especiales (símbolo de euro, comillas inteligentes, marca registrada) que las fuentes de Windows no pueden codificar de forma nativa; maneja correctamente emojis y otros caracteres de planos suplementarios en fuentes incrustadas en PDF; y muestra los errores de OCR en lugar de ignorarlos. El visor de PDF de Slate también se abre notablemente más rápido en PDFs de varias páginas al renderizar las páginas de forma diferida (lazy rendering), y los PDFs grandes ya no descargan el archivo repetidamente al abrirse por primera vez.
- Común: La exportación a PDF preserva caracteres no codificables en lugar de fallar: Los caracteres especiales que la fuente elegida no puede codificar ahora se pasan sin cambios desde el PDF de origen en lugar de abortar toda la exportación.
- Común: Mejoras en la precisión y cobertura del Pseudonymizer: El modelo detector de datos personales fue reentrenado con un flujo consciente de la configuración regional (locale-aware) y ahora maneja sustancialmente mejor el chino y una gama más amplia de escrituras no latinas. Los rangos de nombres ahora se extienden correctamente a través de los límites de escritura —iniciales intermedias, honoríficos iniciales y secuencias contiguas en chino, japonés, coreano y árabe— para cerrar las filtraciones de nombres parciales. Una nueva segunda pasada de seguridad captura omisiones antes de que se envíen. Los rangos fragmentados con la misma etiqueta se agrupan antes de la sustitución. La detección de nombres de ciudades y empresas en varios idiomas ya está en producción. La salida numérica de la herramienta de calculadora ya no se clasifica erróneamente como un nombre.
- Común: Inspector de alucinaciones del Pseudonymizer: Escanea la respuesta del asistente en busca de nombres con apariencia de falsos que no estén en el mapa de sustitución de tu sesión; una coincidencia significa que el modelo probablemente inventó un nombre. Se complementa con el inspector de filtraciones existente para dar una visión completa de lo que el modelo dijo sobre la identidad.
- Común: Falsificaciones multilingües del Pseudonymizer: Los nombres de ciudades, empresas y personas ahora generan sustitutos apropiados para la configuración regional: un prompt en español obtiene falsificaciones con apariencia española, un prompt en japonés obtiene falsificaciones con apariencia japonesa, y así sucesivamente.
- Común: Más de 30 correcciones menores de corrección en el Pseudonymizer: Una auditoría de varias rondas eliminó docenas de hallazgos de severidad baja, media y alta: brechas en la cobertura de escrituras, ruido en los registros de depuración, filtraciones entre sesiones, errores de recorte de URL, casos límite de políticas, privacidad de los registros de auditoría, robustez de la restauración, manejo de Unicode en el diccionario de usuario, filtraciones de PII estructural en modo solo para uno mismo, y más.
- Común: Los mensajes de Telegram se renderizan con el formato adecuado: Los mensajes enviados a través del puente de Telegram ahora se formatean usando los estilos nativos de negrita, cursiva, código y enlace de Telegram en lugar de mostrar asteriscos crudos, comillas invertidas y sintaxis "texto (url)" rota. Las imágenes entrantes de Telegram también fluyen correctamente hacia los modelos con capacidad de visión, y los mensajes preformateados del agente no son reformateados por el puente.
- Común: La sincronización de calendario cubre todos los calendarios de tu cuenta: La sincronización en segundo plano solo iteraba tu calendario principal de Google; los calendarios de equipo y familiares estaban ausentes silenciosamente. Ahora se sincronizan todos los calendarios visibles. Se sigue correctamente la paginación de eventos (para que los eventos más allá de la primera página ya no desaparezcan), se preservan las zonas horarias de los eventos en lugar de normalizarlas a UTC, los eventos de todo el día se anclan correctamente y el manejo de Apple Calendar ahora también dirige los Apple Reminders.
- Común: Corrección de la herramienta Calendar / Agenda: Se cerró un grupo de 19 errores en la creación / actualización / eliminación / listado de calendarios; lo más importante es que las fechas de los eventos de todo el día ahora se derivan en tu zona horaria local en lugar de UTC, por lo que un evento que fijaste para el viernes ya no cae en jueves en las zonas horarias del este.
- Común: Barrido de fiabilidad de la herramienta Gmail: Se corrigieron cinco errores que producían silenciosamente resultados de cuentas incorrectas, hilos de respuesta rotos, nombres de destinatarios mal formados estilo "Doe, John" y fallos de autenticación ocultos. Las respuestas ahora se enlazan correctamente tanto en Gmail como en clientes de correo externos (Outlook, Apple Mail, Thunderbird). Las actualizaciones de borradores preservan el hilo de conversación original.
- Común: Búsqueda en Gmail por remitente, categoría, antigüedad, archivos adjuntos y estado no leído: Pedir al agente que busque "correos no leídos de Bob de la última semana con archivos adjuntos" solía depender de que el modelo recordara la sintaxis exacta de los operadores de búsqueda de Gmail, y este reemitía la misma consulta lógica con diferentes redacciones hasta que algo funcionaba. La herramienta Gmail ahora expone parámetros de filtro de primer nivel (
from,subject,label,hasAttachment,isUnread,isImportant,category,newerThan/olderThancomo7d/1m/1y, y fechasafter/before), para que el agente elija el filtro correcto al primer intento. - Común: Barrido de fiabilidad de la herramienta Google Drive: Doce correcciones que incluyen rechazar la lectura de archivos binarios como texto, soporte para rutas de carpetas de unidades compartidas, mostrar la paginación para listados de carpetas grandes, mapear Slides a exportaciones PPTX, eliminar el rol de "propietario" roto de las opciones de compartir y corregir el filtrado de carpetas de destino en los movimientos. La caché de transferencia de Drive ahora hace que los enlaces públicos caduquen después de 24 horas en lugar de dejarlos permanentemente públicos si falla la limpieza.
- Común: Google Drive — rutas de carpeta completas, unidades compartidas, exportación, transferencia de propietario, descubrimiento de enlaces: Las operaciones de Drive ahora aceptan rutas de carpeta legibles por humanos (
Engineering/Specs/Q3) en lugar de solo IDs de carpeta opacos, acceden a Unidades Compartidas como destinos de primer nivel, exportan Docs / Sheets / Slides a tipos MIME específicos (PDF, DOCX, XLSX, PPTX), transfieren la propiedad de archivos entre usuarios y muestran enlaces públicos y de "cualquiera con el enlace" para que el agente pueda responder "¿cuál es la URL para compartir este archivo?" sin que tengas que copiarla manualmente. - Común: Las ediciones de texto de Google Slides aterrizan en el lugar correcto: La herramienta Slides usaba el número mágico 999999 para "final del texto", que la API rechazaba. Ahora busca la longitud real del texto y construye rangos adecuados para que las ediciones de índice parcial (por ejemplo, "estilo desde el carácter 5 en adelante") funcionen como se espera.
- Común: Google Sheets — más de 30 correcciones menores de corrección: El análisis de rangos maneja nombres de hojas entrecomillados con puntuación interna, referencias ilimitadas (A:A, 1:10) y columnas más allá de la Z; las subidas de imágenes escriben una fórmula
=IMAGE()real en lugar de borrar la celda; la importación HTML decodifica entidades con nombre, decimales y hexadecimales, incluyendo caracteres del plano astral; los gráficos ya no bloquean el lector de información de la hoja; la búsqueda informa letras de columna absolutas y muestra errores por hoja. Las diferencias (diffs) de las hojas ahora emiten tanto adiciones como eliminaciones correctamente. - Común: El diálogo de variables ahora funciona para cualquier aplicación del Hub: El botón del editor "abrir variables" solía estar codificado para una aplicación específica. Ahora se basa en el manifiesto del Hub, por lo que cualquier aplicación que incluya un diálogo de variables obtiene su propio botón y etiqueta.
- Común: Las aplicaciones personales aparecen en todos los lectores: Las aplicaciones personales (aplicaciones que has bifurcado o guardado) ahora aportan sus habilidades, modos, servidores MCP, herramientas, vistas y variables a través de cada lugar donde el agente los lee, no solo en el editor. Ahora son aplicaciones de primer nivel, idénticas a las instaladas desde el Hub.
- Común: La desinstalación del Hub realmente elimina todo: Al desinstalar una aplicación del Hub ahora también se eliminan los modos del paquete, los botones del editor, las habilidades, los archivos adjuntos de plantilla, los parches de variables de modo, la lista de desactivación del sistema en caché y (si estabas en él) el modo activo del paquete. No más modos huérfanos persistiendo en el selector después de la desinstalación.
- Común: La instalación del Hub advierte sobre solapamientos: Cuando instalas un paquete cuyas habilidades, modos, MCPs, herramientas o vistas duplicarían algo que ya tienes, aparece un aviso (toast) con los conflictos en el momento de la instalación para que puedas decidir qué hacer, y los indicadores de duplicación por fila permanecen visibles en la lista de instalación del Hub y en tu inventario de Settings.
- Común: Superposiciones de variables por hilo para trabajo por asuntos: Las variables de modo solían ser persistentes en todas las conversaciones, lo cual es incorrecto para el trabajo por asuntos (cada asunto legal, cada compromiso con un cliente, cada proyecto es un contexto diferente). Cada hilo puede ahora llevar su propia superposición de variables para que el agente trabaje en el Asunto A en un hilo y en el Asunto B en el siguiente sin mezclarlos.
- Común: La instalación del Hub ya no abre una cascada de pestañas para cada inicio de sesión requerido: Instalar una aplicación del Hub con múltiples proveedores solía abrir una pestaña de inicio de sesión por proveedor en secuencia. Las instalaciones ahora se completan rápido y solicitan cada inicio de sesión restante bajo demanda, uno a la vez, en lugar de apilar pestañas.
- Común: Robustez de la sincronización en la nube: La derivación de claves de sincronización de equipo ahora usa tu ID de organización y frase de contraseña en lugar de tu correo personal, para que cada miembro del mismo equipo derive la misma clave y pueda realmente desencriptar los elementos de los demás (esto estaba previamente roto). Los temporizadores de sincronización, los relojes vectoriales y el bloqueo de manifiestos también se ajustaron para evitar que las sincronizaciones solapadas corrompan el estado.
- Común: El botón "Use Caiioo's Account" funciona para claves aprovisionadas reemitidas: El botón de Settings no hacía nada si tu fila de OpenRouter aprovisionada había sido desactivada por un cambio previo a BYOK o un fallo de desencriptación. Ahora genera una fila nueva cuando el servidor indica que no tienes una, por lo que el botón siempre restaura una clave funcional.
- Común: El campo de clave de OpenRouter se mantiene sincronizado con Settings: La entrada de la clave API ahora se actualiza cuando el componente principal envía un nuevo valor (por ejemplo, después de hacer clic en "Use Caiioo's Account") en lugar de mantener el valor que tenía cuando la página se renderizó por primera vez.
- Común: Los botones del editor se recargan cuando cambian los ajustes del modo: Los botones de acción del editor (Variables, etc.) ahora se actualizan inmediatamente cuando cambian los ajustes de un modo, en lugar de requerir una recarga del chat.
- Común: Las herramientas del agente ven tus últimas ediciones antes de leer un Slate: Si todavía estás escribiendo cuando se activa una herramienta de IA (actualización de Slate, revisión, resolución de cambios controlados), la herramienta ahora espera a que el contenido del editor en curso se guarde en el almacenamiento para operar sobre lo que realmente puedes ver, no sobre una captura obsoleta de hace un segundo.
- Común: Las tarjetas en línea se dimensionan según su contenido: La tarjeta de veredicto del Self Checker y otras tarjetas en línea ahora crecen para ajustarse a su contenido real en lugar de reservar un espacio fijo, y adoptan el tema de la aplicación principal (claro u oscuro) en lugar de forzar un fondo blanco.
- Común: Los botones de acción flotantes aparecen por defecto en la esquina superior izquierda: Los botones flotantes ⚖ y 🛡 (y cualquier botón flotante personalizado) ahora se sitúan en la parte superior izquierda del editor por defecto en lugar de obstruir el botón de enviar a la derecha. Aún puedes arrastrarlos a cualquier lugar.
- Común: Las actualizaciones del perfil de usuario y de las variables de modo rechazan campos desconocidos: El agente podía anteriormente inventar nombres de variables como
_clientNameque silenciosamente no iban a ninguna parte. Las actualizaciones ahora requieren que la clave exista en el esquema y devuelven un error claro en caso contrario. - Común: Pantalla de bienvenida de incorporación simplificada: El primer inicio ahora muestra tres opciones claras —Gratis, Suscribirse a Pro, o Traer tu propia clave API (BYOK) con una prueba— en lugar del formulario de incorporación más largo anterior. La primera vez que abras el Editor, Settings o Slate, se ejecutará un breve recorrido interactivo para señalar los controles relevantes.
- Común: El inicio de sesión es de un solo paso: Caiioo solía requerir tanto una identidad verificada COMO una comprobación de licencia activa antes de dejarte entrar. Esa comprobación de licencia redundante ha desaparecido; una vez que has iniciado sesión, estás dentro. El estado de la licencia sigue restringiendo las capacidades exclusivas de Pro (generación de imágenes, etc.); simplemente ya no restringe el abrir la aplicación.
- Común: La búsqueda en Settings revela secciones avanzadas: Buscar un ajuste que reside bajo un desplegable "avanzado" solía no devolver resultados silenciosamente porque la sección estaba colapsada. La barra de búsqueda ahora revela las secciones colapsadas que coinciden, y un nuevo botón "Collapse all" lo revierte con un solo clic.
- Común: Catálogo de proveedores más amigable: Los modelos de nivel gratuito de OpenRouter recién lanzados ahora tienen prioridad en el selector de modelos, y los modelos obsoletos se eliminan suavemente en lugar de abarrotar la lista.
- Común: Detección del idioma del host en cada plataforma nativa: Los shells de macOS, iOS, Android y Tauri ahora detectan el idioma de la interfaz de tu SO al inicio y lo pasan al panel lateral, para que las traducciones del primer inicio aparezcan en el idioma correcto sin que tengas que configurarlo manualmente. Se incluyeron aproximadamente 10,000 cadenas de traducción adicionales en 23 configuraciones regionales no inglesas.
- macOS: Aplicación de instancia única: Ya no se puede lanzar una segunda copia de la aplicación de macOS desde un enlace
caiioo://cuando ya hay una en ejecución, incluso cuando los Servicios de Lanzamiento de macOS tienen dos copias registradas (típicamente un resto de una instalación previa). - macOS: Los servidores MCP instalados a través de Homebrew ahora se ejecutan: macOS 15+ bloquea las aplicaciones notarizadas para que no ejecuten binarios que lleven el atributo de "procedencia" (provenance), que Homebrew añade a todo lo que instala. Caiioo ahora limpia automáticamente ese atributo al intentar ejecutarlo tras un permiso denegado, por lo que los servidores MCP locales (sistema de archivos, memoria, fetch, etc.) instalados a través de Homebrew comienzan a funcionar sin ninguna limpieza manual.
- macOS, iOS: La instalación del Hub a través de
caiioo://es fiable en el inicio en frío: Tocar un enlace de instalacióncaiioo://en una aplicación recién lanzada podía entrar en conflicto con la primera carga de la WebView y perder silenciosamente la intención de instalación. La intención ahora se persiste durante el inicio en frío para que la instalación se complete una vez que la aplicación esté lista. - iOS: Se respeta el nuevo permiso de calendario de "solo escritura" de Apple: iOS 17 introdujo un tercer permiso de Calendario / Recordatorios —"solo escritura"— que permite a Caiioo crear eventos y recordatorios sin ver los existentes. Caiioo anteriormente trataba esto como "denegado"; ahora utiliza el acceso de solo escritura correctamente, por lo que los usuarios que conceden solo ese nivel todavía pueden pedir al agente que programe cosas.
- iOS: Mensaje más claro cuando una compra dentro de la aplicación no puede verificarse: Las verificaciones de compra fallidas ahora muestran un motivo específico en lugar de un error genérico, y la transacción ya no se finaliza silenciosamente, cumpliendo con las directrices de StoreKit de Apple.
- Android: Guardar un archivo ya no congela la aplicación: Escribir un archivo grande a través del selector de archivos de Android solía ejecutarse en el hilo de la interfaz de usuario y podía congelar la aplicación durante varios segundos en almacenamientos lentos. Las escrituras ahora ocurren fuera del hilo de la interfaz de usuario.
- Android: Las respuestas de red en streaming entregan cabeceras antes que los fragmentos: Las llamadas de streaming de larga duración ahora entregan las cabeceras al solicitante antes de que llegue cualquier fragmento del cuerpo, corrigiendo una categoría de fallos intermitentes en el stream.
- Android: Transcripción en el dispositivo más rápida y eficiente en memoria: El flujo de captura de audio Whisper / Moonshine ahora usa un búfer de flotantes primitivos en lugar de una lista de objetos, reduciendo tanto la memoria como la CPU. La carga, descarga, transcripción y limpieza de la caché del modelo también se serializan ahora a través de un bloqueo compartido, por lo que la aplicación ya no se bloquea ocasionalmente si cambias de modelo a mitad de la transcripción.
- Desktop: Auditoría de fiabilidad y seguridad del shell de Windows / Linux: Una revisión completa del shell de Tauri —alcance de capacidades limitado solo al panel lateral de confianza (para que una página visitada arbitraria no pueda invocar comandos privilegiados), escape de HTML reforzado en el puente de instalación del Hub
caiioo://, un mensaje amable de "Node.js no encontrado" en lugar de un cierre inesperado silencioso, y un puñado de correcciones de robustez. - Desktop, macOS: Las descargas de modelos de voz y habla en el dispositivo ahora funcionan: La Política de Seguridad de Contenido (CSP) de la WebView de las aplicaciones de escritorio estaba bloqueando las descargas desde huggingface.co, por lo que los modelos de voz Kokoro y de habla a texto Whisper no podían cargarse en el primer uso. La política ahora permite huggingface.co.
- Extension: Settings → Tools, Modes & Apps renombrado y reorganizado: La antigua categoría "Tools & Capabilities" es ahora "Tools, Modes & Apps" con una nueva categoría "Connectivity" separada de Advanced.
- Web: Texto de precios refinado en 23 idiomas: Una revisión editorial de los puntos de características Free / Pro del sitio web alineó las versiones no inglesas con la fuente inglesa más reciente. Se actualizaron las fechas de "última actualización" de los documentos legales.
Seguridad
- Común: Refuerzo del inicio de sesión: Se cerraron múltiples hallazgos de una auditoría del flujo de inicio de sesión y del almacén de credenciales. Los tokens de ID de Google ahora solo se aceptan si fueron emitidos para los propios IDs de cliente de Caiioo (cerrando un agujero donde el token de cualquier cliente de Google OAuth podía iniciar sesión a alguien). El inicio de sesión de Apple ahora valida el "nonce" devuelto por Apple frente al generado por Caiioo. El inicio de sesión de Google y Apple rechaza el enlace automático de una identidad externa a una cuenta con correo no verificado (cerrando una toma de control por "registro en la sombra"). El punto final del token de refresco ahora rechaza tokens revocados, por lo que un token de sesión cerrada no puede canjearse por uno nuevo. El punto final de emisión de tokens OAuth ahora requiere un token de portador (bearer token) activo. La propia página de retorno (callback) de OAuth fue reforzada contra varios vectores de inyección de scripts.
- Común: Aislamiento por perfil para todos los ajustes: La capa de ajustes compartía un único contenedor entre múltiples inicios de sesión en la misma instalación en ciertas rutas de código, lo que podía filtrar una credencial introducida en una cuenta a la vista de otra cuenta. Cada lectura y escritura de ajustes es ahora estrictamente por perfil, los contenedores compartidos heredados se borran en el primer lanzamiento tras la actualización, y la sincronización en la nube rechaza subir o descargar esos contenedores heredados.
- Extension: El autodescubrimiento del puente local es ahora opcional: La extensión de Chrome se conectaba anteriormente de forma incondicional a cualquier aplicación de escritorio de Caiioo que encontrara en localhost. Ahora solo lo hace cuando has activado explícitamente el acceso al puente local en Settings, para que una aplicación de escritorio instalada por otro usuario en una máquina compartida no pueda conectarse silenciosamente a tu sesión de la extensión.
- macOS, iOS: Puente de instalación
caiioo://reforzado contra inyección: El escape de cadenas manual en el JavaScript que procesa las URLscaiioo://hub/install/<id>solo escapaba comillas simples; un ID de paquete maliciosamente diseñado podía romper el literal de cadena y ejecutar un script arbitrario en la WebView. Reemplazado por un escape JSON completo en ambas plataformas. - iOS, macOS, Extension: Los flujos de inicio de sesión de Google ahora usan la aplicación OAuth verificada de Caiioo: Conectar Google para Private Sync, Calendar, Gmail, Drive y las otras herramientas de Workspace solía mostrar la advertencia "Esta aplicación no está verificada" en iOS, macOS y la extensión de Chrome / Edge porque esas plataformas todavía se autenticaban contra un proyecto de Google Cloud antiguo y no verificado. Todas las plataformas usan ahora el proyecto verificado de Google de Caiioo de extremo a extremo, por lo que verás la marca adecuada de Caiioo y la marca de verificación verde de aplicación verificada en la pantalla de consentimiento de Google en lugar de la advertencia. Re-inicio de sesión único: los usuarios actuales en iOS y macOS verán su sesión cerrada automáticamente y se les pedirá que inicien sesión de nuevo la primera vez que abran la aplicación tras esta actualización; los tokens de inicio de sesión anteriores fueron emitidos por el proyecto de Google antiguo y no pueden transferirse.
Corrección de Errores
- macOS: La advertencia "Browser not connected" desaparece cuando Safari se conecta: Conectar la extensión de Safari a la aplicación de Mac dejaba una advertencia obsoleta diciendo que el control del navegador no estaba disponible — y la advertencia solo mencionaba a Chrome, a pesar de que Safari, Edge y Firefox funcionan. La aplicación ahora cuenta cada navegador conectado (Safari se conecta por un canal diferente al de los demás, por eso se omitía), por lo que la advertencia desaparece en el momento en que se conecta cualquier navegador, y su redacción ya no señala solo a Chrome.
- Común: Los modelos de imagen más nuevos que elijas son realmente utilizables: El selector de modelos de imagen mostraba cada modelo con el que tu cuenta puede generar —incluyendo los recién lanzados como Recraft— pero elegir uno podía fallar con "Unknown image model" porque el generador estaba comprobando tu selección contra una lista interna obsoleta en lugar de la lista en vivo. El generador ahora actualiza la lista de modelos en vivo antes de decidir, por lo que cualquier cosa visible en el selector funciona. El modelo por defecto también cambió de FLUX.2 [pro] al más rápido y económico FLUX.2 [flex], que es un mejor valor por defecto general.
- Común: Los cambios controlados dentro de documentos Word ahora se aceptan y rechazan correctamente: Hacer clic en aceptar o rechazar en un cambio controlado dentro de un Slate respaldado por .docx usaba la posición del documento como ID del cambio, que nunca coincidía con el ID del cambio real almacenado; por lo tanto, el cambio cambiaba visualmente de estado pero nunca persistía. Corregido.
- Común: Slate maneja instalaciones de plantillas corruptas: Las plantillas de Slate instaladas desde el Hub que se incluían sin el envoltorio adecuado solían bloquear el visor en "Loading artifact" sin recuperación. Las plantillas ahora se autoreparan al cargar y el visor muestra un error claro si una plantilla está genuinamente corrupta.
- Común: Self Checker ya no narra el veredicto dos veces: Cuando el Self Checker mostraba su tarjeta de veredicto, el agente también describía las puntuaciones en el texto de respuesta; dos copias del mismo veredicto en la misma pantalla. Se suprimió el resumen en prosa cuando se muestra la tarjeta.
- Común: Self Checker lee correctamente los archivos de imagen adjuntos: El juez estaba decodificando los archivos de imagen adjuntos como texto y alimentando la basura resultante en la evaluación. Los archivos de imagen adjuntos ahora se envían al juez como imágenes reales, por lo que cualquier turno cuya corrección dependa de lo que hay en una imagen se califica correctamente.
- Común: Self Checker muestra solo el veredicto más reciente: Cada clic en ⚖ añadía una nueva tarjeta de veredicto sin eliminar la anterior, por lo que el chat terminaba con una pila de duplicados. Cada turno muestra ahora solo el veredicto más reciente, con una × para borrarlo.
- Común: El diálogo de sincronización de recordatorios renderiza correctamente los eventos de Outlook: El valor de fuente interno "microsoft_calendar" se filtraba en la ruta de detección de plataforma en el modal de recordatorios. El modal ahora recurre a su ruta de inferencia para que los eventos se rendericen correctamente independientemente de su procedencia.
- Común: Los archivos adjuntos grandes de Gmail fluyen de forma fiable: Los archivos adjuntos grandes de Gmail (un archivo de 25 MB tiene aproximadamente 33 MB tras la codificación base64) superaban el límite de mensajes entre procesos y se perdían silenciosamente. El tiempo de ejecución ahora recurre a un archivo temporal para cargas de gran tamaño para que los archivos adjuntos lleguen a su destino.
- Común: La instalación del MCP de PandaDoc vuelve a funcionar: PandaDoc movió su punto final de MCP a una nueva ruta. La entrada del catálogo de Caiioo ahora apunta al nuevo punto final.
- Común: Los pasos de renderizado de flujos de trabajo ya no resuelven erróneamente salidas de cadena como archivos adjuntos: Enviar una salida de cadena de un paso de flujo de trabajo a un paso de Vista solía fallar porque cada cadena se trataba como un ID de archivo adjunto. Las cadenas enviadas por referencia ahora se distinguen de los IDs de archivos adjuntos literales.
- Común: La comprobación del estado de la suscripción ya no se bloquea en entornos de solo navegador: La herramienta de agenda estaba probando el puente de escritorio en cada fallo de caché en entornos que no tienen uno, lanzando un error "Failed to fetch" cada vez. La prueba ahora está condicionada a si un puente de escritorio es realmente accesible.
- Común: El proceso en segundo plano para el agente ahora finaliza limpiamente: Un cambio en una versión anterior dejaba el proceso en segundo plano del agente abierto después de terminar, bloqueando las acciones que se ejecutan tras un turno —lo más visible, el título automático de la conversación. El proceso ahora finaliza limpiamente para que la generación de títulos y otros pasos posteriores al turno se activen como se espera.
- Común: Modos de laboratorio y solo para administradores ocultos del selector de modos: Dos rutas todavía filtraban el modo interno "lab" (y cualquier otro modo marcado como solo para administradores) en el selector de modos orientado al usuario. Corregido.
- Común: Instalaciones duplicadas del Hub deduplicadas al guardar: Un conflicto en el flujo de instalación podía escribir dos entradas para el mismo paquete. Los nuevos guardados se deduplican por el slug del paquete, y los duplicados existentes se reparan en la siguiente lectura.
- Común: Los IDs de modos personalizados ya no colisionan con las instalaciones del Hub: La clave de almacenamiento es ahora autoritativa para el ID de un modo personalizado, eliminando una clase de colisiones cuando un modo instalado desde el Hub caía en una clave que ya tenía una copia editada por el usuario.
- Común: Los archivos adjuntos y tarjetas de subagentes llegan al chat principal: Un subagente que generaba una imagen, un gráfico, un veredicto de Self Checker o cualquier otro archivo adjunto solía dejar el resultado en un hilo de subagente invisible — y la conversación principal a veces inventaba una URL para llenar el hueco. Los archivos adjuntos y tarjetas de subagentes ahora se reasignan al hilo principal correctamente a través de la limpieza intermedia del ejecutor del agente, por lo que lo que produjo el subagente aparece donde enviaste la solicitud.
- Común: Lectura de PDF en páginas de renderizado diferido: La ventana emergente "view original text" para un fragmento de PDF ahora funciona en páginas que aún no se habían renderizado cuando se creó el fragmento.
- macOS: Los inicios de sesión OAuth de Slack, Notion, Linear y otros del Hub ahora se completan en la aplicación nativa: Los servidores MCP del Hub que usan OAuth solo por HTTPS (Slack, Notion, Linear, etc.) no podían redirigir de vuelta al relé local porque sus proveedores rechazan las devoluciones de llamada http://. La aplicación de macOS ahora dirige esos flujos a través del
/oauth/callbackdel relé en la nube de Caiioo, que luego devuelve el código de autorización al relé local a través del canal por usuario existente; así, el inicio de sesión para estos proveedores desde el interior de la aplicación nativa ahora funciona igual que en la extensión. Incluye una migración única que corrige las instalaciones existentes cuyo perfil almacenado aún no estaba conectado al proveedor de identidad del relé local. - Común: "Ask the user" no se bloquea en ejecuciones de subagentes: Un agente que llamaba a
ask_userdesde dentro de un subproceso estaba accediendo a un singleton compartido en memoria que no era accesible entre procesos, por lo que la pregunta nunca aparecía y la ejecución se detenía hasta que la cancelabas. El controlador de colaboración es ahora por hilo, por lo que la pregunta aparece en el chat de la misma manera que en el bucle principal del agente. - Común: Auxiliares nativos de macOS para Calendar / Notes / Reminders actualizados: Se actualizaron los binarios auxiliares con los SDK actuales de macOS para solucionar un problema donde la sincronización de recordatorios veía intermitentemente los elementos incorrectos en la versión 0.9.721.
- Extension: Las tarjetas de veredicto del Self Checker ahora se renderizan dentro de la extensión: Los scripts en línea dentro de las plantillas de tarjetas estaban bloqueados por la política de seguridad de contenido de la extensión. Las tarjetas ahora se dirigen a través de la página de sandbox de la extensión para que se rendericen correctamente.
- Común: El texto aparece cuando conviertes un dibujo SVG en una imagen: Renderizar un SVG —un logotipo, diagrama o gráfico— a una imagen solía omitir todo su texto (marcas denominativas, etiquetas, leyendas) en la extensión de Chrome y la aplicación de macOS, dejando huecos en blanco donde deberían estar las palabras; solo las aplicaciones móviles los renderizaban. Caiioo ahora incluye fuentes de respaldo (sans-serif, serif y monospace, incluyendo negrita), por lo que el texto aparece exactamente como se dibujó —incluyendo símbolos como &, ™ y caracteres acentuados— y cualquier tipografía que el dibujo solicite y no esté disponible se sustituye por una sans-serif limpia en lugar de desaparecer.
Versión 0.9.721 (15 de mayo de 2026)
Nuevas Funcionalidades
- Common: Precios simplificados a Free y Pro, con un bono de crédito de $5/mes en OpenRouter para Pro: Hemos retirado los niveles separados de Platform y Pro Mobile, integrando todas las funciones exclusivas de Platform (Apple Calendar / Reminders / Notes, relay privado cifrado, vista previa de acceso a la API, dictado de voz nativo, interfaz de usuario del navegador) en Pro. El sitio web, la página de cuenta y el panel de precios de la extensión ahora presentan un diseño limpio de dos tarjetas: Free / Pro. Como parte del cambio, cada mes de suscripción Pro pagado (Stripe o Apple) ahora también recarga su clave de OpenRouter aprovisionada con $5 de crédito adicionales a su saldo existente. Los suscriptores actuales de Platform pasan automáticamente a Pro sin costo adicional y conservan todas sus capacidades. También se redujo el límite mínimo de compra de crédito en OpenRouter: los usuarios finales ya no verán el recargo de tarifa mínima heredado de $0.80, solo la tarifa de transferencia del 5.5%.
- Common: Slack es ahora una instalación de un solo clic en el Community Hub: La integración independiente de Slack ha desaparecido; ahora Slack se instala desde el Community Hub al igual que Notion, Linear, GitHub, etc. Haga clic en Instalar en el paquete de Slack en el Hub, inicie sesión una vez con la aplicación de Slack de Caiioo, y el servidor oficial de Slack MCP se conectará de inmediato — sin configuración manual de la aplicación ni modo de desarrollador. Los comandos de barra como
/caiiooy/caiioo-helpfuncionan desde cualquier canal donde se invite al bot. - Common: Herramienta Workspace Files: Una nueva herramienta de archivos en entorno aislado (sandboxed) permite al agente leer, escribir, editar y buscar archivos dentro de una carpeta de espacio de trabajo que usted le indique. El agente no puede salir de esa carpeta ni acceder a la red a través de esta herramienta. Las lecturas analizan automáticamente formatos de Office (docx/xlsx/pptx) y PDFs. Configure la carpeta en Settings → Tools → Workspace Files; el agente la reconocerá de inmediato.
- Common: Submodo PHI Safe Harbor para el Pseudonymizer: El modo PHI del Pseudonymizer ahora ofrece dos submodos — Limited Data Set (la eliminación existente de 16 categorías, por defecto) y Safe Harbor (el estándar más estricto HIPAA §164.514(b)(2) que también elimina fechas específicas más allá del año, direcciones geográficas completas y edades superiores a 89 años). Elija el submodo desde la configuración del Pseudonymizer o el nuevo interruptor en el chat. Safe Harbor es la opción correcta cuando necesita un conjunto de datos desidentificado que pueda compartir sin un Acuerdo de Uso de Datos.
- Common: Pseudonymizer ya está disponible para todos: El Pseudonymizer — que detecta nombres, correos electrónicos, direcciones, IDs y otros valores sensibles en lo que escribe y los sustituye por falsos realistas antes de que lleguen al modelo — sale del programa de pruebas con este lanzamiento y está disponible en todos los planes, incluido Free. Actívelo en Settings → Privacy → Pseudonymizer, o con el nuevo interruptor de escudo en el chat. El modelo nunca ve sus valores reales; las sustituciones se desenmascaran localmente antes de que se ejecuten las llamadas a herramientas, por lo que el resultado sigue siendo preciso.
- Common: Controles del Pseudonymizer en el chat: El Pseudonymizer ya no está oculto en Settings. Un icono de escudo junto al botón de envío (gris = desactivado, azul = Personal Data Filter, verde azulado = PHI/Limited Data Set, esmeralda = PHI/Safe Harbor) muestra el modo activo de un vistazo y abre un menú emergente con el mismo selector de modo que se encuentra en Settings. Cuando el Pseudonymizer está activado, un anillo de 1 píxel del color correspondiente al modo rodea el cuadro de escritura como recordatorio ambiental. Después de cada turno que tuvo sustituciones, aparece una pequeña etiqueta "🛡 pseudonymized — N substitutions" bajo su mensaje; haga clic en ella para ver exactamente qué pares real → falso se intercambiaron, con etiquetas de categoría.
- Common: Conecte un navegador de otro dispositivo a su computadora: Un nuevo flujo de emparejamiento le permite usar Caiioo de forma segura en un navegador en su teléfono, tableta u otra computadora portátil, manteniendo todo ejecutándose en su computadora principal. En Settings → Connections → Caiioo Bridge → "Pair a device", genere un código de 6 caracteres válido por 5 minutos y de un solo uso. Abra la misma URL en el otro dispositivo, ingrese el código y ese dispositivo quedará emparejado a partir de ese momento. Los intentos de adivinación por fuerza bruta están limitados a 10 intentos por IP por minuto, y un reinicio del servidor en su computadora principal vuelve a emparejar cada dispositivo de forma limpia.
Mejoras
- Common: Elementos de la agenda con franjas de color por calendario de origen: Cada tarjeta de evento en la ventana de Reminders / Agenda ahora lleva una franja de color que coincide con el calendario del que proviene, para que pueda distinguir de un vistazo si un elemento es de su calendario de trabajo, personal o compartido. Google Calendar disponible hoy; Apple y Microsoft seguirán una vez que sus fuentes de datos expongan un color de calendario.
- Common: La AI puede leer una Google Sheet sin nombrar las celdas exactas primero: La herramienta de lectura de Google Sheets solía negarse a ejecutarse a menos que el agente especificara un rango de celdas exacto como
Sheet1!A1:D200. El modelo ahora puede solicitar una hoja completa, o todas las hojas de un libro, y la herramienta determina el diseño por sí misma. Un límite integrado de 1000 filas evita que una hoja de cálculo gigante exceda la ventana de contexto del modelo; si una hoja se limita, la respuesta se lo indica al modelo para que pueda solicitar un rango más pequeño o un mayor número de filas la próxima vez. - Common: Instalar una herramienta OAuth desde el Community Hub ahora abre el inicio de sesión por usted: Al agregar un paquete del Hub que requiere inicio de sesión (Notion, Linear, etc.), la tarjeta solía quedarse bloqueada en un estado de "OAuth required" con un botón de "Sign in" en el que había que hacer clic por separado. La instalación ahora abre la pestaña de inicio de sesión automáticamente — su clic en Install se trata como consentimiento — y una línea "Opening sign-in for X…" explica por qué apareció una pestaña. El botón manual de Sign in permanece como respaldo.
- Common: Settings → Connections muestra la dirección de red real para otros dispositivos: El panel "Connect from other devices on your network" mostraba
127.0.0.1:3847(la dirección de bucle local que solo funciona en la misma computadora) en la aplicación de macOS, por lo que los usuarios copiaban y pegaban una dirección a la que no se podía acceder desde otro dispositivo. El panel ahora muestra la IP de LAN real y el nombre de red.localdesde el propio bridge. La dirección también se oculta cuando el nuevo interruptor "Allow access from other devices" está desactivado, para que no vea una dirección que de todos modos no funcionaría. - Common: La búsqueda web captura el AI Overview de Google de forma fiable: El raspador de Google de la herramienta de navegación web a veces devolvía un bloque de AI Overview vacío, o extraía texto ruidoso de "Sources" de la columna derecha y scripts integrados. Hemos reanclado la extracción a los marcadores de sección estables de Google y ahora eliminamos el contenido de los scripts y la columna derecha antes de devolver los datos, para que el agente vea solo la respuesta legible.
- Common: Pseudonymizer protege también nombres de empresas: El Pseudonymizer ahora trata los nombres de organizaciones como entidades protegidas, sustituyéndolos por nombres falsos realistas que preservan el estilo del sufijo legal (Inc., LLC, GmbH) y la estructura de "socios vs. marca". Los nombres de ciudades y regiones pequeñas ("Springfield", "St. Albans") también se detectan como una categoría de primer nivel para que puedan ser intercambiados o eliminados según su modo activo.
- Common: Pseudonymizer añade cobertura multilingüe para ciudades y regiones en español, francés, alemán y otros: El modelo detector de datos personales fue reentrenado con datos multilingües creados a mano para nombres de ciudades en 23 idiomas, de modo que los usuarios con prompts en idiomas distintos al inglés ahora obtienen el mismo nivel de protección que los angloparlantes.
- Common: La descarga del modelo del Pseudonymizer muestra el progreso en iOS: La primera descarga del detector de PHI / Personal Data podía parecer bloqueada en iOS porque nada indicaba que seguía trabajando. Ahora hay un registro de progreso de latido (heartbeat) para que pueda ver que la descarga no está congelada.
- Common: Los subagentes pueden buscar en el catálogo de modelos por nombre: Para mantener la descripción de la herramienta de subagentes dentro del presupuesto, el catálogo integrado en ella es ahora el de los 10 modelos de mayor valor por proveedor. Cuando un subagente necesita un modelo fuera de esa lista, puede llamar a la nueva acción
search_modelscon un fragmento de nombre (ej. "haiku") y obtener los IDs exactos del catálogo, precios y flags de capacidad — para que el modelo pueda elegir un ID concreto incluso para opciones menos utilizadas. - Common: Los servidores MCP personalizados muestran un nombre descriptivo en el almacén de credenciales: Al iniciar sesión en un servidor MCP personalizado, el almacén de credenciales lo etiquetaba con la URL de conexión sin procesar, lo cual era difícil de identificar. El almacén ahora muestra el nombre descriptivo del servidor que usted le asignó, recurriendo a la URL solo cuando no se ha definido un nombre.
- Common: Community Hub ahora añade Legal Data Hunter: Un nuevo paquete del Community Hub conecta Legal Data Hunter — más de 18 millones de documentos de jurisprudencia, legislación y doctrina de más de 110 países — como una instalación de MCP de un solo clic.
- Web: Insignia SOC 2 Type I en la página de confianza: Caiioo superó su auditoría SOC 2 Type I. La página de confianza en caiioo.ai ahora lleva la insignia AICPA SOC 2 junto con las divulgaciones de seguridad existentes.
- iOS: Ocultar la barra de herramientas del teclado que iOS añade a los campos de texto: Las flechas de anterior/siguiente y el botón Done que iOS adjunta sobre el teclado para campos de texto web consumían un espacio vertical considerable en el cuadro de escritura. La barra ahora está oculta (usando solo APIs públicas de Apple, por lo que sigue siendo seguro para la App Store), y permanece oculta después de recargar la página.
Seguridad
- Common: El bridge local permanece en su computadora por defecto; el acceso LAN es opcional: El bridge local que impulsa los MCPs stdio y las herramientas exclusivas de escritorio solía escuchar en todas las interfaces de red, y en una red Wi-Fi pública otro dispositivo podía solicitar un token de sesión y luego llamar a los endpoints privilegiados de "ejecutar un comando de shell". El bridge ahora solo escucha en su propia computadora por defecto. Para usarlo desde otro dispositivo, active "Allow access from other devices on your network" en Settings → Connections, luego empareje el dispositivo con el nuevo flujo de código (ver arriba). Incluso cuando el acceso LAN está activado, los tokens de sesión solo se entregan a solicitudes que provienen de su propia máquina, por lo que un extraño en la misma red Wi-Fi no puede obtener acceso.
- Common: Pseudonymizer se niega a filtrar sus valores reales a Perplexity: Si el Pseudonymizer está activado y el agente intenta ejecutar una búsqueda en Perplexity cuya consulta contiene un identificador seudonimizado (un nombre, correo o dirección que ya fue intercambiado), Caiioo ahora bloquea la búsqueda y muestra una explicación clara en lugar de revertir el cambio del valor y enviarlo a Perplexity. Perplexity es un servicio de LLM de terceros — el propósito del Pseudonymizer es que valores como esos nunca lleguen a un servicio de LLM. Para ejecutar la búsqueda, desactive el Pseudonymizer para ese turno o reformule para evitar el valor protegido.
- Common: Analizador de hojas de cálculo cambiado a una librería con mantenimiento (GHSA-4r6h-8v6p-xvw6): La librería que Caiioo usaba para analizar archivos adjuntos
.xlsxtenía un aviso abierto de contaminación de prototipo (prototype-pollution) y ya no recibe mantenimiento. La hemos reemplazado por la libreríaexceljs, que cuenta con un buen mantenimiento. Las cargas de hojas de cálculo y las lecturas de.xlsxdel espacio de trabajo de archivos devuelven el mismo contenido que antes.
Corrección de Errores
- Common: Navegador bloqueado en "Loading Caiioo… 0/0" después de un reinicio del servidor: Cuando el servidor host aún no tenía una sesión cifrada de extremo a extremo con un navegador conectado (porque el servidor se acababa de reiniciar o es la primera conexión del navegador), el navegador ignoraba la solicitud del servidor para iniciar el intercambio de claves — por lo que los mensajes cifrados nunca se descifraban y la interfaz se quedaba cargando. El navegador ahora responde correctamente a la solicitud de intercambio de claves y el panel lateral se carga.
- Common: Caiioo seguía pidiendo permisos de Google que ya habías concedido: Cuando concedías un permiso de Google a mitad de una conversación (desde una herramienta hermana, el panel de configuración o una sincronización desde otro dispositivo), la copia en memoria de tu cuenta del agente no se daba cuenta y seguía pidiendo el mismo permiso — a veces varias veces en una misma ejecución. Caiioo ahora vuelve a leer tu cuenta una vez antes de quejarse de un permiso faltante, por lo que los permisos concedidos durante la ejecución se honran de inmediato.
- Common: Se les decía a 7 idiomas que la AI es "English": El mapa interno de código de localidad a nombre de idioma cubría 17 de los 24 idiomas soportados. Los usuarios con su interfaz configurada en árabe, hebreo, hindi, bengalí, urdu, turco o holandés recibían un prompt de sistema que decía "respond in English" en lugar de su idioma real de interfaz. El mapa ahora está completo y una prueba evita que esto vuelva a ocurrir.
- Common: El diálogo de sincronización de Reminders mostraba códigos de texto sin procesar en lugar de etiquetas traducidas: La tarjeta de Caiioo en el diálogo de sincronización de Reminders / Agenda estaba renderizando marcadores de posición literales como
reminders.sync.CaiiooNameen lugar del texto traducido, en todos los idiomas. Corregido. - Common: El inicio de sesión de Google deja de rebotar cuando concedes un permiso extra a mitad de la conversación: Cuando el agente necesitaba un permiso (scope) de Google que aún no tenía (Drive, Sheets, etc.) y te pedía concederlo desde una pestaña lateral, el nuevo inicio de sesión podía devolver al agente a un estado donde pedía el MISMO permiso de nuevo. El flujo de OAuth ahora combina correctamente el nuevo permiso concedido en tu conexión existente en lugar de sobrescribirla, por lo que una aprobación es una aprobación.
- Common: Los archivos adjuntos de subagentes ahora aparecen en el chat principal: Cuando la herramienta de un subagente creaba una imagen, archivo u otro adjunto, solía almacenarse en el hilo invisible del subagente y la conversación principal no mostraba nada — a veces el modelo padre inventaba una URL para llenar el vacío. Los adjuntos de los subagentes ahora se vinculan automáticamente al hilo padre y se renderizan en línea como cualquier otro resultado de herramienta.
- Common: El detector del Pseudonymizer en su segunda pasada captura nombres que la primera omitió: El Pseudonymizer ahora ejecuta una segunda pasada rápida del detector que vuelve a revisar el mensaje en busca de cualquier valor real que debería haber sido enmascarado pero no lo fue, antes de enviarlo. Una medida de seguridad adicional para las categorías protegidas que el modelo tiene más probabilidades de omitir.
- Common: Pseudonymizer ya no pone su nombre real en el marcador de posición de My Identifiers: El campo Settings → Pseudonymizer → My Identifiers mostraba el nombre real de su cuenta como ejemplo, lo que parecía una filtración y confundía la configuración. Reemplazado por un marcador de posición genérico.
- Common: El texto de la pastilla del Pseudonymizer es legible en el tema oscuro: La pastilla "🛡 pseudonymized" bajo los mensajes del usuario usaba un color de texto de modo claro en el tema oscuro, haciéndola casi invisible. Corregido.
- Extension: Corregido el callejón sin salida de "Get current location" en el panel lateral: La solicitud de ubicación del panel lateral devolvía "Permission denied" antes de que el navegador pudiera siquiera preguntarle, porque el manifiesto de Chrome no incluía el permiso de ubicación. Permiso añadido; la solicitud de ubicación ahora llega al aviso del navegador como se esperaba. Los usuarios existentes verán una solicitud de permiso por única vez al actualizar.
- iOS: La página de suscripción solo vende Pro después de la fusión de niveles: El muro de pago (paywall) en la aplicación de iOS todavía mostraba brevemente los niveles retirados de Pro Mobile y Platform, lo que podía dejar a los usuarios en un plan ya no soportado. El muro de pago ahora vende exactamente el mismo nivel Pro que se muestra en el sitio web. Los suscriptores actuales de Pro Mobile / Platform continúan siendo reconocidos como Pro sin costo adicional.
- iOS: Bloqueo raro durante la navegación mientras una página aún se estaba cargando: iOS podía bloquearse cuando se cancelaba la navegación de una página a mitad de la carga (por ejemplo, al tocar un enlace antes de que terminara la página anterior). La solución dirige cada ruta de error a través del mismo asistente ya protegido, por lo que una carga cancelada nunca intenta entregar un resultado en una página cerrada.
- Web: El inicio de sesión funciona dentro de navegadores integrados (Slack / X / LinkedIn / Instagram) y en Safari de iOS: El inicio de sesión de Google tipo ventana emergente (popup) fallaba cuando se abría caiioo.ai desde un enlace dentro de otra aplicación, porque los navegadores integrados bloquean la ventana emergente o cortan su conexión con la página original. En dispositivos móviles y navegadores integrados, el sitio ahora utiliza un redireccionamiento de página completa a través de su propia sesión de navegador en lugar de una ventana emergente, para que el inicio de sesión se complete y lo devuelva a la página donde comenzó. El inicio de sesión por ventana emergente en escritorio no ha cambiado.
- Web: Pulido del Community Hub en tabletas y nombres largos: La barra de navegación en el sitio web ahora cambia al menú de hamburguesa en anchos de tableta (hasta 1024px) en lugar de desbordarse sobre el logo. Los títulos de los modales de paquetes del Hub ya no quedan debajo del botón de cierre. La pastilla "Coming Soon" se ajusta limpiamente en anchos estrechos. Los iconos de herramientas recurren a un emoji, luego a un logo conocido del sitio web de la empresa, luego a un avatar con la primera letra — en lugar de permitir que un identificador interno largo (como "customerio") se desborde fuera del cuadro del icono.
- Web: Community Hub ahora muestra el autor correcto en cada paquete: Todos los paquetes en el Hub solían decir "by caiioo" independientemente de quién los hubiera construido realmente. Los autores ahora reflejan al mantenedor real — "Model Context Protocol", "oraios" o la marca del proveedor — y solo recurren a "Caiioo" para herramientas y modos que construimos nosotros mismos. Las tarjetas de integraciones que aún no están completamente conectadas se ocultan del Hub hasta que funcionen, para que no vea tarjetas instalables que den error de inmediato.
- Web: El sitemap deja de activar advertencias de "página con redirección": Search Console marcaba cada página de caiioo.ai como una redirección porque el sitemap listaba URLs sin la barra diagonal final que usa el sitio en vivo. El sitemap ahora coincide con las URLs canónicas e incluye alternativas por idioma, para que los motores de búsqueda dejen de ver todo el sitio como redireccionado.
Versión 0.9.720 (1 de mayo de 2026)
Marca
- Común: PebbleFlow ahora es Caiioo: El producto ha sido renombrado a Caiioo — el mismo animal, la misma app que has estado usando. Verás el nuevo nombre en todo el panel lateral, los ajustes, el sitio web, el menú de la app host de macOS y la app host de Safari. Los datos existentes, las cuentas, los inicios de sesión y la sincronización no han cambiado — solo cambia el nombre visible. El sitio de marketing permanece en pebbleflow.ai por ahora y muestra la nueva marca con compatibilidad futura; el enrutamiento canónico a caiioo.ai se implementará en una versión posterior.
Nuevas Funciones
- Común: El Modo Simple está activado por defecto para nuevos usuarios: Las instalaciones por primera vez ahora inician en Modo Simple — un editor más tranquilo que oculta los detalles de tokens y costes por mensaje, el menú desplegable de compresión sin pérdidas y los indicadores de contexto de pestañas. El selector de modelo sigue visible porque elegir un modelo es una acción de primer nivel. Los usuarios existentes mantienen la configuración de Modo Simple que tuvieran. Un nuevo interruptor con icono de ojo en el editor permite mostrar u ocultar todos los detalles con un toque.
- Común: Eliminación de cuenta: Ahora puedes eliminar tu cuenta de Caiioo desde la página de Cuenta del sitio web (también enlazada desde la app de iOS, según el requisito de eliminación de cuentas de Apple). La eliminación borra tu perfil, credenciales de inicio de sesión, saldo de créditos de AI y la copia cifrada de tu clave de OpenRouter aprovisionada; se conservan registros mínimos de auditoría de cumplimiento sin ID de cuenta, según lo exige la ley. Una nueva sección en la política de privacidad detalla exactamente qué se elimina y qué se conserva.
- iOS: Texto a voz nativo en el dispositivo (Kokoro 82M): La síntesis de voz Kokoro ahora se ejecuta en el proceso host de iOS a través de OnnxRuntime en lugar de dentro de WKWebView, imitando la arquitectura de e5-embeddings de la versión 0.9.719. El modelo recibe el presupuesto de memoria aumentado del proceso host en lugar de competir con la interfaz del panel lateral por el límite por proceso de WebKit, por lo que el TTS en el dispositivo ya no bloquea la WebView bajo carga en iPhone 13/14.
Mejoras
- Común: El generador de imágenes funciona con modelos de streaming lentos: La herramienta de generación de imágenes ahora opta por el streaming para los modelos de imagen de OpenRouter, solucionando el error "Network error: Unable to connect to OpenRouter" en modelos lentos como
gpt-5.4-image-2(~167 s de extremo a extremo). La ruta anterior con búfer esperaba ~1.8 MB de relleno de mantenimiento de conexión (keepalive) antes de que llegara el JSON real, y el tiempo de espera de la capa de conexión se activaba primero. - Común: La selección de modelo de nivel gratuito elige un modelo real dinámicamente: El meta-enrutador anterior
openrouter/freeenrutaba dentro de OpenRouter sin saber qué modelos subyacentes admitían herramientas o visión — los usuarios de Android que enviaban una imagen junto con una llamada a herramienta recibían el error "No endpoints found that support tool use". Caiioo ahora se enruta a sí mismo: el onboarding, los ajustes y el botón de "usar modelos gratuitos" del modal de actualización eligen un modelo gratuito real que admita herramientas (y entrada de imágenes donde esté disponible), y cambian automáticamente ante errores de límite de tasa o de capacidad. Los usuarios existentes enopenrouter/freese migrarán progresivamente en el próximo inicio. - Común: Personal Intuition encuentra el contexto adecuado en mensajes largos: La consulta de recuperación se recortaba a los últimos 500 caracteres de tu mensaje y se incrustaba como un único vector. En mensajes largos de tipo "pegar y preguntar" o turnos con múltiples temas, esto truncaba la pregunta real o difuminaba todo en un centroide temático plano que puntuaba mal. Caiioo ahora extrae una consulta relevante — mantiene el inicio literal y añade un conjunto de tokens con contenido sin duplicados extraídos de hasta los siguientes 3000 caracteres — para que la recuperación se mantenga en el tema incluso cuando tu prompt sea largo.
- Común: El interruptor Ajustes → "Ajustes mínimos" deja de cambiar su propio título: El interruptor alternaba su etiqueta entre "Ajustes mínimos" (activado) y "Ajustes avanzados" (desactivado), por lo que el estado desactivado se leía como si marcar la casilla te llevara a avanzado — lo contrario de lo que sucede. El título ahora permanece constante; la descripción añade el prefijo "Activado — " / "Desactivado — " para que el estado actual sea inequívoco.
- Común: El diálogo de descarga de modelos de voz gestiona el progreso indeterminado: La tarjeta de información del modelo durante la descarga podía desbordarse en el estrecho panel lateral; el diseño ahora está anclado. Cuando el servidor no devuelve un Content-Length, el bloque de progreso muestra un indicador de carga indeterminado en lugar de una barra congelada en 0%.
- Común: El Modo Simple muestra una franja de estadísticas compacta en lugar de ocultarlo todo: El Modo Simple anteriormente ocultaba todo el resumen de estadísticas del hilo. Ahora muestra una franja delgada — anillo de ventana de contexto, tokens totales compactos (ej. "1k"), coste y crédito restante — y el icono del ojo en el editor expande el detalle completo con un toque.
- Común: Los costes de subagentes se consolidan correctamente: El recuento de costes por hilo omitía el gasto de Perplexity / búsqueda web de subagentes, costes de ayudantes, costes de generación de imagen/video/música, costes de OCR de PDF y costes de voz. Todas las categorías ahora se consolidan en la línea
sub_agent_costdel elemento principal. - Común: El selector Ajustes → Herramientas anula las herramientas desactivadas por defecto: Elegir "Siempre" o "Auto" en una herramienta que viene desactivada por defecto estaba siendo ignorado silenciosamente. Tu elección de configuración dinámica de herramientas ahora anula el valor por defecto.
- Común: El sidecar local ha sido renombrado a "App de escritorio" en los textos para el usuario: Todas las referencias visibles para el usuario a "PebbleFlow Relay" — el sidecar que soporta los servidores MCP de stdio local y las herramientas exclusivas de escritorio — ahora dicen "App de escritorio", que es lo que los usuarios realmente instalan.
- Común: Textos de privacidad simplificados: Se eliminó la redacción redundante sobre "telemetría" en las políticas legales, listados de tiendas, la página de privacidad del sitio web y la guía interna de la app. "Sin analíticas" ya lo cubre; no hay cambios fácticos en lo que las apps recopilan o dejan de recopilar.
- Común: Las etiquetas de la vista de cuenta del proveedor equilibran el origen: El panel de cuenta del proveedor ahora indica contra qué clave informa cada saldo (tu clave BYOK frente a la clave aprovisionada por Caiioo), de modo que los créditos y el saldo restante ya no puedan malatribuirse a simple vista.
Corrección de Errores
- Común: Apple Sign-In tras la transición de marca: Apple Sign-In fallaba para nuevos inicios de sesión porque el ID de Servicios OAuth todavía apuntaba al antiguo
com.sixcailloux.PebbleFlow.web. Se ha cambiado acom.sixcailloux.Caiioo.webpara que "Iniciar sesión con Apple" vuelva a funcionar en iOS, macOS y la página de cuenta web. - Común: Botón "Iniciar sesión" en servidores MCP que requieren OAuth: Instalar un servidor MCP remoto que requiere OAuth (ej. Notion) escribe el servidor en el almacenamiento incluso cuando la conexión inicial falla porque se requiere OAuth, pero no se registra ningún cliente. El botón "Iniciar sesión" enviaba entonces una solicitud de actualización que devolvía un error genérico "MCP server
not found" en lugar de abrir el diálogo de OAuth. La actualización ahora recurre a una nueva llamada addServercuando el cliente no está registrado, para que se presente la estructura OAuth/DCR y el diálogo de inicio de sesión se abra realmente. - Común: Los informes de errores enviados desde apps nativas ahora registran la versión correcta de la app: Los shells de iOS, macOS y Android ahora inyectan la versión de la app instalada en la WebView al arrancar, para que los informes de errores enviados identifiquen de qué compilación provienen en lugar de dejar el campo en blanco o repetir la versión del panel lateral empaquetado.
- Android: Cierre inesperado al iniciar tras el cambio de marca: Un renombre excesivamente entusiasta de PebbleFlow → Caiioo había renombrado la clase Application y los símbolos JNI en el lado de Kotlin sin renombrar las exportaciones nativas correspondientes, por lo que la app se cerraba al inicio al no poder resolver los símbolos. Se han revertido los renombres; la app vuelve a iniciar correctamente.
- Común: Bucle de reautorización de Google Workspace: Los usuarios estaban atrapados reautorizando Google Workspace aproximadamente cada hora porque su conexión OAuth almacenada no tenía
refresh_token. Seis correcciones conectadas garantizan un token de actualización en cada concesión y lo preservan a través de la sincronización en la nube, para que las conexiones de Google sobrevivan al TTL de 1 hora del token de acceso sin pasar por la pantalla de consentimiento. - Común: Recuperación de "User not found" en OpenRouter: OpenRouter devuelve HTTP 401 "User not found" cuando el registro de usuario subyacente de una sub-clave aprovisionada ha desaparecido pero la entidad de la clave aún existe. Caiioo anteriormente presentaba esto como una extensión muerta que solo se solucionaba cerrando e iniciando sesión. El proveedor ahora se autorepara intercambiando una nueva clave aprovisionada y reintentando la solicitud una vez.
- Común:
insert_componentde Google Docs devolvía errores engañosos: Insertar un componente después de una tabla insertada previamente mostraba "Document not found" porque la tabla insertada nunca se vinculaba a sucomponentName. Las tablas ahora obtienen un rango con nombre en la misma fase de inserción, el resolutor de posición respeta eltabIdque no sea por defecto, y los errores a nivel de app dejan de clasificarse erróneamente como 404. - Común: Los modelos de OpenRouter recién lanzados perdían el enrutamiento ZDR: Cuando un modelo aún no estaba en la base de datos de inteligencia de Caiioo, el registro de respaldo sintético lo marcaba como no compatible con ZDR, incluso cuando los proveedores exclusivos de ZDR realmente lo admitían. El enrutamiento ZDR ahora utiliza el mismo respaldo de lista de proveedores que la ruta regular.
- Común: La API
/v1/runsignoraba los archivos adjuntos en la primera llamada: Cuando el endpoint de la API iniciaba un agente contra un hilo nuevo, la lista de adjuntos en el mensaje del usuario se perdía porque la rama de hilo vacío solo enviaba texto. Los adjuntos ahora fluyen correctamente. - Común: Las apps nativas podían leer ajustes obsoletos justo después de un cambio de modelo: En Android con poca memoria, cambiar el selector de modelo y enviar inmediatamente un mensaje podía permitir que el agente leyera el modelo anterior del disco porque el volcado con debounce de 500 ms aún no se había ejecutado. La ruta de envío ahora fuerza un volcado de estado antes de generar el agente.
- Común: Triaje de errores de testers (PF-260429 / PF-260430): Cinco correcciones — los usuarios de claves gestionadas (nivel gratuito) ahora pueden ingerir documentos a través de OCR de PDF sin escribir su propia clave; macOS fija la zona horaria del sidecar de Node a la del host para que las fechas se resuelvan correctamente bajo el sandbox; las tareas programadas ahora persisten en los shells de iOS/macOS/Tauri (el stub de almacenamiento de la WebView descartaba silenciosamente las escrituras); la herramienta de configuración presenta programaciones únicas y manuales como opciones de primer nivel; y los puntos de llamada de herramientas se recuperan de la autoreparación 401 de OpenRouter de la misma manera que lo hace el ejecutor del agente.
- Común: El modal de actualización deja de mezclar la suscripción de nivel con créditos/BYOK: "Añadir créditos" en realidad abría el portal de suscripción — la etiqueta mentía. El modal ahora se centra solo en la suscripción de nivel; iOS además oculta cualquier superficie de compra de créditos según Apple §3.1.1.
- Web: La sección Eliminar Cuenta se movió al final de la página de cuenta: El bloque destructivo de Eliminar Cuenta solía renderizarse entre tu tarjeta de identidad y la interfaz de suscripción/facturación. Ahora reside en la parte inferior de la página, después de las FAQ. El comportamiento de enlace profundo de iOS hacia la vista de solo eliminación no ha cambiado.
- iOS: Gestionar Plan ahora abre la hoja de suscripción de Apple: Gestionar Plan en iOS anteriormente redirigía a la página de cuenta web para usuarios gratuitos, de prueba, de Stripe y de origen desconocido, donde el OAuth de Google en WKWebView fallaba. Tocar Gestionar Plan en iOS ahora siempre abre la hoja
showManageSubscriptionsde StoreKit de Apple. - iOS: La vista web de eliminación de cuenta se contrae a una página de solo eliminación: Cuando el botón Eliminar Cuenta de iOS abre el sitio web, la página ahora oculta toda la superficie de facturación (suscripción, planes, créditos, portal de Stripe, FAQ) y muestra solo la sección de eliminación, cumpliendo con §3.1.1.
- iOS: Corrección de validación de versión de framework ITMS-90208: El Info.plist del framework onnxruntime ahora se parchea en el momento del archivado para que coincida con el objetivo de despliegue de la app host, de modo que App Store Connect deje de rechazar compilaciones con "framework does not support the minimum OS version specified in the Info.plist".
- Android: Los enlaces externos se ofrecen en una Custom Tab para que el OAuth de Google funcione: Tocar enlaces como "Abrir pebbleflow.ai/account" solía abrirse dentro de la WebView de Android, donde Google bloquea OAuth con
disallowed_useragent(Error 403). Los enlaces externos ahora se enrutan a través del puente nativo hacia una Chrome Custom Tab, en la que Google confía. - Android: Los botones de copiar bajo los mensajes realmente copian: El icono de copiar usaba
navigator.clipboard.writeTextdirectamente, lo cual no hace nada silenciosamente en la WebView de Android cuando la activación del usuario expira a través del límite asíncrono. Copiar ahora se enruta a través del puente del portapapeles nativo.
Versión 0.9.719 (25 de abril de 2026)
Seguridad
- Common: Parche para protobufjs CVE-2026-41242 (CVSS 9.8): Se fijó
protobufjs >= 7.5.5(resuelto a 8.0.1) para cerrar un agujero crítico de ejecución de código arbitrario enRoot.fromJSON. Caiioo no importaprotobufjsdirectamente —es una transitiva deonnxruntime-web— y el riesgo en la práctica era bajo porque solo alimentamos modelos empaquetados, no esquemas suministrados por el usuario. Se parcheó de todos modos porque la solución es trivial. - Common: @xmldom/xmldom — 4 CVE de alta severidad parcheados: Se fijó
@xmldom/xmldom >= 0.9.10. El análisis de XML se utiliza en los flujos de revisión de DOCX/XLSX y en varias rutas de código de extensiones. - Server: undici — 3 CVE de alta severidad parcheados: Se fijó
undici >= 7.24.0encloud/relay. Afecta únicamente al cliente HTTP del servidor relay. - Desktop: rustls-webpki + quinn-proto — 2 CVE de alta severidad parcheados: Se actualizaron estas dependencias de Rust en Tauri. Afecta a las compilaciones de escritorio para Windows + Linux que pasan por el shell de Tauri.
Nuevas Funcionalidades
- Common: Generación de video (Pro): Genere o anime videos cortos con Google Veo 3.1, OpenAI Sora 2 Pro y ByteDance Seedance a través de OpenRouter. La herramienta selecciona duraciones y resoluciones válidas por modelo, realiza consultas hasta que el trabajo se completa y guarda el resultado como un archivo adjunto en el hilo.
- Common: Generación de música (Pro): Genere canciones y clips instrumentales con Google Lyria 3 Pro Preview a través de OpenRouter. La salida se guarda como un adjunto de audio que se reproduce de forma integrada.
- Common: Catálogo dinámico de modelos de video: El generador de video obtiene la lista actual de modelos de OpenRouter con capacidad de video en tiempo de ejecución, por lo que aparecen nuevos proveedores y modelos sin necesidad de una actualización de Caiioo. Una instantánea empaquetada mantiene el funcionamiento sin conexión.
- Common: Catálogo dinámico de modelos de música: Lo mismo para la generación de música —la herramienta detecta nuevos modelos de música a medida que OpenRouter los publica, con respaldo para modo sin conexión.
- Common: OAuth personalizado en Pro: "Traiga su propia autenticación" (BYOK) —el asistente de Google Workspace, el asistente de Microsoft 365 y el flujo genérico "Agregar proveedor personalizado"— ahora es visible para todos los usuarios de Pro, Platform, Teams y Enterprise en Settings → Custom OAuth. Anteriormente, la pestaña y los botones de agregar estaban ocultos tras indicadores solo para evaluadores, por lo que los usuarios de pago no podían acceder a la configuración de BYOA.
- Common: Física + Análisis Estructural (Pro): La herramienta de simulación física (movimiento de proyectiles, colisiones, energía cinética/potencial, momento, fuerza, impulso, velocidad al objetivo) y análisis estructural (carga de vigas, pandeo de columnas, propiedades de materiales) ya está disponible en Pro junto con las demás herramientas creativas y de utilidad.
- Common: Seeing-Eye Dog — respaldo de visión para LLM de solo texto: Los modelos de solo texto como DeepSeek V4 Pro, Kimi K2.6, MiMo V2.5 Pro y los modelos locales de Ollama ahora pueden manejar archivos adjuntos de imagen enrutándolos a través de un modelo de visión económico configurado (por defecto: Gemini 3.1 Flash Lite). El subtitulado automático se activa al momento de construir el mensaje y se almacena en caché por adjunto para que los turnos posteriores no vuelvan a pagar; una herramienta dedicada
vision({action: "inspect"})otorga al modelo acceso de seguimiento específico. Settings → Tools → Vision Fallback Model permite elegir el asistente. - Common: Cambios controlados a nivel de celda en XLSX: Los artefactos de hojas de cálculo ahora admiten la misma experiencia de usuario de revisión que DOCX. Las propuestas de la AI mediante
propose_change(editMode: 'xlsx_cell')producen cambios controlados localizados en celdas anclados porcellRef+sheetName; las ediciones escritas por el usuario en modo de control de cambios generan diferencias a nivel de celda; las celdas con cambios pendientes renderizan<del>antiguo</del><ins>nuevo</ins>de forma integrada; los botones de siguiente/anterior/aceptar/rechazar de la barra de herramientas existente funcionan en los cambios de celda; las ediciones concurrentes de la AI y del usuario se fusionan celda por celda, prevaleciendo el usuario en caso de conflictos en la misma celda. - Common: Seguimiento de costos para generadores de video y música: Los videos generados (vía OpenRouter
/api/v1/videos) y la música (víachat-completions) ahora suman su costo a los totales del hilo al igual que la generación de imágenes, con nuevas filas de desglosevideo_gen_costymusic_gen_costen el menú desplegable de costos del panel lateral.
Mejoras
- Common: Estabilidad de la serie GPT-5: gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro y gpt-5.3-codex de OpenAI ya no producen respuestas vacías silenciosas en conversaciones de agentes con uso intensivo de herramientas. Una interacción en el esquema de herramientas de función estaba causando que el backend de OpenAI terminara las transmisiones sin producir ninguna salida; Caiioo ahora serializa las herramientas en el formato que estos modelos requieren.
- Common: Mejor comportamiento en conversaciones largas en GPT-5.4+: Las conversaciones de múltiples turnos con gpt-5.4, gpt-5.4-pro y gpt-5.3-codex ya no se detienen prematuramente en secuencias largas de llamadas a herramientas —el marcador de fase que OpenAI usa para distinguir comentarios intermedios de respuestas finales ahora se preserva entre turnos.
- Common: Razonamiento de GPT-5.x visible en el panel de pensamiento: gpt-5, gpt-5.1, gpt-5.4, gpt-5.4-pro y gpt-5.3-codex ahora transmiten su resumen de razonamiento al panel de pensamiento del chat mientras piensan, igualando el comportamiento de Gemini. Anteriormente, el panel de pensamiento permanecía vacío para estos modelos a pesar de que OpenRouter transmitía el texto de razonamiento.
- Common: Recuperación transparente de interrupciones temporales de proveedores: Cuando OpenRouter enruta una solicitud a un proveedor que devuelve un error 5xx transitorio antes de transmitir cualquier contenido, Caiioo reintenta silenciosamente con un proveedor diferente en lugar de mostrar una respuesta vacía.
- Common: Errores más claros cuando falla la transmisión del modelo: Las caídas del lado del proveedor, los rechazos por filtros de contenido y otros fallos a mitad de la transmisión ahora se muestran con un mensaje de error específico en lugar de que la conversación simplemente se "detenga" sin explicación.
- Common: Los videos y la música generados se renderizan de forma integrada: Los videos y la música generados ahora aparecen en la conversación como las imágenes generadas —un reproductor de video o audio aparece sobre la respuesta final con una pequeña insignia que indica qué modelo lo produjo, en lugar de estar oculto dentro de la sección de herramientas colapsada.
- Common: Selector de modelo predeterminado para herramientas de video y música: Settings → Tools ahora incluye un menú desplegable de Modelo Predeterminado para los generadores de video y música, reflejando el selector existente para el generador de imágenes. El agente utiliza el modelo seleccionado por defecto; aún puede anularse por solicitud mencionando un modelo diferente.
- Common: Visualización del estado de indexación de Personal Intuition: El panel de configuración de Personalization ahora muestra una línea en vivo "Indexed: N threads · M chunks · K tokens · last indexed Xm ago" para que pueda confirmar que el indexador de memoria está haciendo su trabajo. El último resumen de relleno también permanece visible después de que se completa la ejecución en lugar de desaparecer.
- iOS: Embeddings nativos en el dispositivo (más rápidos, menos memoria): La inferencia de Multilingual-e5-small ahora se ejecuta en el proceso host de iOS a través de
onnxruntime-objcde Apple en lugar de dentro de WKWebView. Esto resuelve un límite de memoria por proceso que cerraba la WebView ~7 segundos después de la carga del modelo (el error de cierre tras el inicio de sesión). Después de la primera codificación del catálogo de herramientas, las llamadas posteriores de selección de herramientas acceden a una caché en memoria por texto y se completan en ~10 ms en lugar de ~5 s. La refactorización de la canalización compartida también evita que Personal Intuition y la selección de herramientas en el dispositivo carguen cada uno su propia copia de ~115 MB del modelo. - Common: Personal Intuition y la selección de herramientas en el dispositivo comparten una canalización e5: Ambas funciones instanciaban previamente su propio cargador de multilingual-e5-small (~115 MB cada uno, ~230 MB en total en el renderizador). Ahora delegan en una única canalización compartida que elimina duplicados en cargas concurrentes, reduciendo a la mitad el costo de inicio en frío.
Corrección de Errores
- Common: Las cookies de sesión del navegador ya no se filtran en las llamadas a la API: Si había visitado openrouter.ai en una pestaña del navegador, la extensión adjuntaba involuntariamente su sesión de navegador de OpenRouter (cookies de Clerk / Stripe / analíticas) a cada llamada a la API. Las llamadas a la API ahora están estrictamente autenticadas mediante Bearer.
- Common: Las respuestas de GPT-5.4 ya no aparecen dos veces: Se corrigió un error donde las respuestas de gpt-5.4, gpt-5.4-pro y gpt-5.3-codex mostraban el mismo texto dos veces seguidas —la carga útil de la respuesta final se acumulaba junto con el flujo de tokens que ya la había renderizado.
- Common: El selector de modelos se actualiza tras la recarga: La lista de modelos ahora se invalida en las actualizaciones de versión y respeta un TTL corto en memoria, por lo que los modelos de OpenRouter recién lanzados aparecen después de una recarga en lugar de quedar ocultos tras una caché obsoleta. Los service workers de larga duración ya no mantienen un catálogo congelado.
- Common: Los enlaces cortos de medios generados abren el reproductor: Cuando un modelo escribe un enlace corto como
[Listen](audio-…)después de generar audio/imagen/video, al hacer clic ahora se abre el reproductor de slate en lugar de fallar como una URL externa rota. La misma corrección se aplica a los enlaces de imagen y video. - Common: Los medios generados como incrustaciones de imagen en markdown se renderizaban rotos: Cuando el modelo escribía un adjunto de video o audio como
en lugar de[Video 1](video-…), se renderizaba como una etiqueta<img>rota en lugar de abrir el reproductor. El signo!inicial ahora se elimina para que el enlace abra el visor de slate. - Extension: Callejón sin salida "Permiso de ubicación denegado" en el panel lateral: Se corrigió una regresión donde cada solicitud de ubicación del panel lateral devolvía "Permiso de ubicación denegado. Por favor, permita el acceso a la ubicación en la configuración del navegador", independientemente de lo que el usuario seleccionara. Un intento de enrutar a través del documento offscreen generaba
PERMISSION_DENIEDinstantáneamente porque el contexto offscreen no puede mostrar un aviso de permiso y el manifiesto no declarageolocation. El panel lateral ahora utiliza la cadena original de script de contenido y luego geolocalización por IP que funcionaba anteriormente. - Common: La reconstrucción completa de Personal Intuition dejaba recuentos indexados obsoletos: Se corrigió que el relleno de la reconstrucción completa omitiera la actualización del índice por hilo, por lo que Settings → Personalization mostraba totales inflados previos a la reconstrucción después de una reconstrucción. Los hilos escaneados por la reconstrucción completa pero no indexados previamente ya no son invisibles para la recuperación.
- iOS: Bucle de cierre de WKWebView tras el inicio de sesión: Tres correcciones convergentes para el error de cierre tras el inicio de sesión. (1) Los embeddings nativos e5 ahora se ejecutan fragmentados en lotes de 8 con el área de memoria de ORT configurada para reducirse entre ejecuciones —el conjunto de trabajo máximo se mantiene por debajo de ~100 MB en lugar de dispararse a ~3 GB y activar el cierre por memoria por proceso de iOS. (2) El recuperador en el dispositivo ahora se activa durante
requestIdleCallbacken lugar de integrarse en el arranque, por lo que ya no compite con la sincronización de licencias, restauración de identidad, renderizado de UI e inicio de sincronización en la nube. (3) El recuperador en el dispositivo ahora se vuelve a aprovisionar al cambiar de identidad o nivel, por lo que las instalaciones nuevas ya no recurren silenciosamente a asistentes en la nube porque el nivel no estaba definido en el primer registro. - iOS: Errores 403 falsos de "recorrido de ruta bloqueado": Se corrigió que
LocalFileSchemeHandlermarcara erróneamente cada 404 como un intento de recorrido de ruta porqueNSString.standardizingPathsolo resuelve/var→/private/varpara archivos que existen en el disco. Las rutas legítimas a recursos inexistentes (el paquete de iOS excluye*.wasm, además de rutas de la API de chrome-extension comoapi/active-tab-context) devolvían 403 en lugar de 404, rompiendo el respaldo de pre-obtención de wasm de transformers.js. Se reemplazó con una verificación de../ NUL basada en cadenas que coincide con el controlador de Android. - Common: Las imágenes incrustadas en PDF rompían los modelos de solo texto: Al enviar un PDF con imágenes incrustadas a un modelo de OpenRouter de solo texto (DeepSeek V4 Pro, Kimi K2.6, etc.) se producía el error "No se encontraron endpoints que admitan entrada de imágenes" —la advertencia que el nuevo enrutamiento Seeing-Eye Dog debía eliminar. La ruta de entrega de PDF ahora respeta el mismo indicador
supportsVisionpor modelo que la entrega de bloques de imagen ya respetaba, por lo que los modelos de solo texto reciben un PDF de solo texto y el agente puede generar un subagente de visión si es necesario. - Common: El interruptor de nivel del bloqueador de anuncios no surtía efecto: Cambiar el nivel del bloqueador de anuncios (Desactivado / Estándar / Agresivo) solo cambiaba el valor persistido mientras que las reglas DNR activas + el conjunto de reglas estáticas permanecían en efecto hasta que el service worker se reiniciaba —por lo que después de cambiar a Desactivado, sitios como ads.google.com seguían bloqueados. El escuchador de almacenamiento ahora observa el cubo
globalSharedSettingsdonde realmente se escribe la configuración, y el indicador heredadoadBlockerEnabledse enruta a través del mismo cubo. - Extension: Las imágenes de gran tamaño se descartaban silenciosamente: Cuando un adjunto de imagen excedía el límite de la API, el service worker de la extensión no tenía una implementación de compresión registrada (solo estaba la del servidor respaldada por sharp) —por lo que la defensa en
pushImageBlockcapturaba la excepción y descartaba la imagen por completo. El SW ahora sondea las dimensiones naturales a través decreateImageBitmapy enruta la codificación a través del documento offscreen existente, de modo que los llamadores del contexto de la extensión reciben la imagen comprimida en lugar de un marcador de posición descartado. - Common: Imágenes generadas y capturas de pantalla rechazadas por los proveedores: Anthropic limita las imágenes base64 a 5 MB; otros proveedores tienen límites similares. Las imágenes generadas de FLUX / Gemini / Seedream y las capturas de pantalla grandes se pasaban a tamaño completo, produciendo errores 4xx que abortaban todo el turno del agente. Tres capas de defensa: el generador de imágenes comprime la salida antes del almacenamiento; un nuevo asistente
pushImageBlockenruta cada emisión deimage_urla través de comprimir o descartar; y tanto la reconstrucción de capturas de pantalla como la inyección de capturas en vivo pasan por el mismo asistente. Límite conservador de 4 MB que funciona en todos los proveedores.
Versión 0.9.718 (22 de abril de 2026)
Nuevas Funcionalidades
- Common: Personal Intuition — memoria asociativa entre hilos: Caiioo recuerda discretamente lo que has hablado anteriormente — a través de cada conversación, no solo en la actual. Los recuerdos relevantes surgen mientras chateas; tu agente puede usar uno directamente o simplemente dejar que influya en la respuesta. Como cuando un aroma te recuerda a un lugar. Encuéntralo en Personalization → Personal Intuition; desactivado por defecto. Incluye Full-rebuild e Incremental backfill para que puedas indexar tus hilos existentes.
- Common: Respaldo y restauración de Personal Intuition: Puedes realizar una instantánea de todo el corpus de memoria en un archivo JSON en Backup & Restore → Personal Intuition, y restaurarlo más tarde si algo sale mal o si deseas moverlo a otro dispositivo.
- Common: Instant Tool Chooser por defecto para todos los niveles: El selector semántico de herramientas ahora se ejecuta localmente en cada dispositivo, en todos los niveles — incluyendo el gratuito. Elige las herramientas adecuadas para cada turno en ~10 ms, totalmente en tu dispositivo. La interfaz del selector en Settings → Tools aclara la opción como "Instant Tool Chooser" frente a "Quick Tasks LLM" (que utiliza cualquier modelo que hayas marcado con el rayo en el selector de modelos).
- iOS / Android: Instant Tool Chooser en las aplicaciones nativas: El mismo selector de herramientas on-device está ahora disponible dentro del WebView de las aplicaciones de iOS y Android, no solo en la extensión de Chrome y en la versión de escritorio.
Mejoras
- Common: El sandbox de Slate permite CDNs de scripts HTTPS: Los artefactos HTML de slate ahora pueden cargar librerías comunes como Chart.js o D3 desde CDNs HTTPS de buena reputación (jsdelivr, unpkg, etc.). La obtención de datos sigue bloqueada al mismo origen (same-origin), así que utiliza
bind_datapara canalizar los datos de los archivos adjuntos hacia un slate. - Common: Progreso de Personal Intuition más claro: El backfill ahora muestra el progreso por hilo en el panel de configuración (ej. "47/75 hilos · 2,134 fragmentos") mientras se ejecuta, en lugar de permanecer en silencio hasta finalizar.
- Common: Selección de herramientas más rápida tras la indexación de memoria: La indexación de un corpus de memoria extenso ya no expulsa la caché del catálogo de herramientas en el recuperador on-device — la siguiente llamada a una herramienta se mantiene activa en lugar de pagar un coste de re-codificación.
Corrección de Errores
- Common: Los sub-agentes concurrentes generaban errores falsos de actualización de nivel: Se corrigió una condición de carrera donde dos sub-agentes ejecutándose en paralelo podían sobrescribir el contexto del hilo activo del otro, provocando que las acciones restringidas a Pro (update_slate, etc.) fueran rechazadas para el sub-agente equivocado. La aplicación del nivel (tier) ahora está vinculada al hilo específico de la llamada de despacho.
- Common: Las vinculaciones de datos CSV en Slate rompían
forEach: Se corrigió el error por el cual los datos vinculados a CSV llegaban al sandbox como un objeto no iterable —data.forEach(...)dentro del JavaScript del sandbox ahora funciona como se espera.
Versión 0.9.717 (17 de abril de 2026)
Nuevas Funcionalidades
- Common: Nivel Pro Unificado en todas las Apps: Pro es ahora una suscripción única de $9/mes que desbloquea todas las aplicaciones de Caiioo — Chrome, Desktop y Mobile — en lugar de paquetes separados por aplicación. Platform ($14/mes) se reposiciona como "Pro + infraestructura" (servidor local, vista previa de acceso a API, Messaging).
- Common: Nivel Pro Mobile: Un plan Pro exclusivo para móviles está disponible por $2.99/mes, vendido directamente en la App Store y Play Store. La compra dentro de la aplicación es en sí misma el derecho de acceso — no se requiere una licencia por separado.
- Common: Herramienta Ask-User para Human-in-the-Loop: El agente ahora puede pausar a mitad de la ejecución y mostrar un diálogo de decisión de cuatro vías (aprobar, aprobar con notas, rechazar, rechazar con notas). Sus notas regresan al modelo como guía en lenguaje natural que anula el plan propuesto — no se inicia un nuevo ciclo, el agente continúa en el lugar.
- Common: Búsqueda de Guía In-App: Busque en la guía del usuario directamente desde el menú Document. Los resultados vinculan profundamente a caiioo.ai/guide, preservando el flujo de redirección existente.
- iOS: Alternancia de Paywall Mensual/Anual: La hoja de suscripción de iOS ahora permite cambiar entre facturación Mensual y Anual antes de la compra.
- Desktop: Actualizaciones Automáticas en Windows y Linux: La aplicación de escritorio Tauri ahora se distribuye con el actualizador habilitado, por lo que las versiones de Windows y Linux pueden recibir actualizaciones en el lugar en lugar de requerir una reinstalación manual.
- Web: Búsqueda por Pestañas en Guía y Blog: Los diseños de la guía y el blog del sitio de marketing ahora incluyen una barra de búsqueda con cambio de alcance por pestañas — las coincidencias en el título tienen mayor prioridad que las del cuerpo, y la pestaña activa cambia automáticamente a donde se encuentran los resultados.
- Web: Página de Instalación Dedicada para Linux: La página de instalación dirige a los usuarios de Linux a
/install/linux, que presenta opciones de AppImage,.deby.rpmcon comandos específicos por distribución. - Web: Rutas de Descarga Estables:
/download/macos,/download/linuxy/download/windowsson ahora URLs estables respaldadas por edge-workers que siempre resuelven a la última versión — no se requiere reconstruir el sitio web por cada lanzamiento.
Mejoras
- Common: Gestión de Tickets de Soporte In-App: Las solicitudes de soporte ahora se canalizan a través del flujo de tickets dentro de la aplicación como ruta principal, con mensajes de error de créditos más claros que le indican el lugar correcto cuando algo sale mal.
- Common: Re-autenticación de Google OAuth más Inteligente: Las herramientas de Google ahora verifican los alcances (scopes) realmente otorgados por Google y activan un aviso de re-autorización justo a tiempo cuando un error 403 indica que falta un alcance, en lugar de fallar silenciosamente.
- Common: Alcance Full Drive para Escrituras en Google: Las acciones de escritura en Google Drive ahora solicitan el alcance completo de la unidad para que las ediciones en documentos que usted no creó tengan éxito en lugar de encontrar errores de permisos.
- Common: Descripciones de Modelos del Generador de Imágenes: La herramienta de generación de imágenes muestra una descripción para cada modelo disponible, facilitando la elección del adecuado para la tarea.
- Common: Mensajes de Artefactos Slate más Precisos: Cuando una herramienta crea o actualiza un artefacto Slate, el modelo ya no afirma que el artefacto se "muestra en el editor" — la redacción ahora refleja lo que sucede realmente.
- Common: Mejor Selección Dinámica de Herramientas desde Pestañas: La sugerencia de contexto de pestaña ahora emite IDs de herramientas, para que el selector dinámico de herramientas pueda aplicar reglas de selección basadas en el contexto que dependen de qué herramientas están disponibles.
- Common: Costos de Voz Atribuidos a Threads: El uso de TTS en streaming (ElevenLabs, Resemble) y STT (ElevenLabs Scribe) ahora se acumula como costo de voz en la conversación donde ocurrió, coincidiendo con la ruta de síntesis de un solo paso existente.
- Extension: El Subtítulo de Inicio de Sesión Enfatiza Agentes Locales: Pequeña actualización de texto en la pantalla de inicio de sesión.
Corrección de Errores
- Desktop: Selector de Archivos en Linux Restaurado: Se corrigió el fallo del selector de archivos en Linux dentro de la aplicación de escritorio Tauri.
- Desktop: Reporte de Versión Incorrecto: Se corrigió que la aplicación de escritorio Tauri reportara una cadena de versión incorrecta en la interfaz de usuario y la telemetría.
- Desktop: Audio de Linux más Silencioso y Errores más Claros: Se suprimió el ruido de los registros de PipeWire en Linux, se mostraron los errores de OpenRouter en lugar de ocultarlos, se restauró la ruta de lectura de la alternancia de API y se corrigió un banner de paridad incorrecto.
- Common: La Extracción del Cuerpo de Gmail Perdía Enlaces: Se invirtió la precedencia de extracción de Gmail para intentar primero el markdown que preserva enlaces, y luego recurrir a texto plano solo cuando la salida de markdown está vacía — los correos electrónicos ya no pierden enlaces en el caso común.
- Common: Los Ajustes de la Public API no Persistían: Se corrigió que el interruptor de Public API y el token de acceso no se guardaran en algunas configuraciones, y se aseguró que estos ajustes permanezcan estrictamente locales en lugar de sincronizarse con la nube.
- Common: Archivar y Renombrar se Sentían Lentos: Eliminar, archivar, desarchivar y renombrar ahora actualizan la interfaz de usuario de forma optimista para que la lista refleje el cambio inmediatamente en lugar de esperar un viaje de ida y vuelta al servidor.
- Common: Las Eliminaciones de Archivo no se Sincronizaban: Se corrigió que las eliminaciones de archivos se aplicaran directamente al almacenamiento, omitiendo la ruta del protocolo — ahora se propagan a través de los clientes como cualquier otra acción de thread.
- Common: La Agenda Mostraba Falsos "Faltan Alcances": Se corrigió que el widget de recordatorios/agenda leyera un perfil de contexto de herramienta desactualizado justo después de otorgar alcances de Google Calendar, por lo que marcaba alcances faltantes mientras las herramientas funcionaban bien. La interfaz de usuario ahora lee el perfil actualizado, y una actualización ejecuta automáticamente el flujo de consentimiento de alcances incrementales de forma secuencial en cualquier cuenta de Google conectada que aún lo necesite — no es necesario abrir el diálogo de sincronización para buscar "otorgar acceso".
- Common: Llamadas a Herramientas de Google Rechazadas con "Unknown name exclusiveMinimum": Se corrigió que Gemini rechazara llamadas a herramientas cuyos esquemas de parámetros usaban límites numéricos
exclusiveMinimum/exclusiveMaximum— estos ahora se eliminan antes de enviarlos al subconjunto restringido de OpenAPI de Google. - Common: Servidores MCP Remotos sin DCR Fallaban al Conectar: Se corrigió la adición de servidores MCP remotos que no admiten Dynamic Client Registration (ej. Slack): el cliente ahora respeta los metadatos de recursos protegidos de RFC 9728, sigue a
authorization_serversal host AS cuando difiere del host del recurso, y deja de fabricar un endpoint/registerque no existe. - Server: Usuarios de Nivel Tester Rechazados por Endpoints Restringidos: Se corrigió que los endpoints de organizaciones, hub, admin y claves provisionadas rechazaran a usuarios cuyo nivel efectivo (por licencias) era superior al nivel desactualizado capturado en su token de autenticación. Los endpoints restringidos ahora evalúan el nivel efectivo de manera consistente con
/api/auth/me. - Extension: Bucle de Ping-Pong de Sincronización de Identidad: Se corrigieron las identidades en conflicto entre la extensión y el servidor de retransmisión que entraban en un bucle infinito en
IDENTITY_SYNC. La extensión ahora confirma una vez contra el mismo remoto en conflicto, advierte que debe cerrar sesión en un lado para resolverlo, y se reinicia al desconectarse / coincidir / adopción remota. - Common: Gemini Flash TTS no Podía Seleccionarse ni Configurarse: Se corrigió que Gemini Flash TTS (voz) fuera inutilizable de extremo a extremo — seleccionarlo se revertía al cerrar los ajustes, y el campo de la clave API parecía no aceptar escritura. El proveedor es ahora una opción de TTS de primer nivel: la selección persiste, la clave API + el selector de voz se guardan correctamente, y la síntesis utiliza un endpoint de streaming SSE para que la reproducción de audio pueda comenzar antes de que termine de generarse la locución completa.
- iOS: La Interfaz de Nuevo Thread no Cambiaba: Se corrigió que la aplicación de iOS no cambiara la vista activa a un thread recién creado, y se corrigió un ReferenceError de
modelNamerelacionado que podía bloquear el compositor. - iOS: Bloqueo al Iniciar en el Hook de Almacenamiento Opcional: Se corrigió un bloqueo en iOS cuando
storage.primeSettingsCacheno estaba disponible durante el inicio — la llamada ahora está protegida. - Common: Discrepancias en la Auditoría de Niveles tras el Cambio de Precios: Se corrigieron seis inconsistencias de precios y características detectadas por la auditoría de niveles, de modo que las restricciones de derechos, los avisos de actualización y los flags de características ahora coinciden en la extensión, el sitio web y las aplicaciones móviles.
Cumplimiento de la App Store de iOS
- iOS: CTAs de Registro Externo Ocultos en el Onboarding: El onboarding ya no muestra llamadas a la acción que dirijan a los usuarios fuera del dispositivo para la creación de cuentas o actualizaciones de pago.
- iOS: Interfaz de Compra de Créditos Oculta: Las superficies de compra de créditos están ocultas en iOS según las reglas §3.1.1 de Apple; las suscripciones se canalizan a través de StoreKit en su lugar.
- iOS: Redacción de Soporte y Errores de Crédito Actualizada: La página de /support y los mensajes de error de créditos han sido redactados nuevamente en iOS para cumplir con las directrices de Apple sobre referencias a compras externas.
Version 0.9.716 (April 12, 2026)
New Features
- Common: Gemini 3.1 Flash TTS: Nueva opción de salida de voz impulsada por Gemini 3.1 Flash TTS de Google. 30 voces predefinidas, más de 70 idiomas y etiquetas de audio integradas como
[whispers]y[sighs]para una síntesis expresiva. Trae tu propia API key de Gemini; obtén una gratis en aistudio.google.com. El audio incluye marca de agua con SynthID. - Common: Voice Cost in Conversation Total: El uso de las API de texto a voz y voz a texto (Gemini, ElevenLabs, Resemble) ahora se integra en el resumen de costos por hilo junto con los costos de chat, generación de imágenes, helpers y OCR; para que el número que veas sea el costo real.
- Common: SQL Database Tool: Adjunta bases de datos SQLite a las conversaciones y realiza consultas con SQL. Los resultados pueden renderizarse como tableros en vivo en artefactos de Slate.
- Common: Calendar Invitations and Google Meet: La creación de eventos de calendario ahora envía correos electrónicos de invitación a los asistentes y puede añadir automáticamente un enlace de video de Google Meet.
- Common: Per-Tool Provider Routing: Enruta herramientas individuales (generación de imágenes, búsqueda, OCR de PDF, etc.) a proveedores específicos a través de Settings, en lugar de que todo pase por el modelo predeterminado.
- Common: Conversation Sharing: Comparte conversaciones como Markdown o texto plano.
- Common: 14-Day Platform Trial: Inicia una prueba de 14 días del nivel Platform desde la interfaz de la extensión o la página de cuenta del sitio web. Los suscriptores Pro también son elegibles.
- Common: ZDR Quick-Filter in Model Picker: Nuevo botón en el menú desplegable del selector de modelos para filtrar rápidamente los modelos con zero-data-retention.
- Common: Simplified Settings: Settings ahora se abre en una vista Simple optimizada por defecto, mostrando solo lo esencial. Cambia al modo Advanced en cualquier momento para ver todo.
- Common: Free Google Gemini Access: Trae tu propia clave de Google AI Studio para usar Gemini 2.5 Flash de forma gratuita; el nivel gratuito de Google ahora está disponible para todos los usuarios, sin necesidad de un plan de pago.
- Common: Baseten Self-Hosted Models: Conecta tus propios despliegues de Baseten para usar modelos auto-alojados directamente en caiioo.
- iOS: WhisperKit On-Device Speech-to-Text: El dictado ahora se ejecuta completamente en el dispositivo a través de WhisperKit; el audio nunca sale del teléfono.
- Android: On-Device Whisper STT: El dictado de voz a texto a través de whisper.cpp se ejecuta completamente en el dispositivo en Android con el flujo de permisos de micrófono.
- Android: GPU-Accelerated Moonshine STT: En dispositivos Android con capacidad de GPU, el dictado puede ejecutarse en Moonshine con inferencia de menos de un segundo. Solo en inglés; whisper.cpp sigue siendo la opción multilingüe de respaldo.
- Web: Sign in with Apple on Account & Hub Pages: Apple Sign-In ahora está disponible en las páginas de cuenta y hub del sitio web.
Improvements
- Common: Better PDF Export: Exportar un PDF desde Slate ahora genera un archivo PDF real en lugar de abrir el diálogo de impresión, para que obtengas un documento limpio cada vez.
- Common: Google Slides Full Text: Solicitar el texto de las diapositivas sin especificar una página ahora devuelve el texto de todas las diapositivas de la presentación.
- Common: Smarter Web Search: Los resultados de búsqueda de Google ahora se extraen con una mejor estructura, capturando títulos, fragmentos y enlaces de manera más confiable tras los recientes cambios de diseño de Google.
- Common: Kokoro Text-to-Speech on All Platforms: La opción de voz Kokoro ahora aparece en iOS, macOS y Android; anteriormente estaba oculta en las aplicaciones nativas.
- Common: Cleaner Credit Balance Display: El saldo de la cuenta para configuraciones prepago y de "trae tu propia clave" ahora muestra tu saldo real sin el confuso marco de "Limit".
- Common: Higher-Fidelity PDF to Word Conversion: La exportación de PDF→DOCX ahora utiliza una vista de Document dedicada en Slate, produciendo archivos de Word que preservan fielmente el diseño y la estructura del PDF de origen.
- Web: Quieter Account and Auth Pages: Google Analytics y el banner de consentimiento de cookies se suprimen en las páginas de cuenta y autenticación para un flujo de inicio de sesión más limpio.
Bug Fixes
- Common: Settings Search Didn't Navigate: Se corrigió el error por el cual el menú desplegable de búsqueda de configuración y los enlaces profundos no lograban saltar a varias secciones (API Access, Private Sync, Backup & Restore, Voice y otras); la categoría de destino permanecía colapsada y no se desplazaba a la vista.
- Common: OAuth Prompts in Sub-Agents: Se corrigió el error por el cual las solicitudes de autorización OAuth y de actualización de nivel se descartaban silenciosamente cuando eran activadas por un sub-agente, lo que interrumpía los flujos de conexión a mitad de la ejecución.
- Common: Ollama Model Not Saved After Onboarding: Se corrigió el error por el cual el modelo de Ollama seleccionado durante el onboarding no persistía después.
- Common: UI Chunks Failed to Load During Rate Limiting: Se corrigió el error por el cual los activos estáticos de la interfaz de usuario sufrían limitación de tasa junto con las solicitudes de la API, causando pantallas en blanco o paneles faltantes hasta refrescar.
- Common: Composer-Preprocessed Attachment Metadata Lost: Se corrigió la pérdida de metadatos de archivos adjuntos en el servidor para documentos preprocesados en el composer antes de ser enviados al modelo.
- Common: Free Time Counted Attended Events as Busy: Se corrigió el cálculo de tiempo libre de la agenda que te marcaba como ocupado durante eventos a los que solo asistías; ahora solo se cuentan los eventos en tu propio calendario.
- Common: Google Search Results Broken: Se corrigió la búsqueda web que devolvía resultados vacíos después de que Google cambiara el diseño de su página de búsqueda.
- Desktop: Windows/Linux Login Out of Sync with Other Platforms: Se corrigió el flujo de inicio de sesión de escritorio de Tauri que divergía de Chrome/macOS/iOS, incluyendo la detección incorrecta de niveles y la imposibilidad de volver a iniciar sesión tras cerrar la sesión.
- Desktop: Public API Blocked the Desktop UI: Se corrigió el error por el cual la propia interfaz de la aplicación de escritorio era bloqueada por la autenticación de la API cuando la configuración de Public API estaba habilitada.
- Common: Google Docs OAuth Errors Hidden: Se corrigió el error por el cual las operaciones de Google Docs fallaban silenciosamente cuando la autenticación expiraba en lugar de mostrar un error claro.
- Common: Settings Panel Crash: Se corrigió el cierre inesperado del panel de configuración al restaurar una API key aprovisionada.
- Common: Google Drive Sync Duplicating Documents: Se corrigió la duplicación de Google Docs en cada ejecución de sincronización en lugar de actualizarse en el mismo lugar.
- Common: Google Drive Sync Inline Code Lost: Se corrigió la pérdida del formato de código en línea al sincronizar documentos con Google Docs.
- Common: Gemini Thinking Extraction: Se corrigió el error por el cual el contenido de pensamiento/razonamiento no se capturaba correctamente de las respuestas del modelo Gemini.
- Common: Profile Switch Stale Data: Se corrigió el error por el cual al cambiar entre perfiles a veces se mostraban conversaciones del perfil anterior hasta realizar un refresco manual.
- Common: Task Scheduler "Method Not Found" Error: Se corrigió el error por el cual las tareas programadas lanzaban errores cada 60 segundos en ciertas configuraciones.
- Common: Text Insertion Newlines in Google Docs: Se corrigió la aparición literal de
en las inserciones de texto en lugar de saltos de línea reales. - Common: Google Account Hint on Tools: Se corrigió el error por el cual las herramientas de Google a veces utilizaban la cuenta de Google incorrecta para las llamadas a la API.
- Common: Settings and Thread Import Round-Trip: Se corrigió el error por el cual las exportaciones de configuraciones e hilos no se importaban correctamente de vuelta.
- Common: Sub-Agent Token Usage: Se corrigió el error por el cual el uso de tokens del sub-agente no se contabilizaba en la conversación principal.
- Common: Messaging Bridge Reply During Retry: Se corrigió el fallo en las respuestas del puente de mensajería cuando el asistente reintentaba una respuesta.
- Common: Slate Redline Positioning: Se corrigió el posicionamiento incorrecto de las eliminaciones de redline cuando había markdown presente.
- Common: Browser Connection Survives Sleep/Wake: Se corrigieron los errores de "No browser connected" después de que la computadora entrara en modo de suspensión o permaneciera inactiva por largos períodos.
- Common: Scheduled Tasks Survive Service Worker Sleep: Se corrigió el error por el cual las tareas recurrentes se detenían tras largos períodos de inactividad.
- macOS: Safari Google Search Failures: Se corrigió el error por el cual la búsqueda de Google no funcionaba en la extensión de Safari en macOS.
- iOS: Mobile App Access: Se corrigió el error por el cual la aplicación de iOS requería incorrectamente un plan de pago; la aplicación móvil ahora está disponible para todos los usuarios.
Versión 0.9.715 (3 de abril de 2026)
Nuevas Funciones
- Common: Sistema de Entrega Hub: Las definiciones de herramientas de origen, las configuraciones de modo y el catálogo MCP ahora están preparados para ser entregados desde el hub en la nube en lugar de estar codificados en el paquete, con almacenamiento en caché local y respaldo sin conexión en preparación para el lanzamiento de la comunidad.
- Common: Modo de Pestaña Única para Herramientas de Navegador: La nueva política de pestañas del navegador por modo reutiliza una sola pestaña para toda la navegación en una conversación, evitando la acumulación de pestañas durante flujos de trabajo con mensajería intensiva como WhatsApp.
- Common: Cargas Binarias en Integración de API: La herramienta api_integration ahora admite la carga de archivos binarios y la carga directa de archivos locales a través de URLs firmadas previamente, en lugar de convertir siempre los cuerpos de las solicitudes a cadenas JSON.
- Common: Gestión de Credenciales mediante Herramienta: Guarde, enumere y elimine credenciales de API mediante programación a través de la herramienta api_integration, algo que anteriormente solo era posible a través de la UI de Settings.
- macOS: Selección de Dispositivo de Entrada de Audio: Elija qué micrófono usar para la entrada de voz; enumera todos los dispositivos de audio disponibles y mantiene su selección.
- Android: Recuperación de OAuth en Memoria Baja: Los flujos de OAuth en Android ahora sobreviven a la recreación de la actividad cuando el sistema cierra la aplicación por falta de memoria, recuperando la sesión de autenticación sin problemas.
- Common: Arquitectura CSS Móvil de 3 Capas: Nuevo sistema CSS responsivo para móviles con capas de plataforma, diseño y componentes, garantizando una UI consistente en vistas de teléfono, tableta y escritorio.
Mejoras
- Extension: OAuth Incremental mediante Pestaña: Las solicitudes de alcance incremental ahora abren una pestaña completa del navegador en lugar de una ventana emergente, solucionando bloqueos en cuentas que requieren consentimiento interactivo.
- Common: Calidad del Esquema de Herramientas MCP: Todas las herramientas MCP ahora pasan una prueba de calidad de lint que verifica esquemas completos, descripciones adecuadas y definiciones de parámetros consistentes.
- Extension: Cierre Automático de Pestañas del Navegador al Detener: Las pestañas del navegador abiertas por el asistente ahora se cierran cuando se detiene una ejecución, y las ventanas de Safari de OAuth se cierran en macOS.
- Android: Actualización de Toolchain: Compilación de Android actualizada a AGP 9.1, Kotlin 2.2.10 y Gradle 9.3.1.
Corrección de Errores
- Common: Posicionamiento de Tablas en Google Docs: Se corrigieron las mutaciones que terminaban en posiciones incorrectas cuando las tablas preceden al texto de destino en Google Docs.
- Common: Eliminación de Pie de Página en Contenido de Página: Se corrigió la extracción de contenido de página que eliminaba incorrectamente elementos del pie de página de las páginas capturadas.
- Common: Paginación de Navegación Web: Se corrigió la paginación rota para la página 2+ cuando no se especificaba un maxLength explícito.
- Common: Respaldo de Script de Contenido: Se corrigió el fallo silencioso de la extracción de contenido de página al implementar un respaldo a executeScript cuando el script de contenido no está disponible.
- Common: Renderizado de PDF para Documentos Ingeridos por URL: Se corrigió el fallo del renderizado nativo de PDF para documentos ingeridos a través de URL.
- Common: Análisis de Llamadas a Herramientas de Gemini: Se corrigieron las claves entre comillas dobles en los argumentos de llamada a herramientas de LLM que causaban fallos de análisis con modelos Gemini.
- Common: Compatibilidad con Amazon Nova: Se corrigieron los mensajes tool_call rechazados por Amazon Nova debido a campos de texto vacíos.
- Common: La Ejecución del Agente no Termina: Se corrigió que las ejecuciones del agente no llamaran a endRun de manera confiable en el contexto del service worker, dejando pestañas del navegador y estados sin limpiar.
- macOS: Reanudación de Audio de Voz: Se corrigió que el audio de voz no se reanudara después del modo de suspensión de la aplicación macOS o la minimización en el dock.
- macOS: Capturas de Pantalla no Aparecen: Se corrigió que las capturas de pantalla de macOS no aparecieran en la UI del asistente debido a una detección de contexto incorrecta.
- macOS: Ubicación no Funciona: Se corrigió la ubicación rota en Safari y en la aplicación nativa de macOS al agregar el puente CoreLocation y corregir el respaldo de IP.
- macOS: Falta de Permiso de Ubicación: Se corrigió la falta del permiso (entitlement) de ubicación y se aumentó el tiempo de espera de ubicación nativa.
- iOS: Selector de Archivos Roto: Se corrigió que el selector de archivos no se abriera en iOS WKWebView al agregar el delegado runOpenPanel.
- Extension: Exceso de Concesión de Alcance OAuth: Se eliminó include_granted_scopes de la ventana emergente web y de las rutas OAuth posteriores al inicio de sesión para evitar la inflación no intencionada del alcance.
- Extension: Omisión de la Pantalla de Consentimiento OAuth: Se corrigió la elevación del alcance OAuth que omitía la pantalla de consentimiento durante las solicitudes de alcance incremental.
- Desktop: Ventana de Consola Visible en Windows: Se corrigió la aparición de la ventana de consola al iniciar el sidecar de Tauri en Windows.
- Desktop: Compilación de Windows Rota: Se corrigió la resolución de la ruta binaria de node y se aplanó node_modules para las compilaciones de Tauri en Windows.
- Server: Procesamiento de Webhooks Duplicados: Se corrigió el procesamiento de webhooks varias veces cuando había varios clientes conectados.
- Server: Códigos de Promoción en Compras de Créditos: Se desactivaron los códigos de promoción para compras de créditos en el checkout de Stripe.
Versión 0.9.714 (29 de marzo de 2026)
Nuevas Funciones
- Common: Onboarding Rediseñado: La nueva pantalla de onboarding presenta 6 rutas claras de acceso a la AI, facilitando que los nuevos usuarios comprendan sus opciones para conectarse con proveedores de AI.
- Common: PDF desde Markdown: Los nuevos documentos creados desde cero ahora pueden exportarse como PDF, convirtiendo el contenido markdown en un archivo PDF con formato.
- Common: Google OAuth Unificado: La conexión de la cuenta de Google ahora utiliza una única aplicación OAuth verificada con todos los alcances (scopes), reemplazando la configuración anterior de múltiples aplicaciones. Flujo de conexión más sencillo con menos avisos.
- Common: Meta-parámetro Save to Slate: Las herramientas ahora pueden enviar resultados directamente a un documento slate a través del parámetro
_save_to_slate, capturando resultados estructurados sin necesidad de copiar y pegar. - Common: Enlaces de Anclaje en Slate: Los mensajes de chat con referencias a slate ahora incluyen enlaces de anclaje clicables que se desplazan hasta la sección relevante dentro del documento.
- Common: Sandbox Data Bridge: Los sandboxes de artefactos HTML ahora pueden acceder dinámicamente a los datos de slate a través de un puente postMessage, permitiendo dashboards en vivo y visualizaciones interactivas.
- Common: Insignias de Nivel (Tier Badges): Los ajustes, herramientas y funciones de automatización ahora muestran insignias de nivel que indican qué nivel de acceso se requiere, brindando visibilidad a los usuarios de acceso ampliado sobre las restricciones.
- macOS: Speech-to-Text Nativo (WhisperKit): Reconocimiento de voz en el dispositivo a través de WhisperKit y CoreML, reemplazando el STT basado en navegador con una implementación nativa, privada y más rápida.
- macOS: Auto-actualización Sparkle: Actualizaciones automáticas listas para producción para la aplicación de macOS y la extensión de Safari a través de Sparkle, con feed appcast y actualizaciones delta.
- macOS: Contexto de Pestañas Nativo: La extracción de contexto de pestañas basada en AppleScript proporciona a la aplicación de macOS conocimiento sobre las pestañas del navegador en primer plano.
- macOS: Streaming de Tecla de Acceso Rápido de Voz: La tecla de acceso rápido de voz ahora muestra una superposición de streaming en tiempo real durante la grabación con carga automática del modelo WhisperKit.
- Safari: Mensajería Nativa: La extensión de Safari ahora se comunica con la aplicación de macOS a través de mensajería nativa en lugar de sondeo HTTP, mejorando la capacidad de respuesta y la fiabilidad.
- iOS/Android: Diálogos de Guardado Nativos: La exportación JSON ahora utiliza diálogos de guardado nativos (NSSavePanel en macOS, SAF en Android) en lugar de descargas de blobs fallidas.
- Web: Página de Destino para Equipos: Nueva página /teams con mensajes para equipos y empresas destinados a clientes potenciales.
- Web: Sección de Blog: Nueva sección de blog en el sitio web de caiioo.
- Web: Activación de Prueba Gratuita: La página de cuenta ahora admite la activación de la prueba gratuita con un flujo de onboarding alineado.
- Common: Soporte para Unidades Compartidas: Google Picker y todas las llamadas a la API de Drive ahora admiten unidades compartidas, permitiendo el acceso a documentos compartidos del equipo.
Mejoras
- Common: Saludo Adaptativo: El saludo adaptativo ahora se basa en los mensajes de bienvenida personalizados en lugar de ignorarlos, preservando el tono personalizado del usuario.
- Common: Limpieza de Callback de OAuth: Las pestañas de callback de OAuth ahora se cierran automáticamente con un temporizador de cuenta regresiva en lugar de permanecer abiertas.
- Common: Guía de OAuth: Cuando una herramienta necesita una conexión de cuenta, el mensaje de error ahora incluye una guía práctica sobre qué cuenta conectar.
- Common: Sobrescritura Forzada de Drive Sync: El flujo de trabajo de Drive Sync ahora admite una opción de sobrescritura forzada para volver a sincronizar todos los archivos.
- macOS: Visor de Registros de Depuración Unificado: La vista de registros de depuración ahora agrega los registros del servidor, Swift y la interfaz de usuario en un único flujo cronológico.
- macOS: Almacenamiento de Ajustes por Cubetas (Bucketed): El adaptador de almacenamiento del servidor se ha refactorizado a una arquitectura por cubetas con migración robusta, marcadores persistentes, atomicidad multi-perfil y resolución de conflictos de "el primer escritor gana".
- macOS: Extensión de Safari Notarizada: La extensión de Safari ahora está firmada con Developer ID y permisos compatibles con la notarización, eliminando el requisito de "Permitir extensiones no firmadas" para las versiones distribuidas.
- iOS: Apple Reminders por Defecto: iOS y macOS ahora utilizan Apple Reminders por defecto y los recuperan en la vista de sincronización automáticamente.
- Common: Elevación de Alcance de OAuth: Las solicitudes de alcance incremental ya no muestran los 22 alcances; solo se muestran los alcances recién solicitados, con avisos de selección de cuenta más limpios.
- Common: Reintento Automático de Cuenta de Google: Cuando un documento devuelve un error 404, se prueban automáticamente otras cuentas de Google conectadas antes de mostrar un error.
- Common: Navegación por Enlaces Profundos en Ajustes: Todas las secciones de ajustes ahora están registradas correctamente para la búsqueda y la navegación por enlaces profundos.
Corrección de Errores
- Common: Enrutamiento Incorrecto de Herramientas: Se corrigió el enrutamiento incorrecto de herramientas cuando los modelos usan el formato
tool:actionseparado por dos puntos en sus respuestas. - Common: Formato de Celdas de Tabla: Se preservó el formato y los enlaces en las celdas de las tablas y se eliminó la numeración de listas heredada que se filtraba entre celdas.
- Common: Desplazamiento de Resaltado en Slate: Se corrigió el desplazamiento de resaltado en el editor TipTap para pestañas en segundo plano, modo de vista previa y vistas nativas utilizando un posicionamiento confiable basado en ProseMirror.
- Common: Búsqueda de Texto en Bloques de Código: Se corrigió el respaldo a la búsqueda de texto cuando falla el mapeo estructural de bloques para bloques de código en documentos slate.
- macOS: Ajustes Perdidos al Cambiar de Modo: Los ajustes globales (claves API, conexiones) ya no se borran al cambiar de modo en macOS/iOS; ahora una lista de permitidos explícita controla qué ajustes se restablecen.
- macOS: Paridad de Purga de Almacenamiento: La purga completa de almacenamiento ahora borra todos los campos de estado de manera consistente, coincidiendo con el comportamiento de chrome.storage.local.clear(). La eliminación de perfiles y la limpieza de retención también se enrutan correctamente a través de las cubetas.
- macOS: Concurrencia de Ajustes: Las lecturas de ajustes en applyModeDefaults ahora adquieren el bloqueo primero, evitando condiciones de carrera. Las estadísticas de almacenamiento se leen de las cubetas en lugar de un caché plano obsoleto.
- macOS: Robustez de Migración: La migración de almacenamiento se reintenta en caso de fallo, utiliza marcadores de finalización persistentes y limpia automáticamente los datos obsoletos previos a la migración.
- macOS: Procesos Zombie del Servidor MCP: Los procesos secundarios del servidor MCP ahora se terminan correctamente cuando se cierra la aplicación de macOS.
- macOS: Calendario/Recordatorios en Agenda: Se corrigió que los eventos de Apple Calendar y los Recordatorios no aparecieran en el modal de la agenda.
- macOS: Flujo de Google OAuth: Se corrigió el fallo del inicio de sesión de Google en macOS WKWebView enrutando OAuth a través del flujo web del servidor de relevo.
- macOS: Navegación al Cerrar Sesión: Se corrigió que el cierre de sesión no regresara a la pantalla de inicio de sesión en macOS.
- macOS: Autenticación de Acceso Remoto: Se corrigió el error 401 en el endpoint set-remote-access al eliminar un requisito de autenticación incorrecto.
- Server: Entrega de Respuestas de WhatsApp: Se corrigió que las respuestas de WhatsApp no se enviaran de vuelta a WhatsApp y solo permanecieran en el hilo de chat de PF.
- Server: Tiempo de Espera de Relevo de WhatsApp: Se extendió el tiempo de espera de relevo de WhatsApp de 120s a 10 minutos y se corrigió la resolución en errores de generación.
- Server: Re-autenticación de Sincronización Privada: Se corrigió el flujo de re-autenticación de sincronización privada, la protección OAuth del lado del servidor y la limpieza al cerrar sesión en macOS.
- Server: Autenticación de Sincronización de Carpetas Locales: Se corrigió el error de autenticación 401 en las operaciones de sincronización de carpetas locales/de red.
- Server: Re-autenticación de Sesión de Google: El diálogo de desbloqueo ahora activa la re-autenticación al expirar la sesión de Google en lugar de mostrar un error sin salida.
- Safari: Firma de la Extensión: Se corrigió que la extensión de Safari apareciera como no firmada mediante el uso de permisos de lanzamiento sin
get-task-allowpara versiones firmadas con Developer ID. - Common: Desajuste de Cuentas OAuth: Se corrigió que OAuth creara conexiones desajustadas al crear correctamente nuevas conexiones en lugar de sobrescribir las existentes con cuentas diferentes.
- Common: Inflación de Alcance de OAuth: Se corrigió que las conexiones desajustadas heredaran los alcances de la cuenta original, causando una concesión excesiva de alcances no intencionada.
- Common: Borrado de Lista de Hilos: Se corrigió que el tiempo de espera/reintento de STATE_UPDATE usara un nombre de campo incorrecto, lo que podía borrar la lista de hilos.
- Common: Precisión de Insignias de Nivel: Se corrigió que las insignias de nivel mostraran incorrectamente "Tester" en funciones de nivel gratuito.
- Common: Desbordamiento del Panel de Ajustes: Se corrigió el desbordamiento de flex en las filas de tarjetas del panel de ajustes que causaba problemas de diseño.
- Server: Pérdida de Claves API en Sincronización Privada: Se corrigió la pérdida de claves API en la sincronización privada al sincronizar entre dispositivos.
- Server: Puente de Mensajería: Se corrigieron los chats archivados, el botón de parada y la selección de modo en el puente de mensajería.
- macOS: Ajustes de Modo Personalizado Perdidos: Se corrigió la pérdida silenciosa de ajustes de modo personalizado en macOS/iOS debido a una ruta de guardado sin operación.
- macOS: Cabeceras de OpenRouter Bloqueadas: Se corrigió el bloqueo de CORS de relevo en las cabeceras de atribución de OpenRouter en macOS/iOS.
- macOS: Cambio de Contexto de Pestañas: Se corrigió que el contexto de las pestañas no se actualizara al cambiar entre pestañas del navegador.
Versión 0.9.713 (28 de marzo de 2026)
Nuevas Funciones
- Common: Sub-Agents: Sistema completo de sub-agentes con agentes nombrados persistentes, historial de conversación, ejecución paralela (patrón de comité), modos secuencial y de interjección, cascada de aborto y renderizado de UI dedicado con seguimiento de estado cronológico.
- Common: MCP Tool Approval: Las herramientas MCP registradas ahora aparecen en el sistema de aprobación de herramientas, brindando a los usuarios visibilidad y control sobre qué herramientas MCP pueden invocar los agentes.
- macOS: Sidepanel Push Mode: El panel lateral ahora admite el modo push junto con el de superposición, con un ancho predeterminado de 425px y persistencia del ancho acoplado entre sesiones.
- Server: WhatsApp Rich Messages: La conexión de WhatsApp ahora admite el uso compartido de ubicación, contactos, reacciones y mensajes de stickers, además de texto y multimedia.
- Server: API Key Encryption at Rest: Las API keys almacenadas en el almacenamiento D1 del relay ahora están cifradas en reposo. Las claves OAuth del lado del servidor se eliminan después de guardarse localmente.
Mejoras
- Common: Model Alias Display: Los argumentos de llamada a herramientas de sub-agentes ahora muestran alias de modelos anotados para una identificación más sencilla.
- Common: BYOA Connection Priority: Las solicitudes OAuth de alcance ampliado ahora prefieren conexiones alternativas BYOA sobre las conexiones Basic, reduciendo las solicitudes de re-autenticación innecesarias.
- Common: Thought Signature Preservation: Las firmas de pensamiento/razonamiento ahora se preservan correctamente tanto para la OpenAI Responses API como para los flujos de llamada a herramientas de múltiples turnos de Gemini.
- macOS: Debug Log Propagation: El interruptor de registro de depuración ahora se propaga al subproceso del servidor Node.js.
- Common: Bengali Language Support: La plataforma y el sitio web ahora son compatibles con el bengalí, además de actualizaciones en el descargo de responsabilidad de marca registrada y publicaciones de medios en el sitio web.
Corrección de Errores
- Common: Safari/WKWebView Streaming: Se aplicó un polyfill a la iteración asíncrona de ReadableStream para kokoro-js, corrigiendo fallos de streaming de TTS en Safari y WKWebView.
- Common: Custom Mode Creation: Se corrigió un cierre de React (closure) desactualizado que causaba que la creación de modos personalizados fallara en el primer intento.
- macOS: Agent Storage Mutations Lost: Las mutaciones de almacenamiento del subproceso del agente (creación de modos, ajustes, habilidades) se perdían silenciosamente en macOS debido a la falta de un puente de persistencia.
- macOS: Clipboard Copy: Se corrigió el fallo silencioso de la copia al portapapeles en macOS WKWebView.
- macOS: WASM/WebGPU en WKWebView: Se forzó el backend WASM para TTS/STT y rutas locales ONNX en la aplicación nativa de macOS — las importaciones de origen cruzado de CDN y las importaciones de módulos JSEP de WebGPU fallan en el WKWebView de localhost.
- macOS: Transport Request Collisions: Se corrigió la colisión de requestId que interrumpía la aprobación de herramientas en macOS, además de mejorar los nombres de visualización de MCP.
- macOS: WhatsApp Auto-Reply: Se corrigió el cableado de extremo a extremo para la respuesta automática de WhatsApp en el servidor relay de macOS, incluyendo la visibilidad de los hilos.
- iOS: Voice Dictation Stuck: Se corrigió el dictado de voz bloqueado en estado de grabación cuando se omitía la limpieza de stopRecording.
- Safari: Browser Commands Timeout: Se corrigió el tiempo de espera agotado en los comandos del navegador Safari debido a APIs de WebExtension colgadas tras la suspensión del service worker.
- Safari: Heartbeat Stale Check: Se omite la comprobación de heartbeat desactualizado para los navegadores Safari con sondeo HTTP para evitar desconexiones falsas.
- Server: Private Relay Stability: Se corrigió la hibernación de Durable Object, el tiempo de espera de inactividad (1006), los retrasos de reconexión, el manejo de sockets obsoletos y los problemas de readyState zombi. Se eliminó la inconsistencia (split-brain) entre serverState y ctx.state.
- Server: Webhook Broadcast: Los webhooks ahora se transmiten a todos los sockets del servidor después del despertar de la hibernación del DO, solucionando el problema del readyState zombi.
- Server: MV3 Messaging Race: Se corrigió una condición de carrera en el puente de mensajería de inicialización diferida (lazy-init) al llegar un webhook, evitando bloqueos del service worker MV3.
- Server: Webhook Verify CORS: Se enrutó la prueba de verificación de webhook a través del servidor para evitar el rechazo de CORS en el navegador.
- Extension: Logout Cleanup: El cierre de sesión ahora borra correctamente la sesión del servidor relay local en macOS, detectando el contexto de localhost.
- Common: Security — Thread Isolation: Las transmisiones de estado ahora filtran los hilos por el perfil actual, evitando la filtración de datos entre perfiles.
Versión 0.9.712 (26 de marzo de 2026)
Nuevas Funcionalidades
- Common: Diagnóstico de Conexión de WhatsApp: La función Test Connection para WhatsApp ahora verifica el estado de la suscripción al webhook y la validez del app secret además del token de la API, detectando fallos de entrega silenciosos por parte de Meta.
- macOS: Flujo de OAuth Nativo: La aplicación para macOS ahora utiliza ASWebAuthenticationSession para OAuth en lugar de redirecciones del navegador, con actualización automática de conexiones obsoletas que carecen de tokens de actualización.
Mejoras
- Common: Robustez de Búsqueda/Reemplazo en DOCX: La búsqueda y reemplazo en documentos DOCX ahora gestiona espacios dobles, espacios de no separación, comillas inteligentes, entidades numéricas y discrepancias de mayúsculas. Incluye una alternativa insensible a mayúsculas cuando falla la coincidencia exacta y advertencias cuando se reemplazan múltiples instancias.
- Common: Numeración de Listas en DOCX: La exportación a DOCX ahora genera una numeración de listas de Word adecuada (w:numPr) en lugar de caracteres de viñeta literales, para que Word reconozca correctamente las listas numeradas y con viñetas.
- Common: Rendimiento de Inicio del Agente: Se eliminaron los retrasos de inicio del agente de 30-50s causados por servidores MCP fantasma, tiempos de espera de disponibilidad HTTP y obtención redundante de modelos. El caché del modelo ahora se pasa a los subprocesos del agente.
- Server: Refuerzo de Seguridad: Corrección de inyección de comandos en el manejador de URL, comparación de tokens segura contra ataques de tiempo, cabecera Content-Security-Policy en el servidor de relay, limitación de tasa (rate limiting) en el endpoint de sesión, CORS restringido a orígenes conocidos y cifrado de transmisión E2E en paralelo.
- Server: Verificación de Firma de Webhook: Las cargas útiles de los webhooks ahora utilizan el cuerpo sin procesar codificado en base64 para evitar la corrupción por el procesamiento de JSON que invalidaba las firmas HMAC.
- Server: Persistencia de Tokens OAuth: Se corrigió la inconsistencia entre objetos de estado del servidor que causaba que las conexiones OAuth (Google Drive, etc.) se perdieran tras reiniciar la aplicación.
- macOS: Rendimiento y Estabilidad: Sondeo de la bandeja del sistema basado en menús (antes era un temporizador incondicional de 3s), guardado del estado de la ventana con debounce, registro de logs no bloqueante, recuperación de bloqueos de WKWebView con retroceso exponencial y corrección de fugas de memoria en los manejadores de mensajes de scripts.
- macOS: Registro de Logs Centralizado: La salida del servidor de relay y los eventos del ciclo de vida de la aplicación ahora se registran en
~/Library/Logs/caiioo/con rotación automática de 10MB, reemplazando la salida descartada silenciosamente.
Corrección de Errores
- Common: Instrucciones del Selector de Archivos: La herramienta
pick_filesahora devuelve instrucciones claras para el usuario en lugar de una señal de acción de UI muerta que fallaba silenciosamente. - Server: Spam de Sondeo de Pestaña Activa: El sondeo de pestaña activa en modo relay ya no genera errores de tiempo de espera interminables cuando no hay ninguna extensión de navegador conectada. Utiliza un retroceso exponencial (de 30s a 5min) en fallos consecutivos.
- Server: CORS para Aplicación Nativa: Se corrigió el bloqueo del origen 127.0.0.1 por la lista blanca de CORS, que interrumpía el OAuth de Google desde el WKWebView de la aplicación nativa de macOS.
- Server: Procesos de Agente Huérfanos: Los subprocesos del agente ahora se limpian correctamente al apagar el servidor y ante excepciones no capturadas.
- macOS: Spam de Logs del Orquestador del Navegador: Se corrigieron las advertencias de "Unhandled message type" para los mensajes del protocolo del navegador en las conexiones de la extensión.
Versión 0.9.711 (24 de marzo de 2026)
Nuevas Funcionalidades
- Common: Guardado Automático de Ajustes: Los campos de configuración ahora se mantienen mientras editas con un debounce de 500ms para campos de texto y guardado inmediato para selectores y botones de alternancia, evitando la pérdida de datos en caso de error o navegación.
Mejoras
- Common: Preservación de Numeración DOCX: Los caracteres de tabulación en secciones numeradas de DOCX (por ejemplo, documentos legales con "3.2.3 → Encabezado") ahora se preservan durante todo el ciclo de edición en lugar de eliminarse silenciosamente.
- Common: Selección Inteligente de Herramientas: El selector dinámico de herramientas ahora gestiona consultas fácticas (horarios comerciales, precios, direcciones) que requieren verificación web, en lugar de limitarse a coincidir con palabras clave estrictas.
- Common: Cambios de Idioma del Agente: Los cambios de idioma iniciados por el agente ahora se aplican de inmediato en lugar de requerir un cambio manual en los ajustes.
- Common: Respaldo de OAuth para Cuentas Múltiples: Cuando la cuenta de Google primaria carece de los alcances necesarios, se verifican las cuentas secundarias conectadas antes de solicitar una nueva autenticación. Corrige errores no detectados cuando los tokens de cuentas secundarias caducan.
- Server: Validación de Ajustes de Modo: El Server ahora valida los permisos de nivel al guardar la configuración, evitando que los usuarios de nivel gratuito conserven ajustes del nivel pro.
- Common: Refuerzo de Seguridad: Sanitización con DOMPurify en la salida de la vista previa de razonamiento, CORS restringido a orígenes conocidos, búsqueda de geolocalización por IP priorizando HTTPS y restricción de web_accessible_resources.
Corrección de Errores
- Common: URLs de Resultados de Búsqueda de Google: La búsqueda de Google en el navegador ahora devuelve enlaces estructurados con URLs reales. Anteriormente, el agente necesitaba 5 llamadas a herramientas para extraer URLs porque AgentMarkdown perdía los href de los enlaces debido al complejo HTML anidado de Google; ahora los enlaces se extraen directamente del DOM y se incluyen en el primer resultado de búsqueda.
- Common: Bucle Infinito de Private Sync: Se corrigió el bucle de sincronización causado por la escritura de archivos de respaldo del manifiesto que activaba continuamente la resincronización. Los objetos de configuración vacíos ahora se propagan correctamente entre dispositivos.
- Common: Actualizaciones del Puente de Mensajería: Los mensajes entrantes, las respuestas del agente y las respuestas de retransmisión ahora se emiten a la UI de inmediato en lugar de aparecer solo después de que el agente termina de responder.
- Extension: Reconexión de Private Relay: Se corrigió el problema por el cual el relay permanecía desconectado tras el reinicio del service worker de MV3, recurriendo al estado habilitado almacenado. También se corrigió la condición de carrera de autoreemplazo durante enable() y la reconexión por cambio de identidad.
- Extension: Condiciones de Carrera en Private Relay: Se reforzaron las carreras de activación/desactivación, se añadieron protecciones contra rechazos no controlados en los callbacks del puente de mensajería y se corrigió la fuga del temporizador al desmontar el panel de ajustes.
Versión 0.9.710 (22 de marzo de 2026)
Nuevas Funcionalidades
- Common: Aplicación de Zero-Day Risk (ZDR): Sincronización de datos ZDR en vivo con un interruptor de aplicación para OpenRouter — visualice el desglose del recuento de proveedores y bloquee modelos marcados con riesgos de día cero.
- Common: Reparación de Llamadas a Herramientas: Los modelos débiles que emiten llamadas a herramientas en XML dentro de bloques de razonamiento ahora se detectan y reparan automáticamente, mejorando la fiabilidad en modelos que no son de frontera.
- Common: Ciclo de Vida de Token Unificado: Refresco simétrico de tokens OAuth en todas las plataformas (extensión, servidor, macOS, iOS) a través de un TokenLifecycleManager unificado, con refresco proactivo antes de la expiración.
- iOS: Escalado de Iconos del Composer: Los iconos de acción del Composer ahora se escalan 1.18x en iOS para mejores objetivos de pulsación, con una clase de cuerpo
native-iosdedicada para estilos específicos de la plataforma.
Mejoras
- Common: Cambios Propuestos en Slate: La navegación entre cambios propuestos, la aceptación/rechazo basada en desplazamiento (hover) y las actualizaciones de contadores ahora funcionan correctamente en el editor Slate.
- Common: Menú Desplegable del Selector de Slate: El selector de tipo de slate ahora utiliza un menú desplegable en línea en lugar de un popover portado, corrigiendo problemas de z-index y posicionamiento.
- Common: Reemplazo Completo en Propose Change:
propose_changeahora permite el reemplazo completo del documento para documentos pequeños (500 caracteres o menos) en lugar de requerir ediciones parciales. - Common: El Envío de Voz Espera a la Transcripción: Al presionar Enviar/Enter mientras se graba, ahora se espera a que la transcripción se complete antes de enviar, evitando mensajes vacíos o parciales.
- Common: Flujo de Configuración de Private Sync: El diálogo de frase de contraseña ahora se muestra automáticamente después de OAuth durante la configuración de Private Sync, agilizando el flujo de incorporación.
- Common: Refresco del Registro BYOA: El registro de proveedores BYOA ahora se reinicializa después de que Private Sync descarga nuevas credenciales, asegurando que las conexiones importadas sean utilizables de inmediato.
- Common: Consistencia en la Terminología: "Cloud Sync" ha sido renombrado a "Private Sync" en el contenido de la guía del usuario con una prueba de protección de terminología para evitar regresiones.
- Server: Estabilidad de Private Relay: Fecha de compatibilidad actualizada, mejora en el manejo de bloqueos de Durable Object y refuerzo de la lógica de reconexión de MV3 para conexiones de larga duración fiables.
- Server: Exclusión de Ajustes de Private Sync: Los ajustes de Private Relay ya no se incluyen en las cargas útiles de cloud sync, evitando conflictos de configuración de relay entre dispositivos.
Corrección de Errores
- Common: Manejo de Imágenes SVG: Los archivos SVG ya no se envían como
image_urla los proveedores, lo que causaba errores HTTP 400 en modelos que no admiten el formato SVG. - Common: Condiciones de Carrera en Private Sync: Se corrigieron los fallos en el relay de mensajería causados por condiciones de carrera durante la inicialización de Private Sync. Se ha reforzado el bucle de sincronización y la lógica de cuarentena.
- Common: Eliminación de Datos de Private Sync: La eliminación de datos en la nube y la auditoría ahora funcionan correctamente tras desactivar Private Sync.
- Common: Contaminación en el Emparejamiento de Modelos: Se corrigió el emparejamiento de modelos entre familias en el sistema de autoajuste que podía mapear incorrectamente modelos entre diferentes familias de proveedores.
- Common: Selector Dinámico de Herramientas: Se ha reforzado el prompt del selector dinámico de herramientas para evitar razonamientos de tipo agente que podrían causar fallos en la selección de herramientas.
- Common: Mensajes de Error de Validación: La validación de campos obligatorios ahora devuelve mensajes de error enfocados en lugar de fallos genéricos.
- Extension: Caídas de WebSocket en Private Relay: Se corrigieron las caídas de las conexiones WebSocket después de ~60 segundos debido a la suspensión del service worker de MV3. Se ha mejorado la lógica de keepalive y reconexión.
- Extension: Alcances Incrementales de Google OAuth: Se corrigió la expansión del alcance de OAuth utilizando
launchWebAuthFlowen el contexto de la extensión en lugar de fallar silenciosamente. - Extension: Recarga de Ajustes al Conmutar Relay: Se suprimió la recarga innecesaria de ajustes al activar/desactivar el relay, evitando el parpadeo de la interfaz de usuario y el ruido de diagnóstico.
- Server: Hibernación de Durable Object: Se corrigió el manejo del cierre de WebSocket tras la hibernación de Durable Object que podía dejar las conexiones en un estado obsoleto.
- Server: Persistencia de Credenciales de Mensajería: Las credenciales de mensajería ahora se persisten inmediatamente al cambiar, en lugar de esperar al siguiente ciclo de guardado.
- iOS: Callbacks de WebSocket Obsoletos: Los manejadores de WebSocket ahora se limpian al cerrar, evitando que se activen callbacks obsoletos tras la reconexión en iOS.
- Desktop: Carga del Instalador NSIS: El instalador NSIS para Windows ahora se carga correctamente a través de la API para las versiones preliminares (draft releases).
Versión 0.9.709 (21 de marzo de 2026)
Nuevas Funcionalidades
- Common: Adaptador de Mensajería de Slack: Nuevo adaptador de Slack Events API para el puente de mensajería con verificación de firma de bot, soporte para descarga de archivos multimedia y configuración de interfaz de usuario en ajustes.
- Common: Ciclo de Archivos en Slate: Abra y guarde archivos locales directamente en Slate con persistencia de identificadores del sistema de archivos y seguimiento de cambios basado en hash. El nuevo botón "Cargar archivo" en el diálogo del selector de Slate preprocesa los documentos y los abre con el editor correcto.
- Common: Reestructuración del Menú de Archivos de Slate: Menú de tipos de archivos reorganizado en categorías de Documentos, Renderizables (HTML/Vega/Mermaid) y Código y Datos con autodetección al renombrar.
- Common: Aplicación de Navegador Remoto: Los clientes de navegador remoto ahora pueden obtener recursos del panel lateral a través del relay privado, permitiendo el acceso basado en navegador sin tener la extensión instalada.
- Common: Identidad de Dispositivo en Relay Privado: Los clientes de relay ahora muestran un nombre de dispositivo legible por humanos. Cuando es desplazado por otro dispositivo, la interfaz de usuario muestra qué dispositivo lo reemplazó.
- Common: Rediseño del Chip de Micrófono del Composer: Botón de micrófono rediseñado como un chip/píldora visible con un indicador claro del estado de grabación, objetivos táctiles mínimos de 44px para móviles y superposición de voz renderizada sobre el área de entrada.
- Common: Enlace a la Guía del Usuario: La guía del usuario ahora está enlazada desde la sección de configuración de Documentación y Legal.
- iOS: Control de Configuración BYOA: El asistente BYOA en dispositivos móviles ahora muestra un mensaje indicando a los usuarios que configuren Private Apps en el escritorio, ya que el flujo de navegador de 8 pasos es inviable en móviles.
- Server: Desafío de Inicio de Sesión: Verificación MFA de 6 dígitos basada en correo electrónico para el inicio de sesión, con seguimiento de consentimiento y revocación de sesión.
Mejoras
- Common: Sincronización Privada Prioritaria de Ajustes: Los ajustes ahora se sincronizan antes que las conversaciones, asegurando que los tokens y la configuración estén disponibles de inmediato mientras la sincronización masiva de hilos continúa en segundo plano.
- Common: Correlación de Solicitudes WebSocket: Los transportes de WebSocket y relay privado ahora esperan correctamente las respuestas del servidor en lugar de resolverse inmediatamente, solucionando más de 40 operaciones de interfaz de usuario en el panel lateral de macOS y clientes de relay (auditoría de Drive, prueba de Ollama, operaciones MCP, etc.).
- Server: Verificación de Firma de Webhook: La verificación de firma de webhook se ha movido al secreto de la aplicación a nivel de ruta para una arquitectura más limpia.
Corrección de Errores
- Common: Entrega de Respuestas de WhatsApp: Se corrigió el error por el cual las respuestas del agente se perdían silenciosamente en lugar de enviarse de vuelta a WhatsApp. La ruta de retorno del relay de mensajería ahora registra detalles de diagnóstico cuando falla la entrega, haciendo que los problemas futuros sean diagnosticables de inmediato.
- Common: Firmas de Bloques de Pensamiento entre Modelos: Se corrigieron los errores de "Firma inválida en bloque de pensamiento" al cambiar de un modelo que no es Claude a Claude con modo de pensamiento. La detección del formato de razonamiento ahora es 'unknown' por defecto en lugar de identificarse erróneamente como formato de Anthropic.
- Common: Editabilidad de Slate para Nuevos Documentos: Los nuevos slates DOCX, PDF, RTF y XLSX ahora se abrén correctamente en sus editores en lugar de renderizarse como HTML estático.
- Common: Alternativa de Exportación de Slate: Los nuevos documentos sin datos binarios originales ahora se exportan correctamente: XLSX recurre a CSV, RTF a conversión HTML, PDF a impresión del navegador.
- Common: Renderizado de Vista Previa en Sandbox: Se corrigieron las vistas previas en blanco de HTML y Vega causadas por una discrepancia de origen del sandbox en el direccionamiento de postMessage.
- Common: Desplazamientos de Columna en Control de Cambios: Las eliminaciones en el control de cambios ahora mapean correctamente los desplazamientos de HTML a texto, corrigiendo cambios mal posicionados en TipTap.
- Common: Recuperación de Autenticación en Sincronización Privada: Los tokens OAuth expirados o revocados durante la sincronización ahora activan automáticamente la reautorización en lugar de requerir una reconexión manual.
- Common: Indicador de Borrador en Streaming de Voz: La superposición de la transcripción de voz ahora muestra el estado "Vista previa" con opacidad reducida para señalar que el texto es provisional hasta que se detenga la grabación.
- Common: Herramientas MCP en Plataformas Nativas: Las herramientas del servidor MCP local ahora se registran correctamente en macOS, Windows y Linux; anteriormente, el controlador iniciaba el proceso MCP pero nunca obtenía ni registraba sus herramientas.
- Common: Actualización del Chip de Contexto de Slate: El chip de contexto de la pestaña activa ahora se actualiza desde el almacenamiento cuando el título de una pestaña de slate cambia después de cargar desde Drive o GitHub. El texto de entrada del título en modo oscuro ya no es ilegible.
- Extension: Polyfill de Stub de Chrome: Las pestañas del navegador Chrome en localhost con
window.chromepero sin las API de extensión ahora reciben la inyección de stub adecuada en lugar de ser omitidas. - Extension: Error de Cierre del Paquete del Cliente Relay: Se corrigió el error de
import.meta.enven el paquete IIFE del cliente relay definiendo variables de entorno en tiempo de compilación. - Extension: Inicio de Sesión en Aplicación Remota: Se ha depurado el inicio de sesión de la aplicación de navegador remoto con Google OAuth como método principal y correo electrónico/contraseña como una opción secundaria colapsada.
Versión 0.9.708 (19 de marzo de 2026)
Mejoras
- Common: Coordinación del Indicador de Generación: Los puntos de escritura por mensaje ahora se coordinan con el indicador de respaldo a nivel de hilo, eliminando la duplicidad de puntos intermitentes durante la generación. Los puntos ahora persisten durante las fases de razonamiento y ejecución de herramientas, ocultándose solo una vez que la respuesta final comienza a transmitirse.
- Common: Cursor de Streaming: Ahora aparece un cursor parpadeante al final del texto en streaming, proporcionando un indicador visual claro de que la respuesta aún se está generando.
- Common: Formato de Vista Previa de Razonamiento: Los bloques de razonamiento colapsados ahora renderizan el formato de negrita e cursiva en línea en lugar de la sintaxis markdown sin procesar.
- Common: Listado de Documentos Slate:
list_slatesahora muestra correctamente el tamaño del contenido para archivos DOCX, PDF y XLSX que fueron cargados mediante consultas de hilos ligeros. Los listados también incluyen guías de flujo de trabajo para editar documentos DOCX y XLSX. - Common: Sección de Ajustes de Private Sync: Los ajustes de Private Sync se encuentran ahora en su propia sección dedicada para una organización más clara, separados de los ajustes generales.
- Extension: Reestructuración de Ajustes de Conexiones: La sección de Private Relay se ha reorganizado en dos subsecciones claras: Private Relay (interruptor de acceso remoto, siempre visible) y Caiioo Bridge (servidores MCP locales y herramientas del sistema). El interruptor de acceso remoto ya no requiere que el Bridge esté en ejecución.
- Desktop: Binario Unificado de Tauri: La aplicación de escritorio para Windows/Linux se ha consolidado de variantes de tiempo de compilación a un único binario con restricción de nivel en tiempo de ejecución; la visibilidad del panel lateral se determina por el nivel de suscripción en tiempo de ejecución.
Corrección de Errores
- Extension: Private Relay sin Bridge: Private Relay ahora se conecta de forma independiente sin la aplicación Caiioo Bridge. Anteriormente, la autenticación solo se inicializaba mediante la conexión del Bridge, lo que dejaba a los usuarios que solo usaban la extensión (incluyendo Linux/Windows) sin poder recibir webhooks de mensajería o usar el acceso remoto.
- Extension: Enrutamiento de Google OAuth: Se corrigieron los fallos de las ventanas emergentes de OAuth en Chrome al omitir
getAuthTokencuando no está disponible y recurrir a las credenciales BYOA. La resiliencia de las ventanas emergentes COOP evita ventanas en blanco en sitios restrictivos. - Common: ElevenLabs Streaming STT: Se corrigió la caída o fallo de la transcripción de voz cuando el streaming de ElevenLabs encuentra interrupciones de conexión. La entrada de voz de la aplicación nativa ahora cuenta con un sistema de respaldo fluido.
- iOS: Enlaces Externos en WKWebView: Los enlaces que deberían abrirse en Safari ahora se abren correctamente de forma externa en lugar de cargarse dentro de la WebView de la aplicación.
- Common: Reglas Huérfanas de Ad-Blocker: Se corrigieron las reglas dinámicas de bloqueo de anuncios DNR que persistían tras el reinicio del service worker.
disableAllBlockingahora consulta y elimina directamente las reglas huérfanas incluso cuando la instancia del bloqueador es nula. - Common: Sincronización de Licencia al Cambiar de Perfil: Al cambiar de perfil, ahora se sincroniza la licencia desde el servidor, asegurando que las herramientas restringidas por nivel se actualicen inmediatamente en lugar de requerir un reinicio.
- Common: Actualización de Token antes del Aprovisionamiento: Los tokens OAuth expirados ahora se actualizan antes del aprovisionamiento de las API keys, evitando fallos silenciosos. Los servidores nuevos ahora pueden adoptar conexiones de identidad existentes.
- Web: Menú Móvil en iOS Safari: El menú de hamburguesa en el sitio web de marketing ya no es transparente en iOS Safari.
- Common: Carrera de Loteo en React-18: Se añadió el indicador de generación a nivel de hilo como respaldo para casos en los que el procesamiento por lotes del estado de React-18 impedía que aparecieran los puntos de escritura por mensaje.
Versión 0.9.707 (17 de marzo de 2026)
Mejoras
Precompletado de reconfiguración BYOA: Al reconfigurar una aplicación privada de Google o Microsoft existente, ahora se precompletan el secreto del cliente y el ID del inquilino, para que no tenga que volver a introducirlos.
Ordenación de la lista de modelos: Los modelos dentro de cada grupo de proveedores ahora se ordenan por fecha de lanzamiento (los más recientes primero), garantizando un orden coherente en todas las plataformas.
Corrección de errores
Recuperación de autenticación de sincronización privada: Los fallos de los tokens OAuth (sesiones caducadas, tokens revocados, tokens de perfil de Chrome) durante la inicialización de la sincronización privada ahora se muestran correctamente en la interfaz de usuario en lugar de entrar silenciosamente en un estado de error.
Fiabilidad de cambios controlados en Slate: 10 correcciones críticas para los cambios controlados: condición de carrera en la fusión de revisiones, persistencia de la base de diferencias en todas las rutas de actualización, preservación del formato en la exportación a DOCX, eliminación de etiquetas HTML para la coincidencia con TipTap, orden de aceptar/rechazar todo, y correcciones de convergencia para el escape de entidades y la coincidencia de etiquetas mediante regex.
Integridad de datos en Slate: Se corrigió el problema de las imágenes pegadas que se escribían en una caché local inactiva, la metainformación de fuentes en la nube que no persistía y el respaldo de BroadcastChannel para actualizaciones de IA en vivo en modo relay/móvil.
Seguridad en Slate: Se corrigió la inyección XSS en el visor de imágenes y se reemplazaron los orígenes postMessage de comodín con URLs de extensión con ámbito definido.
Versión 0.9.706 (16 de marzo de 2026)
Nuevas funciones
- Banners de error del proveedor: Cuando un proveedor de IA devuelve un error (402 pago requerido, falta la clave API, límite de velocidad), ahora aparece un banner interactivo con instrucciones claras en lugar de un mensaje de error genérico.
Mejoras
Edición de DOCX entre tramos: La herramienta
propose_changeahora gestiona correctamente las operaciones de buscar/reemplazar que abarcan múltiples formatos (por ejemplo, texto parcialmente en negrita). La intención se transmite para que el agente pueda realizar ediciones contextuales.Rendimiento de guardado de PDF: El guardado nativo de PDF es significativamente más rápido: se eliminó el análisis redundante, se almacenaron en caché los módulos de importación y se omitió la limpieza innecesaria de operadores.
Nombre del modo en mensajería: El selector de modo en los ajustes de mensajería ahora muestra el nombre comercial del modo en lugar del ID interno.
Corrección de errores
Actualización de tokens de Google OAuth: Se corrigieron los errores de "No autorizado" al actualizar los tokens de Google OAuth que podían bloquear el acceso a Calendar, Gmail y Drive.
Mensaje de error de clave aprovisionada: Los usuarios con claves API aprovisionadas ya no verán un mensaje de error engañoso de "Añadir fondos"; el mensaje ahora explica el problema real y los siguientes pasos.
Condición de carrera en hilos concurrentes: Se corrigió un error donde cambiar de hilo durante la generación podía causar que los eventos GENERATION_COMPLETE/ERROR se aplicaran al hilo equivocado.
Botón de restaurar historial de revisiones: El botón de restaurar en el historial de revisiones de Slate ahora aparece correctamente cuando el contenido actual difiere de la revisión seleccionada.
Doble ventana emergente de OAuth: Los nuevos usuarios de la extensión de Chrome ya no verán dos ventanas emergentes de OAuth al iniciar sesión por primera vez.
Versión 0.9.705 (15 de marzo de 2026)
Nuevas funciones
- Agrupación de categorías de ajustes: 19 secciones de ajustes ahora están organizadas en 5 categorías colapsables para una divulgación progresiva. La sección de Modos de Agente muestra un indicador transversal con enlaces de navegación a las secciones afectadas (Configuración de herramientas, Configuración de modelos, Apariencia). La sección de Proveedor de API se abre por defecto con una advertencia de capacidad del modelo.
Corrección de errores
- Duplicación de calendarios en sincronización de agenda: Las cuentas de Google Calendar ya no aparecen dos veces en la pestaña de Sincronización cuando existen tanto una conexión de inicio de sesión (identidad) como una Conexión Privada para el mismo correo electrónico. Las conexiones ahora se deduplican antes de renderizarse.
- Categorías de ajustes i18n: Las etiquetas de las categorías de ajustes ahora están traducidas en todos los idiomas admitidos.
Versión 0.9.704 (14 de marzo de 2026)
Nuevas Funcionalidades
- Base de Integración con Microsoft 365: Enrutamiento de scopes de Microsoft, cliente de Graph API y servicio de cuentas con soporte para BYOA. Definiciones de jerarquía de scopes y extensiones de registro de tool-scope para el proveedor Microsoft. Se ha añadido Microsoft como proveedor con relay-proxied.
- Rich Inline Rendering (RIR): Nueva arquitectura de códecs para renderizar contenido enriquecido directamente en los mensajes del chat. Incluye códecs para HTML, Markdown y DOCX con una interfaz de códec extensible.
- Árbol de Estructura PDF y Análisis de Diseño: Analizador de árbol de estructura para PDF etiquetados para la comprensión semántica de documentos. La agrupación heurística de párrafos para PDF no etiquetados proporciona un análisis de diseño de respaldo. Detección de desbordamiento de contenido e inserción/reemplazo de imágenes.
- Selección de Modo de Mensajería: Los ajustes del puente de mensajería ahora incluyen un selector de modo predeterminado, permitiendo que el agente responda con la personalidad adecuada al gestionar mensajes entrantes.
Mejoras
- Reintento por Límite de Tasa del Proveedor: Todos los proveedores de LLM ahora reintentan automáticamente ante respuestas 429 (límite de tasa) y 529 (sobrecarga) con un retroceso exponencial, en lugar de fallar inmediatamente. Hasta 3 reintentos con jitter.
- Coincidencia de Superconjunto de Scopes de Google OAuth: Los scopes de escritura ahora satisfacen los requisitos de los scopes de lectura (por ejemplo,
drivecubredrive.readonly). Evita re-autorizaciones innecesarias cuando ya se ha concedido un scope más amplio. - Autenticación Inicial de Scope Completo en BYOA: Cuando se requiere una Conexión Privada, el flujo de autenticación inicial ahora solicita todos los scopes necesarios por adelantado en lugar de preguntar dos veces (una para lo básico y otra para lo ampliado).
- Promoción de Error 404 de Google a Acceso Ampliado: Cuando una conexión BYOA recibe un error 404 en un archivo de Google Workspace, el error se promociona a un aviso de acceso ampliado en lugar de un mensaje de error sin salida.
- Sincronización Privada de Credenciales de Mensajería: Las credenciales del puente de mensajería ahora se sincronizan entre dispositivos a través de una sincronización privada con cifrado E2E en lugar de ser específicas del dispositivo. El manifiesto de sincronización se ha actualizado a la v10.
- Tiempo de Espera Extendido para OAuth: Los flujos de OAuth para BYOA y acceso ampliado ahora tienen un tiempo de espera de 5 minutos (frente a los 2 minutos anteriores), otorgando a los usuarios tiempo suficiente para completar los pasos en la Google Cloud Console.
- Firma del Sparkle Framework: Las compilaciones de distribución para macOS ahora firman correctamente los binarios anidados del framework Sparkle en orden de adentro hacia afuera, solucionando fallos de notarización.
- Empaquetado de Binarios de Node en Tauri: Las configuraciones de Tauri ahora empaquetan el binario de Node.js como un recurso para la ejecución de sidecars en Windows/Linux.
- Búsqueda en Ajustes de Mensajería: La sección del puente de mensajería ahora se puede encontrar a través de la barra de búsqueda de ajustes con palabras clave como "whatsapp", "telegram", "webhook".
- Reenvío de Ajustes al Relay: Los cambios guardados en los ajustes ahora se reenvían al servidor relay a través del puente WebSocket, asegurando que las credenciales de mensajería y otros cambios de configuración lleguen al archivo de estado del servidor.
Corrección de Errores
- Slate Currency vs Math: Las cantidades en dólares como
$9/moen tablas de markdown ya no se malinterpretan como delimitadores de matemáticas inline de LaTeX. La regex de matemáticas ahora respeta los símbolos de moneda escapados. - ToastProvider en Página de Conversación: Las pestañas de conversación emergentes carecían de
ToastProvider, lo que causaba que las funciones dependientes de notificaciones toast fallaran silenciosamente. El árbol de proveedores ahora coincide con el del panel lateral.
Versión 0.9.703 (14 de marzo de 2026)
Nuevas Funcionalidades
- Integración de Google Picker: Selector de archivos de Google Drive completo con un híbrido de ventana emergente/iframe, filtros de vista múltiple (Docs, Sheets, Slides, PDFs) y etiquetas de referencia de Drive en el compositor. Los archivos seleccionados a través de Google Picker reciben automáticamente acceso
drive.file. - Sincronización Nativa de Google Sheets: Abra Google Sheets en Slate con edición completa de ida y vuelta a nivel de celda. El códec de Sheets convierte los datos de la cuadrícula de la hoja de cálculo a tablas HTML de TipTap y viceversa, con detección de conflictos a través de
modifiedTimede Drive. Soporta lectura, actualizaciones de celdas por lotes y cambios estructurales (añadir/eliminar hojas, combinar celdas). - Vista de Solo Lectura de Google Slides: Las presentaciones de Google Slides se renderizan en Slate con miniaturas de diapositivas y contenido de texto extraído para facilitar la búsqueda.
- Obtención por Lotes de Gmail y Conversión a Markdown: La herramienta de Gmail ahora obtiene metadatos de mensajes por lotes (hasta 100 a la vez) en lugar de uno por uno, con una caché de nombres de etiquetas de 5 minutos y conversión automática del cuerpo de HTML a markdown para un consumo más limpio por parte del LLM.
- Superposición de Selección: El botón "Añadir al prompt" aparece al seleccionar texto en cualquier página web, permitiéndole añadir rápidamente el contenido seleccionado a la conversación.
- Gestor de Superposición Relay: Los comandos de superposición del agente ahora se enrutan a través de la extensión del navegador, permitiendo superposiciones de UI impulsadas por el agente en la página web activa.
- Selector de Modelo para Tareas Rápidas Integrado: La selección de modelo para tareas rápidas ahora está incrustada directamente en el menú desplegable del selector de modelos en lugar de un menú separado.
- Exportación de Slate a DOCX desde Google Drive: Los Google Docs cargados en Slate ahora se exportan como DOCX (vía
readFileContentAsBinary), activando el editor visual completo de TipTap con control de cambios en lugar de abrirse como markdown plano. - Asistente de Configuración de Private Connection: Asistente BYOA mejorado con un paso dedicado de "Añadir Usuario de Prueba" que coincide con el flujo actual de Google Cloud Console. Los subpasos de la pantalla de consentimiento ahora siguen el acordeón real de 4 pasos de Google. Las instrucciones por correo electrónico se personalizan cuando se conoce la identidad del usuario.
- Banner de Promoción de Private Connection: Cuando el agente necesita permisos ampliados de Google (Gmail, Calendar, etc.) y no existe una Private Connection, aparece un banner animado con una ruta de un solo clic hacia el asistente de configuración. El agente permanece en pausa mientras el usuario completa la configuración y se reanuda automáticamente cuando se guarda la conexión.
- Advertencias de Fidelidad de Exportación: Antes de exportar un documento a un formato diferente (por ejemplo, de PDF a DOCX), un diálogo de fidelidad advierte sobre posibles pérdidas de formato con elementos categorizados por gravedad (información, advertencia, crítico).
- Extracción de Anotaciones de PDF: Las anotaciones de texto y marcas en PDF ahora se extraen y preservan durante el procesamiento y reconstrucción del documento.
- Sincronización de Calendario para Recordatorios: El modal de recordatorios ahora soporta la sincronización de calendario con control de acceso ampliado.
Mejoras
- Fidelidad de Sincronización de Google Docs: Mejora en la extracción de tramos de formato con coincidencia de etiquetas adecuada (maneja etiquetas de autocierre y anidamiento incorrecto) y detección de conflictos para ediciones concurrentes.
- Detección de Discrepancia de Cuenta en Sincronización Privada: El menú desplegable de cuenta en los ajustes de sincronización ahora detecta cuando el correo de sincronización configurado no coincide con ninguna cuenta de Google conectada y muestra un indicador de "no conectado" con la opción de cambiar.
- Nivel Efectivo de Teams/Enterprise: La validación de licencias ahora utiliza
effectiveTierde la delegación de equipo/empresa, asegurando el acceso correcto a las funciones cuando el nivel de un usuario se hereda de un plan de equipo. - "Private App" renombrada a "Private Connection": Todas las referencias de cara al usuario ahora utilizan "Private Connection" en lugar de "Private App", lo cual es más claro para los no desarrolladores que no asocian las integraciones OAuth con "apps".
- Alineación de Permisos de Google OAuth (
drive.file): Todos los permisos elevados de Google Drive (drive,drive.readonly,documents.readonly,spreadsheets.readonly,presentations.readonly) ahora se reemplazan con el permiso más restringidodrive.filepara usuarios que no son BYOA, cumpliendo con los requisitos de aplicaciones verificadas de Google. Los usuarios BYOA conservan los permisos completos. - Permisos de Gmail Visibles en el Selector de Alcance: Los permisos de lectura, redacción y modificación de Gmail ahora son visibles para todos los usuarios en el editor de Permisos de Google bajo "Permisos altamente sensibles" en lugar de estar ocultos solo para BYOA. Estos permisos se aprueban en la pantalla de consentimiento y se solicitan vía JIT cuando las herramientas de Gmail los necesitan.
- Recuperación de Consentimiento de Google Picker: Cuando los permisos de Google se revocan externamente (por ejemplo, desde la configuración de la Cuenta de Google), la aplicación ahora detecta automáticamente los permisos caducados, los invalida, vuelve a autorizar y reintenta, en lugar de fallar silenciosamente con errores 403.
- Guía del Agente para Google Drive: Los mensajes de error de herramientas y las sugerencias de resultados vacíos ahora instruyen al agente para que le pida al usuario que haga clic en el botón + en el compositor y seleccione Google Drive, en lugar de sugerir acciones de herramientas no disponibles.
- Selector de Drive en Slate Simplificado: La función "Cargar desde Google Drive" de Slate ahora carga archivos directamente, saltándose la pantalla de elección estilo panel lateral entre "Trabajar en Drive" vs "Añadir a la conversación".
- Logo Oficial de Google Drive: Las etiquetas de Drive y el menú de adjuntos ahora utilizan el logo oficial de Google Drive en lugar del triángulo verde genérico.
- Selector de Modelo Unificado: La selección del modelo auxiliar recae en el modelo predeterminado, con un único menú desplegable de modelos consolidado.
- Transferencia de Elementos No Textuales en DOCX: La reconstrucción de DOCX preserva elementos no textuales (imágenes, gráficos, objetos incrustados) que no forman parte del flujo de edición de texto.
- Edición de Líneas de Múltiples Segmentos en PDF: El editor WYSIWYG de PDF maneja líneas divididas en múltiples segmentos de texto.
- Aumento del Límite de Tasa de Autenticación: El límite de tasa del endpoint de autenticación aumentó de 10/min a 30/min para dar cabida a los intercambios rápidos de tokens OAuth durante la configuración de BYOA.
- Reclasificación del Endpoint de Token OAuth: El intercambio de tokens OAuth se movió del grupo de límite de tasa de autenticación al general, evitando la ralentización durante los flujos de autorización de múltiples permisos.
Corrección de Errores
- Apilamiento de Modales en iOS: Se corrigió el cierre inesperado al presentar selectores de archivos o superposiciones de Slate mientras ya se mostraba otro modal (por ejemplo, la superposición del navegador). Los selectores y superposiciones ahora se presentan en el controlador de vista superior.
- Validación de Rango de Líneas en Slate:
get_slate_contentahora devuelve un error claro cuandostartLineestá más allá de la longitud del documento en lugar de devolver contenido vacío silenciosamente. - Salto de Directorio en el Servidor (Path Traversal): Las claves de almacenamiento ahora se validan contra escapes de directorio, previniendo ataques de salto de directorio en el endpoint de almacenamiento de sincronización.
- Límite de Regex para Bloqueadores de Anuncios: El convertidor DNR ahora limita las reglas regex al límite de 1000 reglas de Chrome y descarta cuantificadores acotados grandes que exceden el límite de memoria de RE2, evitando fallos en la instalación de la extensión.
- Tiempo de Espera de OAuth en Acceso Ampliado: Se corrigió el tiempo de espera de 120 segundos cuando el agente necesita permisos ampliados de Google (Gmail, Calendar). La espera de OAuth pendiente ahora se extiende a 5 minutos para la configuración de BYOA, y completar la conexión en los ajustes reanuda automáticamente al agente pausado.
- Bloqueos de la Interfaz de Chat: Se corrigieron intervalos asíncronos superpuestos y errores de difusión silenciosos que podían congelar la interfaz de chat.
- Lote de Descarga de Sincronización en la Nube: Se corrigieron errores de comprobación de nulos de TypeScript en el manejador de lotes de descarga de sincronización en la nube.
- Importaciones Dinámicas en Service Worker: Se convirtieron las importaciones dinámicas en importaciones estáticas para la compatibilidad con el service worker de Chrome MV3.
- Cumplimiento de Permisos Solo BYOA: Las acciones
convert_to_google_docyconvert_to_google_sheetahora requieren correctamente solodrive.fileen lugar de permisos amplios de escritura de editor. - Formato de Etiqueta de Drive: Formato de tres segmentos para las etiquetas de referencia de Drive con control de permisos adecuado solo para BYOA.
- CORS en Google Picker: El selector ahora se aloja en el relay privado para resolver problemas de origen cruzado con el flujo de alcance de la ventana emergente.
Versión 0.9.701 (6 de marzo de 2025)
Mejoras
- Indicador de Ventana de Contexto de Ollama: El círculo de uso de la ventana de contexto ahora se renderiza para los modelos de Ollama consultando el endpoint
/api/showparanum_ctx, en lugar de depender de la lista de modelos de OpenRouter que no incluye modelos locales. - Llamada a Herramientas de Ollama: Se corrigió la selección dinámica de herramientas para Ollama: pasa
tool_choicea la API (soportado desde Ollama v0.5.1), desactiva el modo de pensamiento cuando las herramientas están activas para evitar JSON corrupto, y recurre a un modelo ayudante ligero sin transmisión cuando el modelo principal no admite llamadas a herramientas. - Caché de Razonamiento de OpenRouter: Se corrigió que el texto de razonamiento se borrara prematuramente por el proveedor de transmisión. El ciclo de vida de la caché ahora es propiedad de
agent-runneren los límites de iteración, de forma consistente con los proveedores de Anthropic y Google. - Fiabilidad WYSIWYG de PDF: La alineación de texto global maneja los operadores de división de PDF.js a través de múltiples TextItems. Edición de bloques desactivada en tramos no coincidentes (texto de anotación/encabezado) para evitar errores de exportación. La decodificación CMap de 2 bytes ya no corrompe los PDF generados por Word con fuentes ASCII de 1 byte. La comprobación de límites de coincidencia de operadores evita índices fuera de rango en elementos de texto vacíos.
- Detección de Plataforma de Escritorio: El selector dinámico de herramientas usa la capacidad
localFolderSyncen lugar decaiiooReminderspara la detección de escritorio, yappleScript/appleNotesen lugar de Calendar/Reminders para la detección de macOS (Calendar/Reminders son multi-Apple vía EventKit).
Version 0.9.700 (March 5, 2025)
New Features
- File Manager: Sistema completo de gestión de archivos con carpetas anidadas, etiquetas de usuario, destacados y una interfaz de usuario dedicada para el File Manager. Organice archivos adjuntos en jerarquías de carpetas, filtre por tipo (capturas de pantalla, imágenes de AI, fotos), busque, ordene y visualice archivos en modo cuadrícula o lista. El etiquetado automático de hilos vincula los archivos con las conversaciones. Soporte de sincronización privada mediante manifest v9.
- Local Folder Sync: Sincronización bidireccional entre carpetas del sistema de archivos local y el File Manager. La resincronización impulsada por mutaciones propaga automáticamente eliminaciones, eliminaciones masivas y movimientos al disco con un debounce de 2 segundos. La detección de movimiento de subcarpetas reubica los archivos en el disco cuando se reorganizan en caiioo. Navegar en cualquier subcarpeta dentro de un árbol de sincronización activa la resincronización automática.
- Cross-Filetype Tracked Changes: Flujo de trabajo unificado de aceptar/rechazar en DOCX, PDF y Markdown. Las ediciones en DOCX ahora se registran como cambios realizados con el mismo motor de diferencias utilizado por Markdown y los slates de código. Los cambios realizados en PDF se integran con el editor visual. La acción
resolve_tracked_changespermite al agente aceptar o rechazar revisiones mediante programación. - PDF WYSIWYG Editing: Edición directa de texto en páginas PDF renderizadas con estilos adaptados al documento. La capa de texto vincula las ediciones con los operadores de flujo de contenido de origen a través de
textItemIndexpara una reconstrucción quirúrgica al exportar. Incluye una línea base de plainText para la detección de cambios. - DOCX Rendering Fidelity: Vista previa enriquecida de DOCX con alineación de párrafos, hipervínculos, color/tamaño de fuente, interlineado, sangría y sombreado de celdas de tabla. La vista de código muestra la conversión a markdown para un consumo de tokens eficiente por parte del LLM.
- Universal Messaging (solo pruebas internas): Envíe y reciba mensajes a través de WhatsApp, Telegram y Slack con privacidad local-first. El agente puede redactar y enviar mensajes, listar conversaciones y responder a hilos, todo enrutado a través de su propio dispositivo.
- Google Meet Integration: Herramienta de recuperación de reuniones multi-acción con
list_meetings(descubrir reuniones recientes con filtrado por rango de fechas) yget_meeting(obtener transcripciones). Implementado a través de todo el pipeline de OAuth/JIT/aprobación de alcance con soporte para el almacén de credenciales. - Gmail Send Email: Envío directo de correos electrónicos a través de la API de Gmail, restringido tras la aprobación de herramientas de alto riesgo. Las anulaciones de nivel de riesgo por acción permiten que
send_emailrequiera confirmación explícita, mientras que las acciones de borrador permanecen en riesgo medio. - Microsoft BYOA: Soporte de Bring Your Own App para Microsoft 365. Registre aplicaciones en Azure AD para conexiones OAuth de Microsoft. Registro BYOA multi-proveedor (Google + Microsoft) con soporte para ID de inquilino y un asistente de configuración de 3 pasos en Azure Portal.
- Poe Provider: Nueva integración de proveedor LLM para Poe, con listado de modelos, selector de modelos agrupados por proveedor, detección de capacidades de visión/tools/reasoning y visualización de precios.
- What's New Dialog: El pipeline de contenido servido por API entrega notas de lanzamiento y páginas de la guía del usuario. El diálogo asíncrono "What's New" muestra los aspectos destacados de la versión al actualizar.
- Private Sync Account Selector: Elija qué cuenta de Google usar para la sincronización privada, en lugar de usar la cuenta principal por defecto.
- Native TipTap Diff Marks: Se reemplazó la capa de renderizado independiente de marked.js para vistas previas de revisión de AI con marcas nativas de ProseMirror (DiffAdded/DiffRemoved). Las revisiones ahora se renderizan como cambios realizados en línea con tipografía consistente, además de objetivos de aceptar/rechazar a nivel de fragmento.
- Mermaid Diagrams: Renderizado de diagramas Mermaid en vivo en bloques de código dentro del modo de vista previa TipTap de Slate.
- Fuzzy Section Search in Help Tool: La herramienta de ayuda ahora admite coincidencias difusas al buscar secciones específicas dentro de las páginas de documentación.
Improvements
- File Manager UX Polish: Indicadores de iconos de sincronización de carpetas, diálogos de confirmación de eliminación, selección de rango con shift-click, la barra de herramientas se ajusta en lugar de desbordarse en anchuras estrechas y persistencia de etiquetas corregida tras las recargas.
- Responsive Composer Layout: El diseño flex de tres zonas evita que el botón de nuevo hilo sea desplazado fuera de la pantalla en anchuras estrechas. Los selectores de modo y modelo utilizan puntos de interrupción escalonados para ocultar texto. Los iconos personalizados de agente y chip de AI reemplazan los valores predeterminados genéricos.
- Settings UX: Se reordenaron las secciones para un mejor flujo (Personalization → Credentials → Tool Approvals → Agent Modes → Tool Configuration → Skills Library → Tool Servers → Document Processing → Voice).
- Revision State Integrity: Se corrigió la corrupción al eliminar grandes bloques de contenido durante revisiones activas de AI: inmutabilidad de sourceContent, el umbral de reubicación de fragmentos se aumentó a 0.7, los fragmentos obsoletos se rechazan automáticamente y comprobaciones de integridad del historial de versiones.
- Agent Loop Reliability: Se corrigió una condición de carrera del controlador de aborto donde las ejecuciones antiguas podían eliminar el controlador de la nueva ejecución. La señal de cancelación ahora se propaga a las herramientas en cola. Los estados de ejecución huérfanos emiten errores en lugar de dejar mensajes en blanco.
- Interjection Handling: Recorrido de
getActiveBranchMessagesunificado en el servidor y la interfaz de usuario para omitir interjecciones de manera consistente. Se corrigió la desaparición de la respuesta después del seguimiento cuando el parentId del streaming apuntaba a la interjección en lugar de al mensaje del usuario. - macOS Native Stability: Se corrigió la condición de carrera al reiniciar con el seguimiento de época del proceso, fuga de URLSession al reconectar y carrera de datos de LineBuffer entre el manejador de tubería y la parada.
- Google Sheets Fix:
create_tableahora escribe los nombres de los encabezados de las columnas en lugar de dejar la primera fila en blanco. - Middleware Cleanup: Se extrajo el middleware
requireAuthde 10 comprobaciones de autenticación en línea en apple-routes, mcp-routes y attachment-routes. - Image Type Filtering: El File Manager distingue entre capturas de pantalla, imágenes generadas por AI y fotos de usuario con opciones de filtro separadas e iconos distintos.
- Mode/Model Picker Parity: Se igualó el grosor de la fuente y el trazo del icono entre el selector de modo y el selector de modelo.
- Beta Tier Gating: El almacén de credenciales restringe las funciones beta según las comprobaciones de nivel.
- CIDFont Re-Encoding: La reconstrucción de PDF admite la codificación CIDFont con tablas ToUnicode CMap y respaldo de identidad para caracteres que no están en el mapa.
- PDF Export Renamed: "Download" se renombró a "Export" en todo el flujo de trabajo de PDF para mayor claridad.
Bug Fixes
- PDF Text Disappearing: Se corrigió la desaparición del texto en la vista PDF al perder el foco y el contenido confuso al exportar desde la edición WYSIWYG.
- PDF Tracked Changes Routing: Se evitó que los cambios realizados en PDF se enrutaran a través del motor de diferencias unificado, lo que corrompía los datos del operador específicos de PDF.
- PDF Export Integrity: La descarga de PDF ahora falla explícitamente con diagnósticos en lugar de recurrir silenciosamente a la exportación a markdown.
- Markdown Table Line Breaks: Las etiquetas
<br>en las tablas de markdown ahora se renderizan como saltos de línea reales en lugar de texto literal. - DOCX Tracked Deletions Preserved: Se corrigió la eliminación de las eliminaciones registradas en DOCX al cambiar entre la vista visual y la de código.
- Tracked Changes on Stored Markdown: Se corrigió que
propose_changeen slates de markdown no mostrara líneas rojas cuando se cargaba desde el almacenamiento. - Reject Reverts Content:
resolve_tracked_changescon rechazo ahora revierte correctamente el contenido para slates de markdown y código. - Slate Save Loop: Se corrigió el bucle de guardado infinito activado cuando el seguimiento de cambios estaba activo.
- Messaging Stability: Se corrigieron el enrutamiento, el hilo de respuestas, el manejo de perfiles, la resiliencia de la cola, las firmas de webhook, la sanitización del remitente y los límites de carga útil.
Versión 0.9.662 (27 de febrero de 2025)
Nuevas Funciones
- Bring Your Own App (BYOA): Utilice sus propias credenciales de Google OAuth en lugar de la aplicación integrada de caiioo. El soporte multi-app permite que los equipos compartan un único cliente OAuth en toda la organización manteniendo las claves API individuales. Las conexiones BYOA detectan automáticamente tokens caducados y solicitan la reautenticación.
- Navegación por Wikilinks: Wikilinks de doble corchete al estilo Obsidian entre documentos de Slate para construir bases de conocimiento interconectadas. Haga clic en un wikilink para navegar entre Slates instantáneamente.
- Menú de Skills: Inserción de skills mediante la tecla Tab, menú desplegable de altura dinámica, edición en línea con chips de variables y un componente SkillForm compartido para un CRUD completo desde el compositor.
- Descarga DOCX: Descargue documentos de texto y markdown de Slate como archivos DOCX preservando el control de cambios.
- Autocompletado de Tablas:
insert_componentahora rellena automáticamente las celdas de las tablas a partir de datos estructurados, eliminando las tablas con marcadores de posición vacíos. - Gemini 3.1 Flash: Añadido como opción de modelo generador de imágenes junto con los modelos Gemini, FLUX y Seedream existentes.
- Guardado en Google Drive para todas las cuentas: El guardado en Google Drive ahora está disponible para cualquier cuenta de Google conectada, no solo para la principal.
- Motor de Diff Unificado: Reescritura completa del sistema de diff para el seguimiento de cambios de Slate (fases 0–7) con seguridad TOCTOU, almacenamiento en caché, widgets de aceptar/rechazar por cada cambio y soporte de toque para alternar en dispositivos móviles.
Mejoras
- Sincronización Privada Adaptativa: La tasa de sondeo de sincronización se ajusta dinámicamente según la actividad. La optimización del bloqueo de solo descarga reduce los conflictos.
- Captura de Email en OAuth: Google OAuth siempre incluye alcances de identidad para que el email del usuario se capture en cada conexión, solucionando el problema de emails en blanco en algunas cuentas.
- Refuerzo de Seguridad: Se han reforzado los flujos OAuth PKCE, los límites de los subprocesos del agente y el bloqueo por fuerza bruta por cuenta para intentos fallidos de autenticación repetidos.
- Diseño de Chips del Navegador: Los chips del selector de navegador son más pequeños y se ajustan a la línea en lugar de desbordar el contenedor.
- Proveedores de Imágenes Basados en Registro: Se reemplazó la lista de proveedores de imágenes codificada estáticamente por un registro dinámico, facilitando la adición de nuevos modelos.
- Pipeline de i18n de Contenido: Sincronización de contenido unificada mediante seguimiento de hash para todas las páginas de documentación con soporte de traducción incremental.
Corrección de Errores
- Expresiones Matemáticas en Vista Previa: Se corrigió la corrupción de expresiones matemáticas al cambiar de la vista previa de TipTap a la vista de código.
- Wikilinks en Vista Previa: Se corrigió la eliminación de la sintaxis de wikilink al alternar entre la vista previa de TipTap y la vista de código.
- Desaparición de Mensajes de Hilos: Se corrigió la eliminación de mensajes de hilos por STATE_PATCH o su desaparición al cambiar de modelo a mitad de una conversación.
- Huérfanos por Interjección: Se corrigieron los parentIds huérfanos tras el filtrado de mensajes de interjección que causaban errores de renderizado.
- Bucle Infinito en Sincronización Privada: Se resolvió el bucle infinito de sincronización causado por conflictos de reloj en elementos de colección concurrentes y la polución del prefijo thread_data_.
- Casos Críticos de BYOA: Se corrigió que la configuración BYOA no se restaurara al limpiar, las colisiones de guardado asíncrono, el uso de ventanas emergentes de localhost inactivas en la extensión en lugar de launchWebAuthFlow, y la precedencia de issuedByClientId obsoleta.
- Recuperación de Alcance en Sincronización Privada: Se corrigió el fallo silencioso del desbloqueo de sincronización privada cuando los alcances de Google Drive habían expirado o faltaban.
- Skills Duplicadas: Se evitó que aparecieran skills duplicadas después de las fusiones de sincronización privada.
- Enrutamiento de Seguimiento de Cambios: Se conectaron
get_tracked_changesyget_commentsen el enrutamiento de acciones de SlateTool para que el agente pueda leer el estado de las revisiones. - Origen de Descarga DOCX: Se corrigió que downloadAsDocx utilizara contenidos de artefactos obsoletos en lugar del estado del editor en vivo.
- Abreviatura Inteligente de Nombres de Modelos: Se corrigió el desbordamiento de nombres de modelos largos en el selector compacto mediante abreviaturas inteligentes.
- Renderizado de Enlaces Markdown: Se corrigió el bloqueo de URLs chrome-extension: y Caiioo: en los enlaces markdown renderizados.
- Velocidad de Creación de Hilos: Se redujo a la mitad el tiempo de creación de hilos eliminando búsquedas redundantes en la cascada de ajustes.
- Título de Pestaña de Chrome: Se restauró el título dinámico de la pestaña de Chrome basado en el hilo de conversación activo.
- Tokens de Saludo Adaptativos: Se aumentó max_tokens para los saludos adaptativos para evitar el truncamiento en modelos de razonamiento.
Versión 0.9.661 (25 de febrero de 2025)
Nuevas Funcionalidades
- Interjección del Agente: Guíe a la AI a mitad de la ejecución escribiendo un mensaje y presionando Enter mientras está trabajando. El agente verá su guía en su próximo punto de decisión y ajustará el rumbo; no es necesario cancelar y reiniciar. Aparece un botón de envío con distintivo ámbar junto al botón de parada cuando tiene texto para enviar.
- Gestión de Herramientas API: La herramienta de integración de API ahora admite
save_tool,list_toolsydelete_toolcomo acciones de primer nivel, lo que facilita la gestión de las API descubiertas por el agente directamente desde las conversaciones. Los usuarios gratuitos ven GET y list_tools; los usuarios Pro obtienen el conjunto completo. - Contador de Tokens en Vivo: El uso de tokens y el coste ahora se actualizan en tiempo real durante el streaming, mostrándose en el pie de cada mensaje. Los costes especializados (generación de imágenes, búsqueda web) se integran incrementalmente a medida que se completa cada herramienta.
- Auto-expansión de Tarjetas de Herramientas: Las tarjetas de herramientas se expanden automáticamente cuando comienzan a recibir argumentos de streaming o necesitan aprobación, y se colapsan automáticamente al completarse con éxito. Los errores y las herramientas denegadas permanecen expandidos para su revisión.
- Editor de Diferencias Monaco: Las revisiones de código en Slate ahora utilizan el editor de diferencias integrado nativo de Monaco con botones de aceptar/rechazar por cambio, reemplazando el sistema de decoración personalizado anterior.
Mejoras
- Recuperación de Autenticación de Private Sync: Los errores de sincronización privada por tokens de Google expirados o revocados ahora muestran botones accionables de "Reconectar Google" y "Otorgar Permisos" en lugar de un mensaje de error pasivo. La reconexión solicita los permisos correctos de Drive y preselecciona la cuenta de Google adecuada.
- Multicuenta en Private Sync: Private sync ahora se autentica con la cuenta de Google que coincide con el correo electrónico de configuración en lugar de recurrir a cualquier cuenta que se conectara primero. Corrige la sincronización en el Drive incorrecto cuando hay varias cuentas de Google conectadas.
- Renovación de Marca: Nueva paleta de colores azul río y gris roca derivada del logotipo de Caiioo, reemplazando el tema púrpura anterior en toda la aplicación y el sitio web.
- Seguridad OAuth: Se han eliminado los secretos de cliente OAuth de Google, GitHub y Slack del paquete de la extensión. El intercambio de tokens ahora se enruta a través de un proxy de relevo seguro de Cloudflare, eliminando los secretos del código del cliente.
- Inicio más Rápido: El contenido de los archivos adjuntos (imágenes, texto extraído) ahora se carga bajo demanda en lugar de al arrancar, reduciendo significativamente el tiempo de carga inicial para conversaciones con muchos adjuntos.
- Streaming más Rápido: El uso de la ventana de contexto ahora se transmite a través de la ruta de difusión rápida en lugar de pasar por el almacenamiento, ofreciendo actualizaciones en tiempo real sin I/O asíncrono por ciclo del agente.
- Velocidad de Private Sync: El caché de IDs de archivos de Google Drive se mantiene entre reinicios, eliminando una llamada a la API de listado de archivos completo en el primer ciclo de sincronización.
- Ruta de Renderizado de Streaming Unificada: El contenido en streaming y el final ahora fluyen a través de una única ruta de renderizado, eliminando el parpadeo cuando se completa la generación y preservando los mensajes de interjección.
- Cambio entre Modelos: Cambiar entre proveedores de AI a mitad de un hilo (por ejemplo, de Gemini a Claude) ya no causa errores de "Firma inválida en bloque de pensamiento". Los artefactos de razonamiento externos se aplanan automáticamente a texto narrativo, preservando el contexto sin firmas criptográficas incompatibles.
- Guía de Herramientas Deshabilitadas: Cuando la AI intenta usar una herramienta deshabilitada, ahora recibe sugerencias accionables (herramientas habilitadas similares, cómo habilitarlas) en lugar de un error genérico de "no encontrado".
- Diseño de Composer Responsivo: La barra de herramientas del Composer utiliza una divulgación progresiva escalonada: el selector de modo, el selector de modelo, los ajustes, la agenda y los iconos de ayuda aparecen según el espacio disponible en lugar de recortarse.
- Codificación por Colores en Ajustes: Las secciones de ajustes ahora utilizan un sistema de 3 colores: tinte de acento para secciones de personalización y neutrales alternos para el resto, para una agrupación visual más clara.
- Errores de Onboarding: La provisión de claves gratuitas ahora muestra mensajes de error descriptivos debajo de los botones de acción en lugar de fallar silenciosamente.
- Ajustes del Proveedor de AI: Se ha renombrado la sección "API & Provider" a "AI Provider" para mayor claridad.
- Prueba Gratuita Extendida: El periodo de prueba Pro se ha extendido de 7 a 14 días, dando a los nuevos usuarios más tiempo para explorar las funciones Pro.
- Cambio de Rama Optimista: Cambiar entre ramas de mensajes y recargar mensajes ahora actualiza la interfaz de usuario instantáneamente en lugar de esperar a los ciclos de almacenamiento.
- Configuración de Herramientas MCP: Autocorrección de esquemas y configuración mejorada de herramientas MCP para una configuración de herramientas más fiable.
Corrección de Errores
- Costes por Mensaje: Los costes de los mensajes individuales ahora coinciden acumulativamente con el total del encabezado del hilo. Los costes de Helper, OCR, generación de imágenes y búsqueda se atribuyen a mensajes individuales en lugar de solo al resumen del hilo.
- Renderizado de Interjecciones: Los mensajes de interjección ahora se renderizan como anotaciones ámbar compactas en línea en la línea de tiempo del asistente en lugar de perderse cuando se completa la generación.
- Detección de Bucles: Se ha corregido la detección de repetición de falsos positivos en respuestas con muchas citas donde las URL se repiten naturalmente más de 3 veces.
- Alineación de Diferencias en Slate: Se ha corregido la desalineación de líneas rojas/verdes en el modo de vista previa para fragmentos multilínea donde el bucle de superposición avanzaba solo 1 línea independientemente de la extensión del fragmento.
- Posiciones de Eliminación en Slate: Se ha corregido el doble conteo del desplazamiento de inserción que causaba que las eliminaciones se renderizaran después de sus inserciones emparejadas en lugar de antes.
- Correcciones de Private Sync: Se ha corregido que la solicitud de alcance JIT no se activara en fragmentos de código divididos y el bucle de sincronización infinito después de las subidas.
- Flujo de Onboarding: El flujo OAuth ahora completa el onboarding correctamente, se admiten IDs de modo con guiones en la detección de disparadores y 0 días restantes ya no se convierte a nulo.
- Restablecimiento de Contraseña: Restablecer la contraseña mediante el enlace de correo electrónico ahora verifica la dirección de correo electrónico. Se ha añadido un endpoint de reenvío de verificación para usuarios con correos de verificación caducados.
- Nivel de Licencia: Los usuarios con un nivel otorgado por el administrador pero sin una fila de licencia ya no se quedan bloqueados en la barrera de actualización.
- Desplazamiento en Ajustes: Al hacer clic en el icono del cerebro para una página aprendida, ahora se desplaza a la sección de ajustes correcta en lugar de detenerse antes debido a las secciones cargadas de forma diferida arriba.
- Eliminación de Monaco: Se ha corregido el orden de eliminación del modelo del editor de diferencias para evitar referencias colgantes y que Monaco se vea a través de la vista previa de TipTap.
- Objetivo de Guías: Los pasos de las guías interactivas ahora omiten elementos ocultos por consultas de contenedor responsivas en lugar de resaltar un píxel de 16x16 en la esquina superior izquierda.
- Kokoro TTS: Se ha corregido el texto a voz que no funcionaba en la extensión; la detección del tiempo de ejecución de ONNX fallaba en documentos fuera de pantalla, causando errores de "no se encontró un backend disponible".
- Guardado de Herramientas API Personalizadas: Se ha corregido el error al guardar las API descubiertas por el agente como herramientas personalizadas en la extensión debido a la prohibición de
import()dinámico en el contexto del Service Worker. - Rendimiento de Arranque: Se ha corregido la migración de sesión que se ejecutaba en cada acceso a los ajustes (más de 20 veces al arrancar), causando escrituras en disco innecesarias y un inicio más lento.
- Difusiones de Almacenamiento Duplicadas: Se han suprimido las notificaciones dobles de cambio de almacenamiento en modo relay/server que podían causar parpadeo en la interfaz de usuario.
- Recuperación de Textura Cairn: Se ha corregido el fallo en la generación de texturas cuando el caché del mundo en memoria se desalojaba entre la carga y el renderizado, y se ha corregido que el renderizador mostrara negro para texturas respaldadas por adjuntos.
- Parches de Seguridad: Se han actualizado fast-xml-parser (DoS mediante expansión de entidades DOCTYPE) y tar (vulnerabilidad de escape de hardlink).
- Cumplimiento de MV3: Se ha reemplazado vega-embed cargado por CDN con paquetes de proveedores locales, asegurando que todo el código de renderizado de gráficos pase la política de código remoto de Chrome Web Store.
- Gráficos Vega-Lite: La AI ahora genera visualizaciones Vega-Lite directamente en Slate en lugar de HTML cargado por CDN, permitiendo gráficos interactivos sin dependencias de scripts remotos.
- Guardado en Google Drive: Se han corregido los errores 403 al guardar en Google Drive desde Slate causados por comprobaciones de alcance OAuth obsoletas en controladores de Drive que no son del agente.
- Onboarding de Nuevos Usuarios: Se ha corregido que la pantalla de onboarding se omitiera por completo para los nuevos usuarios cuando se aprovisionaba automáticamente una clave API durante el inicio de sesión.
- Ventana Emergente OAuth de OpenRouter: Se ha corregido el indicador de carga "Connecting..." que se quedaba bloqueado indefinidamente cuando los bloqueadores de ventanas emergentes cerraban silenciosamente la ventana de OAuth.
- Texto del Banner de Prueba: El banner de prueba ya no afirma que los modelos están restringidos por nivel; se ha actualizado para describir con precisión las funciones Pro (acceso de escritura, generación de imágenes, modos personalizados).
- Barra de Herramientas de Revisión DOCX: Se ha corregido el parpadeo de la barra de herramientas al mostrar los controles de revisión de documentos al posponer el desplazamiento hasta la visibilidad inicial.
- Superposición de Añadir al Prompt: Se ha corregido el logotipo de la superposición bloqueado por la Content Security Policy y la opacidad del fondo que no coincidía con el tema.
- Estado de Edición/Recarga de Mensajes: Se ha corregido el estado en memoria que quedaba obsoleto después de editar un mensaje, recargar una respuesta o cambiar de rama.
- Bloqueo de Inicio de Sesión en Servidor: Se ha corregido el fallo de las operaciones de almacenamiento WebSocket durante el flujo de inicio de sesión en el servidor. La autenticación ahora está desacoplada para que la sesión local funcione inmediatamente mientras la identidad del servidor se resuelve en segundo plano.
- Bloqueo de Conexión WebSocket: Se ha corregido una condición de carrera donde AUTH_STATE: ready llegaba durante la conexión inicial de WebSocket y podía dejar huérfana la promesa de autenticación, impidiendo que la conexión se completara.
Versión 0.9.655 (19 de febrero de 2025)
Nuevas Funciones
- Integración con Slack: Conecte su espacio de trabajo de Slack para habilitar herramientas de Slack impulsadas por IA con autorización completa OAuth V2
- Credenciales de Herramientas de API: Las API descubiertas por el agente ahora se pueden guardar como herramientas MCP personalizadas con credenciales almacenadas, lo que permite su reutilización en todas las conversaciones
- Insignia de API Guardada: Las herramientas de API creadas por el agente muestran una insignia de "API guardada" en la configuración para una fácil identificación
- Importación de Conversaciones: Importe conversaciones desde ChatGPT, Claude, Gemini, Perplexity y Grok; cargue su archivo de exportación y Caiioo lo convertirá con el historial completo de mensajes, archivos adjuntos y metadatos
Mejoras
- Anidamiento de API Aprendidas: Las herramientas de API aprendidas ahora se agrupan bajo una sección plegable en la configuración para una organización más limpia
- Branding de Caiioo: Las herramientas integradas ahora muestran el icono de Caiioo para una consistencia visual
- Enlaces Conscientes del Navegador: Las URL abiertas por el agente ahora se inician en el navegador que haya seleccionado en la configuración
- Carga de Slate Cloud: Cargar un documento de Slate desde Google Drive ahora activa un aviso de OAuth JIT en lugar de fallar con un error críptico
Corrección de Errores
- Edición de DOCX: Se corrigió la coincidencia de expresiones regulares de ejecución de párrafos en tramos anidados, que causaba corrupción de contenido al editar texto DOCX formateado
- Seguridad de Buscar/Reemplazar: Se restauró la protección de patrones HTML estructurales perdida durante la refactorización; evita que las ediciones corrompan el marcado interno de XLSX/DOCX
- Bucle de Aprobación de Herramientas: Se corrigió una condición de carrera que causaba avisos de aprobación repetidos para la misma herramienta dentro de una sola ejecución del agente
- Identidad Caducada: Se corrigió que la identidad de usuario caducada no se borrara en el error 401 durante la sincronización de la licencia, con escape de cierre de sesión en la incorporación de usuarios recurrentes
Versión 0.9.651 (17 de febrero de 2025)
Nuevas Funcionalidades
- Permisos de Privilegio Mínimo: Las herramientas de Google Workspace ahora solicitan solo los scopes exactos necesarios para cada acción en lugar de un acceso amplio. La lectura de correos electrónicos solicita solo lectura; la creación de eventos solicita únicamente acceso de escritura en el calendario.
- Diálogo de Permisos Mejorado: El diálogo de autorización just-in-time muestra exactamente qué permisos se están solicitando, por qué son necesarios y si la operación es de solo lectura o de lectura y escritura.
- Selector de Permisos: Al conectar manualmente una cuenta de Google, puede elegir qué servicios (Calendar, Gmail, Drive, Docs, Sheets, Slides) y niveles de acceso (solo lectura frente a lectura y escritura) otorgar por adelantado. Botón de Editar Permisos en las conexiones existentes.
- Resultados de Imagen: Las imágenes generadas y las capturas de pantalla ahora se renderizan de forma destacada entre los pasos del proceso colapsados y la respuesta final, eliminando la necesidad de expandir las llamadas a herramientas para ver el resultado visual.
Mejoras
- Seguridad de Private Sync: Las ediciones concurrentes ahora se descargan para su fusión en lugar de cargarse, la actualización del bloqueo verifica la propiedad y la fusión del manifiesto evita la pérdida de datos por operaciones de papelera prematuras.
- P2P Sync Eliminado: Se eliminó la sincronización en tiempo real P2P, eliminando más de 100 MB de tráfico WebSocket innecesario y mejorando el rendimiento de la extensión.
- Rendimiento de Ajustes: Memoización del panel de ajustes y aislamiento del contexto de colapso para un renderizado más rápido.
- Renderizado de DOCX: Mejora en el renderizado de párrafos, numeración y soporte de estilos en el analizador de documentos.
Corrección de Errores
- Scope de Google Docs: Se corrigió el error de "insufficient authentication scopes" al indexar Google Docs —
index_documentrequería scope de escritura para rangos con nombre. - Lectura de Google Docs: Se corrigió el fallo de
read_documentyget_document_infocuando solo se otorgaban scopes de Docs — estas acciones también requieren acceso de lectura a Drive. - Copia de Calendario: Se corrigió la acción
copy_eventque faltaba en el registro de scopes, lo que impedía las solicitudes de permiso JIT. - Persistencia de API Key: Se corrigió la pérdida silenciosa de la API Key de BYOK cuando
saveCustomModeinterrumpía la ruta de guardado de ajustes durante la activación de la prueba Pro. - Conflicto de Recarga de Ajustes: Se corrigió el borrado de la API Key no guardada cuando al colapsar/expandir secciones de ajustes se activaba un ciclo de recarga de almacenamiento.
- Cancelación de Chrome Identity: Se corrigió que la cancelación del usuario durante las solicitudes de scope incremental no se distinguiera de los errores, y el método de autenticación ahora transiciona correctamente tras obtener un token de actualización OAuth web.
- Sobrescritura de Private Sync: Se corrigió que el private sync sobrescribiera turnos recientes cuando ocurrían ediciones concurrentes.
- Capturas de Pantalla del Viewport: Se dejó de mostrar las capturas de pantalla del viewport por encima del texto de la respuesta final.
- Coordinación del Agente: Se corrigieron 7 problemas relacionados con la coordinación de turnos, percepción y gestión de estado.
- Control de Cambios: Se corrigió el modo de control de cambios que se rompía tras la descomposición de slate debido a la desincronización de variables de estado dual.
- Administrador de Archivos: Las acciones de eliminar y descargar ahora están disponibles en todos los modos, no solo para archivos huérfanos.
- Nombres de Herramientas MCP: Se corrigió que las herramientas usaran IDs internos del servidor en lugar de nombres legibles para humanos.
- Herramienta Agenda: Se corrigió que la tarjeta de sincronización siempre mostrara permisos faltantes; ahora está conectada al sistema de conexión Google OAuth.
Versión 0.9.642 (16 de febrero de 2025)
Mejoras
- Creación de nuevos documentos: Los nuevos archivos DOCX, XLSX, PDF y RTF creados desde el menú desplegable "Nuevo archivo" ahora son totalmente editables con soporte para control de cambios y formato adecuado
- Estabilidad de Gemini: Se agregó detección de repetición de razonamiento para romper automáticamente los bucles de pensamiento de Gemini y evitar que el texto de pensamiento filtrado aparezca en el chat
- Manejo de imágenes: Las vistas previas de fotos RAW DNG ahora respetan la orientación EXIF para una visualización correcta, evitando la distorsión en las imágenes subidas.
Corrección de errores
- Editabilidad de nuevos documentos: Se corrigió que los documentos en blanco creados a través de "Nuevo archivo" se renderizaran como vistas previas estáticas en lugar de editores de texto enriquecido editables
- Detección de clave API: Cambiar a su propia clave API (BYOK) ahora tiene efecto inmediatamente sin requerir una actualización de página
- Estabilidad de capturas de pantalla: Se corrigió el manejo de ID de archivos adjuntos para evitar que los datos de capturas de pantalla se pierdan o corrompan
- Agrupación de pestañas: Se corrigió el bloqueo cuando el navegador tenía ventanas no normales (p. ej., herramientas de desarrollo, ventanas emergentes)
- Ruido de consola: Se eliminó el sondeo innecesario de llms.txt que estaba enviando errores 404
- Tiempos de espera de herramientas: Se eliminaron soluciones de keepalive frágiles que podían interferir con llamadas de herramientas de larga duración como la generación de imágenes 4k con Gemini
- Caché de prompts: Se corrigió que el contenido multimodal (imágenes/capturas de pantalla) se descartara durante la optimización de la caché de prompts
Interno
- Mejoras significativas en la calidad del código base en el manejo de errores, seguridad de tipos y capas arquitectónicas
- Modularización del analizador de documentos central en módulos enfocados y mantenibles
Versión 0.9.641 (14 de febrero de 2025) - ¡Feliz Día de San Valentín!
Mejoras
- Medallas de Nivel del Selector de Modelos: Se reemplazaron las insignias de recomendación codificadas por 5 medallas de nivel impulsadas por API (Mejor para Caiioo, Calidad, Fiabilidad, Velocidad, Valor) que muestran clasificaciones de oro/plata/bronce directamente de los datos de referencia
- Sistema de Habilidades: Las habilidades ahora tienen un botón de restaurar valores predeterminados para volver a añadir las habilidades integradas
- Almacenamiento en Caché de Prompts: Se optimizó aún más el almacenamiento en caché de prompts para ahorrar costos
Corrección de Errores
- Compatibilidad de Navegador: El inicio de sesión OAuth y la conexión automática ahora funcionan en Vivaldi y otros navegadores que no son Chrome
- Seguimiento de Costos: Se corrigió una condición de carrera donde la cancelación de una ejecución podía arruinar los datos de costo y uso; los datos de costo/uso ahora se preservan en ejecuciones canceladas y con errores
- Sincronización Privada: Se reescribió purgeAllStorage para un borrado total, se corrigió la carrera del oyente de sincronización y se consolidó la interfaz de sincronización privada
- i18n: Se añadió la inicialización de traducción faltante a la página emergente conversation.html
- Seguridad: Se parchearon vulnerabilidades de dependencias (qs, @casl/ability, axios, markdown-it)
- Página de Benchmarks: Se migró el backend de la página de benchmarks a la autenticación de Cloudflare
Versión 0.9.65 (13 de febrero de 2025)
Mejoras
- Benchmarks de MiniMax M2.5: Suite de benchmarks completa — precisión de la herramienta 91%, fiabilidad 95% (puesto n.º 2), puesto compuesto n.º 5 con nivel de valor oro
- API de Inteligencia de Modelos: Se aumentó el límite de respuesta predeterminado de 100 a 500, asegurando que todos los modelos con insignias obtenidas sean visibles para los clientes
Corrección de errores
- Insignias de modelo faltantes: Se corrigieron 35 modelos con insignias de nivel obtenidas (oro/plata/bronce) que no aparecían en la lista de modelos de la extensión, incluyendo Claude Opus 4.6 (oro compuesto), Claude Sonnet 4.5 (plata compuesto) y Claude Haiku 4.5 (bronce compuesto). Causa raíz: la API devolvía por defecto solo 100 modelos ordenados por fiabilidad, pero los niveles se calculaban a partir de los 367 modelos. Los modelos fuera de los 100 mejores por fiabilidad perdían sus insignias silenciosamente.
Versión 0.9.64 (12 de febrero de 2025)
Mejoras
- Paridad del Proveedor Ollama: Paridad total de funciones con OpenRouter — soporte de señal de aborto, manejo de errores, detalles de razonamiento, model ID resuelto y procesamiento de etiquetas think a través de streaming mixin.
- Propagación de AbortSignal: Los procesos secundarios SIGTERM/SIGINT ahora cancelan las llamadas a la API de LLM en curso.
- Validación de Esquema en Tiempo de Compilación: La validación del esquema de configuración en el tiempo de compilación detecta entradas de
SETTING_METADATAfaltantes. - Caché de Capacidades de la Plataforma: Almacenadas en caché para mejorar el rendimiento en lugar de recalcularse en cada acceso.
- i18n del Sitio Web: Sincronización de las traducciones de la página de confianza y la reestructuración de precios en los 22 idiomas.
Corrección de Errores
- Autenticación del Sitio Web: Se reemplazó la autenticación heredada de Supabase con llamadas directas a la API de Cloudflare Worker para el inicio de sesión con Google, inicio de sesión por correo electrónico, registro y restablecimiento de contraseña.
- Localización de Stripe Checkout: Se corrigió el error "Invalid locale" en el proceso de pago y en el portal mediante el mapeo de
navigator.language(por ejemplo,en-US) a los locales compatibles con Stripe, con respaldo aauto. - Longitud Mínima de Contraseña: Se sincronizó el mínimo de 12 caracteres en el registro del servidor, el restablecimiento de contraseña y la página de restablecimiento del sitio web.
- Deduplicación de Perfiles de Private Sync: El inicio de sesión ahora detecta y elimina perfiles duplicados causados por errores de sincronización anteriores.
- Condición de Carrera en la Inicialización del State Manager: Se corrigió la condición de carrera de inicialización en el state-manager.
- Limpieza de Subprocesos de Agentes: Limpieza de subprocesos zombies al finalizar el agente.
- Protecciones de API de Tab Group/Storage: Protecciones adecuadas para las API de grupos de pestañas y almacenamiento en todas las plataformas.
- Manejo de Errores de Geolocalización: Manejo fluido de los errores de permisos de geolocalización.
- Bloqueo de Actualización de OAuth: Evita intentos concurrentes de actualización de tokens OAuth.
- Mutex de Guardado de Configuración: Los guardados de configuración concurrentes ya no se sobrescriben entre sí.
- Aislamiento de Parseo JSON del Agente: Las salidas malformadas del agente ya no bloquean el analizador.
- Condición de Carrera en Búsqueda de Hilos: Se corrigió la condición de carrera en los resultados de búsqueda de hilos.
- Obsolescencia de Versión en Streaming: Comprobación de versiones obsoletas durante las respuestas en streaming.
- Tiempos de Espera de Content Script: Se agregaron tiempos de espera para el paso de mensajes del content script.
- Poda de Contexto para Multimodal: Mejora de la poda de contexto cuando hay contenido multimodal presente.
Versión 0.9.63 (12 de febrero de 2025)
Corrección de errores
- Variables de modo de sincronización privada: Se corrigió la migración de configuraciones heredadas que se ejecutaba en cada ciclo de sincronización, sobrescribiendo silenciosamente ediciones locales recientes (por ejemplo, cambios en variables de modo) con datos obsoletos de Drive.
Versión 0.9.62 (12 de febrero de 2025)
Nuevas Funcionalidades
Configuración de OpenRouter OAuth en un Clic
- Creación de Claves PKCE: El nuevo flujo de OpenRouter OAuth en un clic permite a los usuarios crear y vincular una API key sin salir de caiioo.
- Onboarding Rediseñado: Flujos de incorporación y actualización optimizados con la integración de OpenRouter OAuth.
- Advertencia de Privacidad: La opción de onboarding para modelos gratuitos ahora muestra una advertencia clara sobre privacidad y datos de entrenamiento.
Sync Privada Granular
- Sincronización por Elemento: Los servidores MCP, aprobaciones de herramientas, perfiles, skills, modos, overrides y recordatorios ahora se sincronizan a nivel de elemento individual en lugar de sobrescribir colecciones completas.
- Sincronización de Ajustes por Clave: Los ajustes se sincronizan de forma granular por clave, evitando que los cambios remotos sobrescriban cambios locales no relacionados.
- Lecturas Deduplicadas: Las lecturas de almacenamiento WebSocket en curso se deduplican para reducir el tráfico de red innecesario.
Mejoras
- UX de Ajustes de Modo: Los overrides ahora se guardan automáticamente, y la opción Restore Defaults restaura correctamente las variables de modo eliminadas.
- Composer Responsivo: El botón de Skills se colapsa a solo icono en anchuras estrechas; se eliminó el espaciador de diseño de la sección Skills.
- Tickets de Soporte: La versión de la compilación y la fecha/hora ahora se incluyen automáticamente.
- Búsqueda en Slate: Se añadió la nueva acción
search_documenta la herramienta Slate.
Corrección de Errores
- Google Slides/Sheets OAuth: Ahora lanza correctamente el error
OAuthAuthorizationRequiredErroren lugar de devolver texto de configuración, permitiendo la autorización just-in-time. - Actualización de UI de Configuration Tool: Las mutaciones de agentes a través de la configuration tool ahora emiten
STORAGE_CHANGEDpara que la UI se actualice inmediatamente. - Modal de Aprobación de Herramientas: Se corrigió la violación del orden de los hooks de React (useMemo por encima del retorno temprano).
- Localhost HTTPS: La herramienta de integración de API ahora gestiona certificados autofirmados para servidores HTTPS locales.
- Persistencia de Variables de Modo: Se corrigió el problema con las propiedades getter de i18n que no se materializaban antes del almacenamiento, causando que las variables desaparecieran al recargar.
- Seguridad de Hilos en Slate: Se resolvió una condición de carrera en las herramientas de Slate que causaba slates duplicados durante turnos de AI paralelos.
- Slate DOCX: Se corrigió la visibilidad de eliminaciones y la corrupción de la línea base en los cambios controlados.
- Estabilidad de Sync Privada: Se eliminaron los rebotes y las ediciones que desaparecían debido a conflictos de sincronización.
Versión 0.9.61 (10 de febrero de 2025)
Mejoras
i18n del editor Slate
- Barra de herramientas y menús traducidos: Todos los botones de la barra de herramientas, menús contextuales y cadenas de diálogo del editor Slate ahora están completamente traducidos
Corrección de errores
- Tiempos de espera de OAuth: Todas las solicitudes de intercambio y actualización de tokens OAuth ahora tienen un tiempo de espera de 15 segundos, evitando bloqueos infinitos por interrupciones de red
- Correo electrónico privado de GitHub: Se corrigió el fallo de conexión con GitHub cuando el correo electrónico del perfil del usuario es privado (ahora se obtiene de la API
/user/emails) - Diálogo de conexión OAuth: Se generalizó el diálogo de conexión OAuth y se corrigieron múltiples errores de tokens/conexión
- Consistencia en la longitud de contraseñas: Se sincronizó el requisito mínimo de 12 caracteres para la contraseña en todas las interfaces de registro y restablecimiento
Versión 0.9.6 (8 de febrero de 2025)
Nuevas Funcionalidades
Internacionalización (más de 20 idiomas)
- Soporte completo de i18n: Caiioo ahora está disponible en más de 20 idiomas, incluyendo inglés, español, francés, alemán, japonés, coreano, chino, árabe, hebreo, hindi y más.
- Soporte para idiomas RTL: Diseño completo de derecha a izquierda para árabe, hebreo y urdu.
- Configuración de idioma de la UI: Elija su idioma preferido en Settings — todos los elementos de la interfaz, etiquetas de herramientas y mensajes de estado están traducidos.
Mejoras
Rendimiento del Panel de Settings
- Secciones con Lazy-Loading: Las secciones del panel de Settings ahora se cargan bajo demanda, reduciendo el tiempo de renderizado inicial.
- Almacenamiento Modular: Los ajustes se almacenan en claves granulares por sección en lugar de un único bloque monolítico, mejorando el rendimiento de lectura/escritura.
- Getters Tipados: El acceso interno a los ajustes utiliza getters fuertemente tipados con seguimiento de granularidad de cambios.
Fiabilidad de Track Changes en Slate
- 17 correcciones en el Revision Manager: Refuerzo integral del sistema de seguimiento de cambios en el cálculo de diferencias (diff), aceptación, rechazo y persistencia.
- Diferenciación de texto plano: Los cambios de redline ahora comparan texto plano en lugar de markdown puro, produciendo resaltados de cambios más limpios y precisos.
- Cambios de usuario persistentes: Los cambios rastreados realizados por el usuario ahora sobreviven a la actualización de la página.
- Corrección de condición de carrera: Forzado de consolidación (force-bake) de los cambios rastreados antes de guardar para evitar la pérdida de datos.
Corrección de Errores
- Cierres inesperados del Service Worker: Se reemplazaron más de 112 llamadas dinámicas a
import()por importaciones estáticas para evitar cierres inesperados del service worker en Chrome. - Mensajes de bienvenida de modo: Se corrigieron problemas de idioma, detección de claves provisionadas y persistencia en los mensajes de bienvenida de los modos.
- Selección de cuenta en herramientas de Google: El selector de cuentas ahora refleja dinámicamente las cuentas realmente conectadas.
- Listas anidadas en DOCX: Se corrigieron los marcadores de visualización y la corrupción de exportación en los procesos de ida y vuelta (round-trip) de listas anidadas.
- Renderizado de matemáticas en LaTeX: Se corrigió el escape del símbolo de dólar de moneda que interrumpía las expresiones matemáticas de LaTeX que comenzaban con números.
- Creación de grupos de pestañas: Se pospuso la creación diferida (lazy) de grupos de pestañas hasta que la herramienta de navegación web se utilice realmente.
- OAuth de Agenda: Re-lanzamiento de errores de OAuth para que la autorización justo a tiempo se active correctamente.
- Persistencia de Settings: Se añadieron entradas de metadatos faltantes para 6 ajustes que fallaban silenciosamente al guardar.
Versión 0.9.5 (6 de febrero de 2025)
Refuerzo de Seguridad
- Validación de Origen de Content Script: Los mensajes de páginas web a la extensión ahora están restringidos únicamente a orígenes de caiioo.ai, con comprobaciones estrictas de mismo origen que evitan la inyección de mensajes entre distintos orígenes
- CSP Restringida: Se eliminaron las fuentes de scripts de localhost (solo para desarrollo) de la Política de Seguridad de Contenido de las páginas de la extensión
- Delimitación de Respuestas de Autenticación: Las respuestas de autenticación de la extensión ahora se envían al origen de la página específica en lugar de transmitirse a todos los marcos
Versión 0.9.4 (4 de febrero de 2025)
Nuevas funciones
Conversión de voz a texto multilingüe
- Selección de idioma: Elija su idioma de STT en Ajustes para una entrada de voz precisa en idiomas distintos al inglés
- Más de 90 idiomas compatibles: Funciona con Whisper y ElevenLabs para una cobertura lingüística completa
Detección de actividad de voz en tiempo real
- VAD de baja latencia: La nueva integración de Silero VAD v5 detecta el habla en tiempo real con un retraso mínimo
- Grabación más inteligente: La grabación se inicia y detiene automáticamente según la actividad de voz
- Reducción de falsos positivos: Mejor distinción entre el habla y el ruido de fondo
Alternar visibilidad de sugerencias
- Ocultar/Mostrar sugerencias: Nuevo interruptor para ocultar las sugerencias de seguimiento de la IA cuando desee una interfaz más limpia
- Estado persistente: Su preferencia se guarda y recuerda entre sesiones
Mejoras
Auto-guardado de control de cambios
- Seguimiento basado en diff: Seguimiento de cambios más eficiente mediante algoritmos de diff
- Auto-guardado: Los cambios se guardan periódicamente para evitar la pérdida de datos durante sesiones de edición largas
- Instantánea al salir: Salir del modo de control de cambios guarda automáticamente todos los cambios pendientes
Streaming de proveedores mejorado
- Mejoras en Gemini: Mejor capacidad de streaming y razonamiento para los modelos de Google Gemini
- Comportamiento consistente: Comportamiento de streaming unificado entre OpenRouter y los proveedores nativos
Versión 0.9.3 (31 de enero de 2025)
Nuevas Funciones
Recorrido de Incorporación Guiado
- Tour Interactivo de la IU: Un nuevo recorrido paso a paso guía a los nuevos usuarios a través de cada parte de la interfaz después de ingresar su clave de API
- Tres Fases: Cubre el compositor (11 pasos), el panel de configuración (7 pasos) y el sistema de modos (5 pasos)
- Efecto de Foco: Cada paso resalta el elemento de la interfaz relevante con un foco de atención
- Incorporación Conversacional: Creación de perfil guiada por IA para personalizar su experiencia desde el principio
Historial de Prompts
- Acceso a Prompts Anteriores: Sus prompts recientes se guardan y se puede acceder a ellos en el compositor
- Reutilización Rápida: Reutilice o modifique fácilmente mensajes anteriores
Niveles de Bloqueador de Anuncios
- Control Granular: El bloqueo de anuncios ahora admite múltiples niveles en lugar de solo encendido/apagado
- Elija su Protección: Seleccione el nivel de bloqueo que mejor se adapte a sus necesidades de navegación
Barra de Herramientas de Revisión de DOCX
- Controles de Control de Cambios: Nueva barra de herramientas al visualizar documentos de Word con cambios realizados
- Acciones de Aceptar/Rechazar: Revise y resuelva fácilmente las ediciones del documento
Mejoras
Configuración de Retención de Hilos
- Limpieza Configurable: Establezca cuánto tiempo conservar los hilos antiguos antes de la limpieza automática
- Gestión de Almacenamiento: Mejor control sobre su historial de conversaciones
Animación de Caiioo
- Optimizaciones de Rendimiento: Animación más fluida con renderizado mejorado
- Efectos de Humedad: Nueva superposición visual que muestra la saturación de agua
- Renderizado Directo de Partículas: Visuales más limpios con dibujo de partículas optimizado
Cambio de Perfil
- Gestión de Estado Mejorada: Cambio de perfil más confiable con manejo de protocolos mejorado
- Mejor Sincronización: Los cambios de perfil se sincronizan correctamente en toda la extensión
Google Calendar
- Gestión de Tokens: Manejo mejorado de tokens de acceso para operaciones de calendario
- Sincronización más Confiable: Mejor flujo de OAuth para la integración del calendario
Versión 0.9.2 (26 de enero de 2025)
Nuevas Funciones
Bloqueo de Anuncios y Rastreadores
- Bloqueador de Anuncios Integrado: Bloquee anuncios y rastreadores utilizando el motor Ghostery con declarativeNetRequest compatible con MV3
- Alternar en Configuración: Active o desactive el bloqueo de anuncios desde el panel de Configuración
- Actualizaciones de Listas de Filtros: Almacenamiento en caché automático de listas de filtros para un bloqueo confiable
Permisos de Google Justo a Tiempo
- Autorización Incremental: Los permisos de las herramientas de Google ahora se solicitan solo cuando son necesarios, no por adelantado
- Gestión de Alcance más Clara: Los alcances faltantes activan mensajes de error útiles con opciones para otorgar acceso
- Mejor Privacidad: Solo solicita los alcances específicos de Google requeridos para cada herramienta
Mejoras
Animación de Caiioo
- Física Mejorada: Dinámica de partículas mejorada con mejores fuerzas de elevación, velocidad y densidad
- Flujo más Suave: Las partículas ahora siguen la dirección del canal al aparecer, reduciendo la acumulación
- Apilamiento Realista: Las partículas se apilan de forma natural cuando son bloqueadas por guijarros o presas
Flujo de Google OAuth
- Inicio de Sesión más Rápido: Ahora prioriza la recuperación del token de ID para una autenticación más rápida
- Fiabilidad Mejorada: Un mejor manejo de tokens reduce los fallos de autenticación en navegadores que no son Chrome
Incorporación y Configuración
- Modo de Vista Previa: Pruebe los flujos de incorporación sin borrar los datos del usuario
- Nivel Gratuito más Limpio: Se eliminó la interfaz de usuario de restauración de claves de API aprovisionadas obsoleta
Interno
- Sistema de Minijuegos: Nueva infraestructura MinigameContainer para experiencias de introducción interactivas
- Huevo de Pascua Oculto: El estado de visibilidad del minijuego persiste entre sesiones
Version 0.9.1 (25 de enero de 2025)
Nuevas Funcionalidades
Simulación de Agua Interactiva
- Caiioo Intro: Nueva simulación de fluidos interactiva en la pantalla de carga: observa cómo fluye el agua a través de un canal dinámico en forma de S.
- Pebbles Arrastrables: Mueve los pebbles para redirigir el flujo de agua y crear presas.
- Dinámica de Sedimentos: Erosión y deposición realistas: el agua rápida recoge sedimentos, el agua lenta los deposita.
- Adaptación al Tema: Los colores del agua coinciden automáticamente con el tinte del tema elegido.
Soporte para Gráficos Vega/Vega-Lite
- Visualizaciones Interactivas: Visualiza y edita gráficos Vega y Vega-Lite directamente en Slate.
- Visualización de Datos: Crea gráficos de barras, gráficos de líneas, diagramas de dispersión y visualizaciones complejas de múltiples capas.
- Edición de Especificaciones: Edita la especificación JSON y observa los cambios renderizados en tiempo real.
Soporte para Diagramas Mermaid
- Tipos de Diagramas: Crea diagramas de flujo, diagramas de secuencia, diagramas de clases, diagramas de estado y más.
- Vista Previa en Vivo: Edita la sintaxis de Mermaid con una vista previa visual instantánea.
- Opciones de Exportación: Los diagramas se renderizan como SVG para una salida nítida en cualquier tamaño.
Plantillas de Creación de Archivos
- Menú de Creación Rápida: Nuevo menú desplegable al crear archivos en Slate con plantillas para tipos de archivos comunes.
- Categorías de Plantillas: Markdown, archivos de código, formatos de datos, diagramas y más.
- Inicio con un Clic: Salta directamente a un nuevo documento con la estructura adecuada.
Mejoras
Manejo de Errores de API
- Notificaciones Visuales: Los errores de API ahora se muestran como notificaciones toast descartables.
- Auto-descarte: Los errores no críticos (como cancelaciones) se borran automáticamente después de unos segundos.
- Mensajes más Claros: Mejores mensajes de error ayudan a identificar y resolver problemas más rápido.
Capacidades de la Plataforma
- Detección Inteligente de Funciones: Las funciones que requieren plataformas específicas (como Apple Calendar en macOS) ahora se detectan automáticamente.
- Alternativas Flexibles: Las herramientas se adaptan a tu entorno en lugar de fallar silenciosamente.
- Mejoras en Herramientas de Apple: Apple Reminders ahora admite acciones de desmarcar como completado y acciones de lista.
Safari y Navegadores No-Chrome
- Mejor Flujo de OAuth: Detección de navegador mejorada para el inicio de sesión de Google.
- Mecanismo de Respaldo: Los navegadores que no son Chrome ahora tienen una ruta de autenticación más confiable.
Versión 0.9.0 (22 de enero de 2025)
Nuevas Funciones
Limpieza Automática de Datos
- Gestión de Almacenamiento: Los hilos y archivos adjuntos antiguos se limpian automáticamente según sus preferencias de retención
- Políticas Configurables: Establezca cuánto tiempo conservar los datos antes de la limpieza automática
Sincronización con GitHub
- Copia de Seguridad en GitHub: Sincronice sus datos de Caiioo con un repositorio de GitHub para copias de seguridad y acceso desde múltiples dispositivos
- Resolución Inteligente de Conflictos: Los cambios de múltiples dispositivos se fusionan automáticamente sin pérdida de datos
- Sincronización Selectiva: Controle qué datos se sincronizan con patrones al estilo
.gitignore
Herramienta de GitHub
- Integración de IA con GitHub: La IA ahora puede interactuar con GitHub en su nombre: crear problemas, navegar por repositorios, gestionar solicitudes de extracción y más
- Navegación por Repositorios: Pida a la IA que explore bases de código, encuentre archivos y comprenda la estructura del proyecto
Mejoras
Automatización del Navegador
- Interacción de Página Mejorada: Clics, desplazamientos y llenado de formularios más confiables en páginas web complejas
- Selección de Herramientas más Inteligente: La IA ahora elige las herramientas adecuadas para cada tarea con mayor precisión
Manejo de Documentos
- Mejores Documentos de Word: Manejo mejorado de tablas, listas y formato en archivos DOCX
- Google Slides: Más control sobre el formato de las diapositivas, formas y diseños
Configuración e IU
- Panel de Configuración Ampliado: Más opciones de configuración con mejor organización
- Lista de Hilos Mejorada: Mejor clasificación y filtrado de sus conversaciones
- Permiso de Ubicación: Flujo más claro al otorgar acceso a la ubicación para consultas basadas en la ubicación
Versión 0.8.9 (19 de enero de 2025)
Nuevas funciones
Integración con Google Slides
- Presentaciones impulsadas por IA: La nueva herramienta de Google Slides permite a la IA crear, leer y modificar presentaciones de diapositivas
- Control total de diapositivas: Cree diapositivas, agregue cuadros de texto, imágenes, formas y tablas
- Soporte de plantillas: Use plantillas integradas o trabaje desde presentaciones en blanco
- Edición colaborativa: Funciona con su conexión de cuenta de Google existente
Mejoras
Calidad del código
- Correcciones de TypeScript: Se limpiaron errores de tipo e importaciones no utilizadas en toda la base de código
- Cobertura de pruebas: Se actualizaron las pruebas para que coincidan con las definiciones de tipo actuales
Versión 0.8.8 (17 de enero de 2025)
Nuevas funciones
Texto a voz de Resemble.ai
- Síntesis de voz profesional: Nueva integración de Resemble.ai para generación de voz por IA de alta calidad
- Audio en streaming: Streaming de audio en tiempo real para una salida de voz receptiva
- Voces configurables: Seleccione entre múltiples opciones de voz profesional
- Advertencias de truncamiento: Comentarios claros cuando el texto largo se trunca para la síntesis
Servicio de sincronización de calendario
- Sincronización en segundo plano: Sincronización automática de calendario con Google Calendar
- Actualizaciones incrementales: Solo se sincronizan los eventos modificados para mayor eficiencia
- Programación basada en alarmas: Programación de sincronización fiable mediante alarmas de Chrome
Mejoras
Aplicación de escritorio (Electron)
- Detección de activación: El sistema ahora detecta cuando su Mac se activa del modo de reposo y actualiza los tokens OAuth automáticamente
- Fiabilidad mejorada: Las conexiones OAuth permanecen frescas incluso después de periodos de reposo prolongados
Entrada del compositor enriquecido
- Composición mejorada: Entrada de mensaje mejorada con mejor soporte de formato
- Autocompletado con Tab: Sugerencias de referencia de pestañas más receptivas
Version 0.8.71 (15 de enero de 2025)
Nuevas Funcionalidades
Thread Search
- Busque en sus conversaciones: Nuevo cuadro de búsqueda en la lista de hilos para encontrar rápidamente hilos por título o contenido.
- Filtrado instantáneo: Escriba para filtrar; los hilos coincidentes aparecen de inmediato con resaltado de búsqueda.
- Smart Debouncing: La búsqueda está optimizada para no presentar retrasos incluso con cientos de hilos.
Physics Simulation Tool
- Física impulsada por AI: Nueva herramienta de física que permite a la AI realizar cálculos y simulaciones físicas.
- Movimiento de proyectiles: Calcule trayectorias, prediga colisiones y resuelva problemas de movimiento.
- Análisis estructural: Analice el estrés, la flexión de vigas, el pandeo y la estabilidad de las estructuras.
- Propiedades de materiales: Base de datos integrada de materiales de ingeniería comunes (acero, aluminio, madera, hormigón, etc.).
- Fórmulas físicas: Cálculos de energía cinética, momento, fuerza e impulso.
Mejoras en Cairn World Builder
- Motor de física: Integración completa de física Rapier3D para simulaciones realistas.
- Articulaciones y restricciones: Cree bisagras, deslizadores, rótulas y conexiones fijas entre cuerpos.
- Sensores y activadores: Defina regiones de sensores que detectan cuando los objetos entran o salen.
- Controlador de personajes: Personaje en primera persona con gravedad, salto y respuesta a colisiones.
- Modo de juego: Física en tiempo real con paso de tiempo fijo para exploración interactiva.
Mejoras
Private Sync v2
- Sincronización incremental: Cada hilo y archivo adjunto se sincroniza ahora individualmente en lugar de como un único archivo grande.
- Sincronización más rápida: Solo se cargan los elementos modificados, lo que reduce drásticamente el tiempo de sincronización para bibliotecas grandes.
- Mejor manejo de conflictos: Los relojes vectoriales por elemento permiten una resolución de fusiones más precisa.
- Reducción de llamadas a la API: El diffing inteligente significa menos solicitudes a la API de Google Drive.
Fiabilidad de sincronización
- Paridad Extensión/Servidor: Se corrigió el almacenamiento de archivos adjuntos para rastrear correctamente los relojes vectoriales en ambas plataformas.
- Filtrado de Tombstones: Los perfiles eliminados ahora se ocultan correctamente tanto en la extensión como en el servidor.
Versión 0.8.70 (14 de enero de 2025)
Nuevas funciones
Sincronización privada (Nivel GRATIS)
- Sincronización entre dispositivos: Sincroniza tus hilos, configuraciones y archivos adjuntos en todos tus dispositivos a través de Google Drive.
- Cifrado de extremo a extremo: Todos los datos sincronizados se cifran con tu frase de contraseña antes de salir de tu dispositivo.
- Sincronización automática en segundo plano: Los cambios se sincronizan automáticamente cada 30 segundos con un debounce inteligente.
- Resolución de conflictos: Los relojes vectoriales estilo CRDT aseguran que los cambios se fusionen correctamente entre dispositivos.
Mejoras
Eficiencia de la sincronización privada
- Polling reducido: El intervalo de sincronización aumentó de 3s a 30s para reducir las llamadas a la API.
- Debounce inteligente: Espera 10 segundos después de que los cambios se asienten antes de sincronizar.
- Protección durante el proceso: Los hilos que están siendo procesados activamente por la IA se excluyen de la sincronización hasta que se completen.
Versión 0.8.69 (14 de enero de 2025)
Nuevas funciones
Navegación de revisiones de Slate
- Navegar entre cambios: Nuevos botones de navegación para saltar entre fragmentos de revisión pendientes en el editor
- Contador de cambios: El indicador visual muestra la posición actual (por ejemplo, "2 de 5") dentro de las revisiones pendientes
- Atajos de teclado: Use Alt+Arriba/Abajo para navegar rápidamente entre fragmentos sin dejar el teclado
Mejoras
Procesamiento de documentos
- Respaldo de OCR remoto: Cuando la extracción de texto PDF local falla o produce resultados deficientes, los documentos se procesan automáticamente mediante OCR en la nube para mejorar la precisión
- Estado de procesamiento: Los comentarios en tiempo real muestran cuándo se están procesando los documentos de forma remota
Soporte de modelos de razonamiento
- Razonamiento de múltiples turnos: Mejor almacenamiento en caché de los detalles de razonamiento en los turnos de conversación, mejorando la continuidad para modelos de pensamiento extendido
- Mensajes más limpios: Las notas internas del sistema ahora se eliminan de los mensajes renderizados, evitando la fuga de instrucciones
Versión 0.8.68 (11 de enero de 2025)
Nuevas funciones
Memoria a largo plazo
- Persistencia de contexto: La IA ahora mantiene una memoria a largo plazo entre conversaciones, recordando contexto importante sobre tus preferencias y flujos de trabajo
- Seguimiento de uso: Seguimiento mejorado del uso de tokens y costos con registros detallados
Inteligencia de modelos
- Selección inteligente de modelos: Las nuevas funciones de inteligencia de modelos ayudan a identificar los modelos óptimos según tus patrones de uso
- Sistema de clasificación: Los modelos se clasifican según métricas de rendimiento y valor
Mejoras
Fiabilidad del almacenamiento
- Almacenamiento multiplataforma: La caché de modelos, las aprobaciones de herramientas y las páginas aprendidas ahora funcionan de forma fiable en los modos de extensión, servidor y LAN
- Tiempo de espera de autenticación: Se corrigió un posible bloqueo al conectar con el servidor de retransmisión; ahora el tiempo de espera es de 5 segundos en lugar de esperar indefinidamente
- Velocidad de carga de ajustes: Los ajustes y el selector de modelos ahora se cargan más rápido tras recargar la extensión
Paginación de contenido
- Tamaño de página adecuado: El contenido de las páginas web ahora se divide según la ventana de contexto real del modelo (p. ej., 131k tokens), no un valor predeterminado fijo. Esto significa que verás fragmentos de página más grandes y menos páginas al usar modelos de contexto alto.
Corrección de errores
- Persistencia de clave API: Se corrigió el problema por el cual la clave API de OpenRouter se "olvidaba" después de activar y desactivar brevemente el modo LAN
Versión 0.8.67 (7 de enero de 2025)
Nuevas funciones
Kokoro TTS - Texto a voz neuronal local
- Voces de alta calidad: Kokoro es un modelo de TTS neuronal local con voz natural en múltiples voces
- No requiere clave API: Se ejecuta completamente en el dispositivo usando WebGPU/WASM; no necesita servicios en la nube ni claves API
- Múltiples voces: Elige entre opciones de acento estadounidense, británico y otros con variantes masculinas/femeninas
- Soporte para texto largo: Maneja correctamente textos largos mediante síntesis en streaming; sin cortes a los 30 segundos
- Voz limpia: Elimina automáticamente el formato markdown (negrita, cursiva, etc.) antes de hablar
Mejoras
Ajustes de voz
- Sección de voz unificada: Ajustes de TTS y STT consolidados en un diseño más limpio
- Vista previa de voz: Prueba la voz seleccionada antes de usarla
Versión 0.8.66 (7 de enero de 2025)
Mejoras
Búsqueda en el panel de ajustes
- Búsqueda con filtros: Nuevo cuadro de búsqueda en la parte superior de Ajustes para filtrar rápidamente las secciones por palabra clave
- Resultados instantáneos: Escribe para filtrar; las secciones coincidentes aparecen inmediatamente
- Amigable con el teclado: La búsqueda se enfoca automáticamente al abrir los ajustes
Fiabilidad del servidor MCP
- Verificación de inicio: Los servidores MCP ahora se verifican como en ejecución antes de devolver el éxito
- Mejores mensajes de error: Cuando los servidores MCP fallan durante el inicio, se muestra el error real en lugar de un fallo genérico
- Ejemplos corregidos: Se corrigieron los nombres de paquetes de ejemplo para usar
@modelcontextprotocol/server-*(no@anthropic/mcp-server-*)
Autenticación de la aplicación macOS
- Tokens de autovalidación: Se corrigieron los errores 401 al añadir servidores MCP antes de la sincronización del estado de WebSocket
- Autenticación más rápida: Los puntos finales HTTP ya no requieren esperar a la conexión WebSocket
Versión 0.8.65 (6 de enero de 2025)
Nuevas Funciones
Integración de Voz de ElevenLabs (BYOK)
- TTS en la Nube: Texto a voz de alta calidad utilizando ElevenLabs; elija entre múltiples voces y modelos
- STT en la Nube: Transcripción Scribe con transmisión en tiempo real (latencia de ~150 ms) y soporte para más de 90 idiomas
- Selección de Voz: Explore y seleccione de la biblioteca de voces de ElevenLabs directamente en Configuración
- Opciones de Modelo: Elija entre Flash v2.5 (ultrarrápido ~75 ms), Turbo v2.5 o Multilingual v2 (mejor calidad)
- Traiga su propia clave: Utiliza su clave de API de ElevenLabs; sin costo adicional por parte de Caiioo
Modelo Whisper Multilingüe
- Whisper Tiny Multilingual: Nueva opción de STT local que admite 99 idiomas (descarga de ~39 MB)
- Mismo tamaño que la versión solo en inglés: Mismo tamaño compacto de 39 MB que Whisper Tiny English
- Detección de Idioma: Detecta automáticamente el idioma hablado
Lectura y Escritura Mejoradas en Google Docs
- Markdown por Defecto: El texto ahora se formatea como markdown por defecto al escribir. Use
useMarkdown: falsepara inserciones de texto plano que preserven el formato existente. - Formato Enriquecido: Convierte encabezados de markdown, negrita, cursiva, tachado y enlaces a estilos nativos de Google Docs
- Listas y Tablas: Admite listas ordenadas/desordenadas con anidamiento y tablas de markdown
- Seguimiento de Sugerencias: Las sugerencias pendientes se muestran con etiquetas semánticas:
<ins>texto añadido</ins>para inserciones,<del>texto eliminado</del>para eliminaciones. Las etiquetas adyacentes indican reemplazos. - Comentarios en Línea: Los comentarios aparecen en línea con atribución de autor:
<comment author=\"Nombre\" on=\"texto citado\">contenido</comment>con etiquetas<reply>anidadas para hilos
Mejoras
Pensamiento Extendido de Gemini
- Firmas de Pensamiento Mejoradas: Mejor manejo de la firma de pensamiento de Gemini a través de fragmentos de transmisión, mejorando la continuidad del pensamiento extendido con el uso de herramientas en múltiples turnos
Versión 0.8.64 (5 de enero de 2025)
Nuevas funciones
Metadatos de celdas en Google Sheets
- Leer hipervínculos y notas: Utilice
includeMetadata: truepara recuperar hipervínculos, notas y reglas de validación de datos de las celdas - Añadir hipervínculos: Nueva acción
update_cell_metadatapara añadir hipervínculos clicables con texto de visualización personalizado - Añadir notas: Adjunte notas/comentarios a las celdas mediante programación
- Validación de datos: Cree menús desplegables, rangos numéricos, validación de texto y reglas de fórmulas personalizadas en las celdas
Mosaico en Safari (macOS)
- Posicionamiento inteligente de ventanas: Al abrir enlaces desde el panel lateral, las ventanas de Safari se posicionan automáticamente junto al panel lateral para facilitar la navegación lado a lado
- Optimización del espacio en pantalla: La lógica de mosaico calcula la ubicación óptima de Safari según el espacio disponible en pantalla
- Reajuste de mosaico al cambiar de modo: Las ventanas de Safari se reposicionan automáticamente cuando el panel lateral cambia de modo
Copiar/Pegar en el panel lateral de macOS
- Soporte completo de copiar/pegar: Copiar y pegar ahora funciona de forma fiable en la aplicación del panel lateral de macOS
- Atajos de teclado del sistema: Los atajos estándar ⌘C/⌘V funcionan como se espera
Mejoras
Fiabilidad del servidor en macOS
- Gestión de señales: Mejora en la gestión de señales de tubería (pipe signals) para evitar la terminación inesperada de la aplicación
- Fiabilidad de reinicio: Las operaciones de parada y reinicio del servidor son ahora más fiables con una limpieza adecuada
- Estabilidad de la conexión: Mejor gestión de la actualización de tokens OAuth con lógica de reintento y retroceso exponencial
Extensión de Safari
- IDs de navegador estables: La extensión de Safari ahora genera IDs de navegador estables para evitar entradas duplicadas durante las reconexiones
- Reconexión más limpia: El registro del navegador en el lado del servidor utiliza IDs estables proporcionados por el cliente para una gestión de reconexión más limpia
Selector de modelos
- Desplazamiento al elemento seleccionado: Al abrir el menú desplegable de modelos, ahora se desplaza automáticamente al modelo seleccionado actualmente
Referencias de pestañas en la aplicación de macOS
- Funciona en el panel lateral: Las referencias de pestañas y el contexto ahora funcionan en el panel lateral nativo de macOS, no solo en la extensión de Chrome
Versión 0.8.63 (31 de diciembre de 2025)
Nuevas Funciones
Salida de Voz (Texto a Voz)
- Leer en voz alta: Las respuestas de la IA ahora se pueden leer en voz alta utilizando Microsoft Edge TTS
- Opción de Reproducción Automática: Habilite la lectura automática de nuevas respuestas de IA en Configuración
- Control de Velocidad: Ajuste la velocidad de reproducción de 0.5x a 2x
- Pausa/Reanudación: Controle la reproducción con botones de pausa y reanudación en cada mensaje
Voz a Texto Local (Whisper)
- Actualización de Whisper: Opte por la transcripción local de Whisper para una entrada de voz más precisa
- Descarga de Modelo: Descargue el modelo Whisper Tiny (~40 MB) para uso sin conexión
- Privacidad: El audio se procesa localmente, nunca se envía a servidores externos
- Respaldo: Recurre a la Web Speech API si Whisper no está disponible
Herramienta de Agenda Unificada
- Herramienta Única: La nueva herramienta
agendaconsolida las operaciones de calendario y recordatorios - Multi-proveedor: Funciona con Google Calendar, Apple Calendar, Apple Reminders y recordatorios de Caiioo
- Más Simple para Agentes: Una interfaz de herramienta para todas las necesidades de programación
Mejoras
Panel de Configuración
- Estado de Plegado Persistente: Los estados abierto/cerrado de las secciones ahora se recuerdan entre sesiones
- Configuración de Voz: Nueva sección para configurar las preferencias de TTS y STT
Versión 0.8.62 (31 de diciembre de 2025)
Nuevas funciones
Soporte de listas DOCX
- Listas numeradas: Los documentos de Word con listas numeradas ahora se renderizan correctamente con el formato adecuado
- Listas con viñetas: Las listas con viñetas se conservan y muestran con precisión
- Listas anidadas: La sangría de listas de varios niveles se mantiene en la vista previa HTML
Exportación CSV para hojas de cálculo
- Exportar como CSV: Los archivos XLSX ahora se pueden exportar como CSV para facilitar la extracción de datos
- Selección de formato: Elige entre XLSX o CSV al descargar archivos adjuntos de hojas de cálculo
Versión 0.8.61 (30 de diciembre de 2025)
Nuevas funciones
Flujo de trabajo de aprobación de herramientas
- Aprobación interactiva: Ciertas herramientas ahora requieren la aprobación del usuario antes de ejecutarse; verá un modal solicitando aprobar o denegar la acción
- Seguimiento de estado: Las ejecuciones de herramientas ahora muestran los estados 'pendiente de aprobación' y 'denegado' en la línea de tiempo
- Seguro por defecto: Las operaciones sensibles esperan el consentimiento explícito del usuario antes de proceder
Variable de ubicación actual
- {{currentLocation}}: Nueva variable para añadir el contexto de su ubicación actual a los prompts
- Permiso de geolocalización: Requiere permiso de geolocalización del navegador cuando se utiliza por primera vez
- Consciente del contexto: Ideal para consultas basadas en la ubicación como "restaurantes cerca de mí" o planificación de viajes
Gestión de hilos por lotes
- Modo de selección múltiple: Active el modo de selección para elegir varios hilos a la vez
- Eliminación por lotes: Elimine los hilos seleccionados en una sola acción
- Archivo/Exportación por lotes: Archive o exporte múltiples hilos simultáneamente
Visor de imágenes en Slate
- Visor dedicado: Las imágenes ahora se abren en un visor de pantalla completa dentro de Slate
- Controles de zoom: Acerque/aleje y desplácese por imágenes grandes
- Opción de descarga: Botón de descarga rápida para guardar imágenes localmente
Mejoras
Visualización de razonamiento
- Mejor agregación: Los bloques de pensamiento/razonamiento del modelo ahora se combinan correctamente sin duplicación
- Visualización más limpia: El contenido de razonamiento de los modelos de pensamiento extendido se muestra de forma más fiable
Integración con Ollama
- Razonamiento en streaming: Streaming en tiempo real del contenido de razonamiento/pensamiento de los modelos locales de Ollama
- Mejor manejo de modelos: Compatibilidad mejorada con modelos Mistral y requisitos estrictos de orden de mensajes
Gestión de archivos adjuntos
- Limpieza de archivos huérfanos: Nuevo diálogo en Configuración para gestionar archivos adjuntos huérfanos que no están vinculados a ningún hilo
- Asignar a hilo: Mueva archivos adjuntos huérfanos a hilos existentes
- Eliminación masiva: Limpie archivos huérfanos para liberar espacio de almacenamiento
Valores predeterminados de Slate
- Markdown por defecto: Al crear un nuevo Slate sin especificar el tipo, markdown (.md) es ahora el formato predeterminado
Versión 0.8.6 (19 de diciembre de 2025)
Nuevas funciones
Acción de espera para automatización del navegador
- Tipos de espera discretos: Nueva acción
waiten la automatización del navegador con 4 modos de espera especializados:timeout- Retraso simple (predeterminado 1000ms, máx 30000ms) para temporización básicaselector- Esperar a que un elemento aparezca o desaparezca (útil para spinners/cargadores)network_idle- Esperar a que las solicitudes fetch/XHR se estabilicen (solo extensión)animation- Esperar a que las animaciones y transiciones CSS se completen
- Visibilidad inteligente de elementos: La espera por selector verifica display, visibility, opacity y offsetParent para una detección precisa de visibilidad
Mejoras
Arquitectura de automatización del navegador
- Ejecución de scripts unificada: La nueva abstracción
executeInPagegarantiza un comportamiento consistente en los contextos de extensión de Chrome y retransmisión/servidor - Ejecución en el mundo MAIN: Ejecución adecuada de scripts en el mundo MAIN para operaciones que necesitan interceptar JavaScript a nivel de página (fetch, XHR)
- Degradación elegante: Las funciones exclusivas de la extensión ahora proporcionan mensajes de error útiles con alternativas cuando se usan en modo retransmisión
Corrección de errores
Actualización de token OAuth
- Actualización de token de extensión de Chrome: Se corrigió el problema de tokens obsoletos donde los tokens OAuth en caché de Chrome no se actualizaban correctamente. Los tokens ahora se verifican y los obsoletos se borran antes de reintentar.
- Flujo de autorización PKCE: La ventana emergente de OAuth ahora usa el flujo de código de autorización con PKCE en lugar del flujo implícito, permitiendo el soporte adecuado de tokens de actualización sin requerir un secreto de cliente.
- Actualización directa de token: Las conexiones con tokens de actualización ahora se pueden actualizar directamente usando el punto final de token de Google, sin requerir un servidor backend.
- Validación de token: Se añadió un paso de verificación de token para detectar tokens revocados/inválidos pronto y activar la reautenticación automática.
Versión 0.8.5 (19 de diciembre de 2025)
Nuevas funciones
Integración con Apple Calendar
- Acceso nativo al calendario: La nueva herramienta Apple Calendar proporciona un acceso nativo y rápido a tus calendarios de macOS a través de EventKit
- Agenda unificada: Vista combinada de recordatorios y eventos de calendario de todas las cuentas conectadas (Google Calendar + Apple Calendar)
- Soporte multicuenta: Extrae eventos de múltiples cuentas de Google Calendar y calendarios de Apple simultáneamente
Páginas aprendidas (Learned Pages)
- Aprendizaje inteligente de páginas: Enseña a Caiioo sobre sitios web específicos capturando su estructura
- Coincidencia de patrones de URL: Los patrones aprendidos se aplican automáticamente a páginas similares en el mismo sitio
- Almacenamiento de instantáneas DOM: Las estructuras de página capturadas ayudan a la IA a comprender mejor e interactuar con aplicaciones web complejas
Soporte para documentos RTF
- Edición de texto enriquecido: Carga y edita documentos RTF (Rich Text Format) directamente en Slate
- Conversión bidireccional: Convierte entre RTF y HTML manteniendo el formato
- Opciones de exportación: Descarga documentos editados como RTF para usar en Pages, Word u otros procesadores de texto
Mejoras
Seguridad de la aplicación de escritorio
- Autenticación de relevo (Relay): Autenticación segura HMAC-SHA256 entre la extensión y el servidor de escritorio
- Tokens por usuario: Los tokens de autenticación ahora están vinculados a la identidad del usuario para seguridad multiusuario
- Endpoints protegidos: Todos los endpoints sensibles de la API ahora requieren autenticación
Rendimiento
- Ayudantes en Swift: Binarios nativos en Swift para Apple Reminders, Calendar y Notes proporcionan un acceso 10 veces más rápido que AppleScript
- Llamadas directas: Al ejecutarse en el contexto de escritorio, las herramientas de Apple omiten el relevo HTTP para una menor latencia
- Utilidades compartidas: El cliente de API de relevo consolidado elimina la duplicación de código
Corrección de errores
- Deduplicación de eventos de calendario: Los eventos que aparecen en múltiples calendarios ahora se deduplican correctamente en la vista unificada
- Caché de prompts: Se corrigió el error por el cual los marcadores de control de caché se eliminaban durante la estimación de tokens
Versión 0.8.45 (18 de diciembre de 2025)
Nuevas funciones
- Deduplicación de imágenes: Cuando subes la misma imagen varias veces en una conversación, la IA ahora la reconoce como duplicada y hace referencia a la original en lugar de procesarla de nuevo. Esto ahorra tokens de contexto y ayuda a la IA a entender que te refieres a la misma imagen.
Mejoras
- Deduplicación de documentos: Coincidencia de documentos entre fuentes mejorada; el mismo contenido de documento ahora se reconoce tanto si proviene de una carga de usuario, un archivo adjunto de Gmail o la ingesta de una página web.
Corrección de errores
- Errores de autenticación PDF: Se corrigió el problema donde los errores de autenticación (401, 403) al obtener PDFs protegidos se enmascaraban como fallos de extracción genéricos. El error de autenticación real ahora se muestra correctamente con orientación útil.
Versión 0.8.44 (18 de diciembre de 2025)
Corrección de errores
- Botón Recargar/Regenerar: Se corrigió el problema donde hacer clic en recargar en un mensaje del asistente mostraba la respuesta antigua en lugar de la nueva que se estaba generando. La interfaz ahora cambia correctamente a la nueva rama durante el streaming.
Mejoras
- Gestión de la ventana de contexto: Ahora se utiliza una estimación de tokens más conservadora (3 caracteres/token) de forma consistente en todos los cálculos de paginación y contexto, reduciendo la posibilidad de errores de desbordamiento de contexto con páginas web grandes.
Versión 0.8.43 (17 de diciembre de 2025)
Mejoras
Visualización de línea de tiempo y razonamiento
- Colapso automático al finalizar: Los bloques de razonamiento y la línea de tiempo del proceso ahora se colapsan automáticamente cuando termina la generación, manteniendo la conversación limpia pero accesible
- Pensamientos intermedios visibles: El "pensar en voz alta" del agente entre llamadas a herramientas ahora se muestra en línea en la línea de tiempo, dando una mejor visión del proceso de toma de decisiones del agente
- Etiquetas de acción de herramienta: Las llamadas a herramientas ahora muestran la acción específica en la etiqueta (p. ej., "Web Browse → click" en lugar de solo "Web Browse")
Resultados de herramientas
- Corrección de visualización de capturas de pantalla: Las capturas de pantalla e imágenes ya no se expanden automáticamente en los resultados de las herramientas; solo el contenido de texto renderizado (como los resultados de búsqueda) se expande automáticamente
Corrección de errores
- CORS de Ollama: Se corrigieron los problemas de conexión al usar Ollama desde la extensión de Chrome; los encabezados CORS ahora se manejan automáticamente
Versión 0.8.41 (15 de diciembre de 2025)
Mejoras
- Seguridad de Tipos: El adaptador de almacenamiento del servidor ahora usa tipos de TypeScript adecuados en lugar de
anypara hilos, habilidades, perfiles, servidores MCP e información de licencia - Sistema de Construcción: El directorio de respaldo ahora es opcional mediante la variable de entorno
caiioo_BACKUP_DIR(ya no está codificado)
Versión 0.8.4 (15 de diciembre de 2025)
Nuevas funciones
Soporte para imágenes DNG/RAW
- Archivos RAW de cámara: Suba archivos DNG (Digital Negative) directamente desde su cámara o biblioteca de fotos
- Extracción automática de vista previa: Las vistas previas JPEG integradas se extraen de los archivos RAW para un procesamiento rápido
- Preservar calidad original: Los datos RAW originales se conservan mientras la IA trabaja con la vista previa de alta calidad
Manejo mejorado de imágenes
- Compresión del lado del servidor: Las imágenes grandes que exceden los límites de compresión local ahora son procesadas por el servidor de escritorio
- Mejor retroalimentación de errores: Indicadores visuales de error (borde rojo, icono de alerta) cuando falla el procesamiento de imágenes
- Respaldo elegante: La compresión vuelve automáticamente al servidor cuando el documento fuera de pantalla no está disponible
Mejoras
- Arquitectura de agente compartido: Ejecutor de agente unificado compartido entre la extensión y el servidor de escritorio para un comportamiento consistente
- Consolidación del manejador de protocolos: El almacenamiento y el manejo de mensajes ahora utilizan manejadores de protocolos compartidos
Versión 0.8.3 (13 de diciembre de 2025)
Nuevas funciones
Aplicaciones móviles nativas
- Aplicación Android: Aplicación Kotlin nativa (
android-app/) con WebView + canales de puente nativos (CalendarContract, SAF/selector de fotos, AlarmManager, streaming OkHttp). - Interfaz compartida: Las aplicaciones móviles utilizan la misma interfaz React que la extensión web para una experiencia consistente.
- iOS + Android: Swift nativo (iOS) y Kotlin nativo (Android) con APIs de puente coincidentes.
Mejoras
- Sincronización de identidad: Mejora en la sincronización de datos de licencia y perfil entre la extensión y el servidor de escritorio.
- Gestión de archivos adjuntos: Mejor manejo de archivos adjuntos en modo LAN/relay.
- Seguimiento del cliente de extensión: El servidor de escritorio ahora rastrea los clientes de extensión conectados con marcas de tiempo.
Eliminado
- Aplicación Swift Relay: La funcionalidad de relay en macOS ahora es manejada completamente por el servidor de la aplicación nativa (introducido en 0.8.2).
Versión 0.8.2 (12 de diciembre de 2025)
Nuevas funciones
Servidor de escritorio multiplataforma
- Servidor Caiioo: La nueva aplicación de escritorio basada en Electron reemplaza la aplicación de relevo Swift exclusiva para macOS
- Soporte para Windows: Instalador nativo de Windows (NSIS) y ejecutable portátil
- Soporte para Linux: Paquetes AppImage y .deb para distribuciones de Linux
- Integración en la barra de menú: Aplicación en la bandeja del sistema/barra de menú con indicadores de estado y controles rápidos
Ejecución de scripts específica por plataforma
- API de scripts unificada: El nuevo endpoint
/api/scriptdetecta automáticamente la plataforma y utiliza el motor de scripts adecuado - PowerShell en Windows: Ejecuta scripts de PowerShell para la automatización del sistema en Windows
- Bash en Linux: Ejecuta scripts de shell (bash/sh/zsh) en sistemas Linux
- AppleScript en macOS: Se mantiene el soporte existente para AppleScript/JXA
Ayudantes multiplataforma
- Notificaciones de escritorio: Muestra notificaciones utilizando APIs nativas en todas las plataformas
- Acceso al portapapeles: Lee y escribe el contenido del portapapeles de forma multiplataforma
- Detección de ventana activa: Obtiene la aplicación en primer plano y el título de la ventana
- Información del sistema: Recupera información del SO, CPU y memoria
Mejoras
- Flujo de compilación automatizado: La versión, los iconos y las licencias se sincronizan desde el proyecto principal durante la compilación
- Distribución más ligera: Se eliminaron bases de código redundantes de aplicaciones móviles en preparación para compilaciones unificadas
Versión 0.8.1 (11 de diciembre de 2025)
Nuevas funciones
Opciones flexibles de inicio de sesión
- Múltiples métodos de autenticación: Inicie sesión con Google OAuth, correo electrónico/contraseña o clave de licencia: elija lo que mejor le funcione
- Vinculación de cuentas: Vincule su cuenta de Google a una cuenta de correo electrónico/contraseña existente para un acceso fluido entre métodos
OAuth personalizado para servidores MCP
- Traiga sus propias credenciales OAuth: Para servidores MCP que requieren clientes OAuth pre-registrados, ahora puede proporcionar su propio ID de cliente y secreto
- Actualización dinámica de tokens: Los tokens OAuth se actualizan automáticamente, asegurando conexiones ininterrumpidas a los servidores MCP
Mejoras
- Indicadores de procesamiento de documentos: Indicadores visuales claros al procesar archivos PDF, Word y hojas de cálculo de Excel
- Navegación de configuración por nivel: El panel de configuración ahora muestra de forma inteligente las opciones relevantes según su nivel de suscripción
- Mejor manejo de errores OAuth: Mensajes de error mejorados cuando falla la detección de OAuth del servidor MCP
Version 0.8.0 (10 de diciembre de 2025)
Nuevas Funcionalidades
Navegador y Gestión de Servidores MCP
- Explorar Servidores MCP: Busque e instale servidores MCP tanto del MCP Registry como de npm directamente dentro de Settings.
- Servidores MCP Locales: Ejecute servidores MCP localmente en su máquina a través de la relay app para mayor privacidad y control.
- Resolución de Credenciales: Los servidores MCP ahora pueden extraer credenciales del Credentials Vault para una autenticación segura.
- Monitoreo de Salud: Verificaciones automáticas de estado para los servidores MCP conectados con indicadores de estado.
Gestión de Perfiles
- Múltiples Perfiles: Cree y cambie entre múltiples perfiles de usuario.
- Selector de Perfiles: Menú desplegable de fácil acceso para cambiar perfiles en el composer.
- Eliminación de Perfiles: Elimine los perfiles que ya no necesite.
Selección de Cuenta de Google
- Diálogo de Elección de Cuenta: Al conectar servicios de Google, elija entre su cuenta de perfil de Chrome o añada una cuenta de Google diferente.
- Flujo OAuth Web: Opción para autenticarse a través del navegador web para cuentas que no han iniciado sesión en Chrome.
Browser Agent Mejorado
- Acción de Retroceso: El agente ahora puede navegar hacia atrás en el historial del navegador.
- ARIA Snapshot: Captura instantáneas del árbol de accesibilidad para un análisis de página más eficiente con menos tokens.
Aplicaciones Móviles
- App para iOS: Cliente nativo de iOS para acceder a Caiioo en su red local.
- App para Android: Cliente nativo de Android con descubrimiento de servidores y almacenamiento en caché de WebView.
Sincronización Multi-dispositivo
- Identidad del Dispositivo: Cada dispositivo/extensión conectado se rastrea con su propia identidad.
- Sincronización de Estado: Sincronización de estado en tiempo real a través de múltiples extensiones conectadas.
- Autenticación de Cliente Web: Autenticación segura para clientes web que se conectan al relay.
Mejoras
- Gestión de Claves de Proveedores LLM: Gestione las API keys para varios proveedores de LLM directamente en el Credentials Vault.
- Imágenes de Herramientas MCP: Las herramientas MCP que devuelven imágenes ahora se muestran insertadas en la conversación.
- Detección de Texto en PDF: Mejora en la detección de texto distorsionado o con espacios excesivos en la extracción de PDF con evaluación de confianza.
- Bypass de CORS para Imágenes: Las imágenes ahora se obtienen a través de un documento offscreen para omitir las restricciones de CORS.
Corrección de Errores
- Seguimiento del Estado de Generación: Mejora en la captura del estado final para garantizar que la finalización de la generación se detecte con precisión.
Versión 0.7.8 (7 de diciembre de 2025)
Nuevas funciones
Soporte para hojas de cálculo de Excel
- Importación de XLSX: Carga hojas de cálculo de Excel (.xlsx) directamente a tus conversaciones
- Extracción de datos: El contenido de la hoja de cálculo se analiza y se pone a disposición de la IA para su análisis
- Edición de ida y vuelta: Edita hojas de cálculo en Slate y expórtalas de nuevo al formato XLSX
Diálogo "Novedades"
- Notificaciones de actualización: Después de actualizar Caiioo, un diálogo de "Novedades" muestra automáticamente las notas de la versión para la nueva versión
- Notas específicas de la versión: Mira exactamente qué cambió en tu actualización, con listas de funciones y mejoras formateadas
- No intrusivo: El diálogo solo aparece una vez por actualización y no se muestra en la primera instalación
Versión 0.7.6 (3 de diciembre de 2025)
Nuevas funciones
Compatibilidad con documentos de Word con control de cambios
- Importación DOCX: Sube documentos de Word (.docx) directamente a tus conversaciones
- Control de cambios visible: Visualiza inserciones (verde) y eliminaciones (tachado rojo) con autor y fecha al pasar el cursor
- Compatibilidad con comentarios: Los comentarios se resaltan en amarillo con información sobre herramientas que muestra el texto y el autor
- Edición en Slate: Visualiza y edita el contenido DOCX en Slate con todo el estilo de control de cambios
- Compatibilidad con modo oscuro: Todos los estilos de control de cambios y comentarios funcionan tanto en temas claros como oscuros
Versión 0.7.4 (2 de diciembre de 2025)
Nuevas funciones
Generador de imágenes FLUX
- Generación de imágenes por IA: Genera imágenes a partir de descripciones de texto usando modelos FLUX AI a través de OpenRouter
- Edición de imágenes: Edita imágenes existentes en tu conversación proporcionando el ID del archivo adjunto y las instrucciones de edición
- Compatibilidad con referencias múltiples: Combina elementos de hasta 10 imágenes con el modelo flux.2-flex
- Modelos múltiples: Elige entre flux.2-pro (rápido, predeterminado) o flux.2-flex (calidad máxima)
- Almacenamiento automático: Las imágenes generadas se guardan en tu conversación y se muestran en línea
- Seguimiento de costes: Los costes de generación de imágenes se rastrean por separado y se añaden a los totales del hilo
Versión 0.7.3 (1 de diciembre de 2025)
Nuevas funciones
Selector de modelos mejorado
- Selector de modelos unificado: Experiencia de selección de modelos coherente en el compositor y los ajustes
- Indicadores de privacidad: El icono de escudo muestra los modelos con Retención de Datos Cero (ZDR): tus prompts no se usarán para entrenamiento
- Compatibilidad con visión: El icono de ojo indica los modelos que pueden analizar imágenes
- Modelos recomendados: El icono de estrella destaca las opciones recomendadas (Claude Haiku 4.5, Claude Sonnet 4.5)
- Transparencia de costes: Consulta el precio por millón de tokens directamente en la lista de modelos; identifica fácilmente los modelos GRATIS
- Leyenda de iconos: Referencia rápida en los ajustes que explica el significado de cada indicador
Versión 0.7.2 (1 de diciembre de 2025)
Nuevas funciones
Ingesta de documentos PDF
- Sube PDFs directamente: Adjunta documentos PDF a tus mensajes; se procesan automáticamente mediante OCR de Mistral
- Extracción de texto de alta calidad: Tablas, figuras, ecuaciones y formato se conservan como Markdown
- Ingesta de documentos por agentes: Los agentes pueden procesar URLs de PDF que encuentren mientras navegan usando la nueva acción
ingest_document - Almacenamiento persistente: El contenido extraído se guarda para futuras consultas sin costes de reprocesamiento
Corrección de errores
- Archivos adjuntos de imágenes grandes: Las imágenes de más de 5 MB ahora se comprimen automáticamente antes de enviarse a las API de LLM, solucionando los errores de "la imagen supera el máximo de 5 MB" con proveedores como Google/Gemini
Versión 0.7.0 (1 de diciembre de 2025)
Nuevas funciones
Compatibilidad con hilos múltiples
- Ejecuta varios agentes simultáneamente: Ahora puedes tener hasta 3 hilos ejecutándose al mismo tiempo
- Indicadores visuales de ejecución: Aparecen puntos animados junto a los títulos de los hilos en la barra lateral cuando ese hilo está generando activamente
- Procesamiento en segundo plano: Los agentes trabajan en segundo plano sin robar el foco; navega libremente mientras trabajan
- Aislamiento de hilos: Cada hilo rastrea sus propias pestañas y estado de forma independiente
No interferencia de agentes
- Mantén el control: Cuando un agente abre pestañas o navega por páginas, no robará tu foco si te has movido a una pestaña diferente
- Conciencia inteligente de pestañas: Los agentes solo trabajan con las pestañas que crearon o con las que empezaron, sin seguirte a nuevas pestañas a mitad de la ejecución
Integración con Apple (macOS)
- Notas de Apple: Lee, crea, busca y organiza notas en carpetas; la IA puede ayudar a redactar y editar notas directamente
- Recordatorios de Apple: Gestiona listas de tareas y recordatorios; crea, completa y organiza tareas con la asistencia de la IA
Versión 0.6.5 (30 de noviembre de 2025)
Nuevas funciones
Sugerencias de seguimiento por IA
- Prompts inteligentes: Después de que el asistente responda, aparecen sugerencias de seguimiento generadas por IA para ayudar a continuar la conversación
- Consciente del contexto: Las sugerencias se basan en el contexto de la conversación y en lo que podrías querer hacer a continuación
Mejoras
Ajustes de retransmisión LAN
- Mostrar dirección de red: Cuando se conecta al servidor de retransmisión, los Ajustes ahora muestran la dirección IP real y el nombre de host
.localpara una fácil conexión de dispositivos móviles - Instrucciones simplificadas: La información de conexión aparece automáticamente una vez que el servidor está en marcha; no es necesario consultar el terminal
Versión 0.6.4 (29 de noviembre de 2025)
Corrección de errores
Sistema de revisión de Slate
- Aceptar/Rechazar a nivel de palabra: Los cambios de palabras individuales ahora pueden aceptarse o rechazarse de forma fiable sin romper los cambios posteriores
- Control de cambios estable: Se solucionó el problema por el cual aceptar un cambio hacía que otros cambios pendientes no se pudieran hacer clic
- Renderizado de Markdown en vista previa: Las vistas previas de cambios ahora renderizan el formato markdown (negrita, cursiva, etc.) en lugar de mostrar asteriscos sin procesar
- Corrección de bucle infinito: Se solucionó el bloqueo del navegador al aceptar adiciones de texto puro
- Visualización completa de diferencias: La vista previa de cambios ahora muestra todas las palabras eliminadas y añadidas, no solo las diferencias mínimas
Versión 0.6.3 (26 de noviembre de 2025)
Nuevas funciones
- Experiencia predeterminada de usuario básico: Los nuevos usuarios ahora comienzan como usuarios básicos en lugar de administradores
- Actualización de clave de licencia: Se añadió un botón destacado de "Actualizar a Pro" en Ajustes para desbloquear funciones de administrador con una clave de licencia
- Onboarding simplificado: Experiencia de usuario por primera vez más limpia centrada en la funcionalidad principal
Versión 0.6.2 (26 de noviembre de 2025)
Corrección de errores
- Recuperación de tiempo de espera de generación: Se solucionaron los fallos silenciosos durante operaciones largas de Slate donde la interfaz mostraba "generando" indefinidamente
- El backend ahora rastrea la actividad durante la generación y agota el tiempo de espera después de 2 minutos sin progreso
- Los fragmentos de streaming, la ejecución de herramientas y las decisiones del agente reinician el tiempo de espera
- Recuperación automática cuando el service worker se reinicia a mitad de la generación (detección de estado huérfano)
- Mensaje de error mostrado al usuario cuando ocurre un tiempo de espera en lugar de un bloqueo silencioso
Versión 0.6.1 (26 de noviembre de 2025)
Nuevas Funcionalidades
Importación/Exportación de Hilos
- Exportar Hilos Seleccionados: Active el modo de selección para elegir hilos específicos para exportar
- Exportar Todos los Hilos: Exportación con un solo clic de todas las conversaciones con sus archivos adjuntos
- Importar desde Archivo: Importe hilos desde archivos JSON exportados
- Importación Selectiva: Elija qué hilos importar de un archivo
- Detección de Duplicados: Detecta automáticamente hilos que ya existen con la opción de omitir o sobrescribir
- Soporte de Archivos Adjuntos: Todas las imágenes, PDFs y archivos se incluyen en las exportaciones
- Soporte de Hilos Archivados: Tanto los hilos activos como los archivados pueden ser exportados/importados
Prompt Caching Mejorado
- Mejores tasas de acierto de caché para conversaciones largas con modelos Claude
- La estrategia de caché dinámica se adapta a la longitud de la conversación
Integración con Google Workspace
- Google Drive: Busque, cree, copie, mueva y comparta archivos y carpetas
- Gmail: Lea correos electrónicos, gestione etiquetas, cree borradores (seguridad ante todo: solo borradores, sin envío automático)
- Google Calendar: Liste calendarios, consulte eventos, cree/actualice/elimine eventos, encuentre franjas horarias libres
- Autorización Inline: Autorice el acceso a Google directamente desde el chat sin visitar Settings
Mejoras en la Navegación Web
- Nueva acción
click_coordinatespara hacer clic en elementos por posición en pantalla - Las URLs ahora se abren en pestañas nuevas por defecto (evita la sobrescritura de pestañas)
- Pestañas agrupadas automáticamente por hilo de conversación
- Mejor detección de selectores CSS para clics en elementos más fiables
Selección de Modelo
- El selector de modelo se ha movido al área del composer para un cambio rápido
- El modelo persiste globalmente a través de los cambios de modo
- Modelos con capacidad de visión marcados con un icono de ojo
Interfaz de Streaming
- Los parámetros de las herramientas se muestran a medida que se transmiten
- Visualización progresiva de bloques de razonamiento/pensamiento
- Indicador de estado "Generando..." durante la respuesta
Seguimiento de Uso de Tokens y Costes
- Muestra tokens de entrada, salida, razonamiento y caché
- Muestra el coste por mensaje y el coste acumulado del hilo
Mejoras de la Interfaz de Usuario (UI)
- Selector de Modo Disponible para Todos los Usuarios: Los usuarios que no son administradores ahora pueden cambiar entre modos en Settings
- Secciones de Settings Colapsables: Las secciones del panel de Settings pueden colapsarse/expandirse para una navegación más sencilla
- Configuración de AI & Model (LLM Provider, API Key, Model, Temperature, Max Iterations)
- Personalización (Personal Instructions, Profile Variables)
- Configuración de Agent Mode (Mode Selector, Variables, Instructions, Branding, Tools, MCP Servers)
- Ajustes de apariencia
- Backup & Restore
- Documentación
- Colores de Tema Específicos por Modo: Cada modo integrado tiene ahora un esquema de colores por defecto
- Shopping Agent: Verde
- Travel Agent: Azul
- Helper Agent: Rosa
- Caiioo (General): Púrpura
- Modo Cromático: Active la rotación de color para ciclar gradualmente a través del espectro
- Gestión de Sobrescritura de Temas:
- Un indicador visual muestra cuando el tema está personalizado (no se perderá al cambiar de modo)
- El botón "Save as Mode Defaults" (admin) persiste el tema como el nuevo valor por defecto del modo
- "Reset to Mode Defaults" restaura los colores originales del tema del modo
- Nueva imagen de marca e icono de Caiioo
- Selector de modo movido al área del composer
- El botón de nuevo hilo muestra un menú desplegable de selección de modo
- Alternador de lista de hilos en la barra superior del composer
- Efecto de borde de viñeta en las pestañas del navegador controlado
- Botón de parada flotante en las pestañas controladas
- Los menús desplegables se posicionan correctamente cerca de los bordes de la pantalla
Corrección de Errores
- El selector de modelo se actualiza inmediatamente después de un cambio en los ajustes
- El onboarding de nuevos usuarios ahora inicia correctamente el Helper Agent
- El panel de Settings ya no falla con variables personalizadas mal formadas
- Los nombres de los grupos de pestañas se mantienen actualizados cuando cambia el título del hilo
- Los widgets de aceptar/rechazar de Slate se posicionan correctamente
- El pensamiento extendido funciona con más modelos (Haiku 4.5, Gemini, etc.)
- Corregido el error "maximum 4 cache_control blocks"
Versión 0.3.4 (24 de noviembre de 2025)
Nuevas funciones
Contexto de selección de texto
- El botón "Añadir al prompt" aparece al seleccionar texto en páginas web
- El texto seleccionado se muestra como etiquetas en el editor con el contexto de la página
- Ubicación DOM capturada para una interacción precisa del agente
Integración con Google Calendar
- Gestión completa del calendario (listar, crear, actualizar, eliminar eventos)
- Búsqueda inteligente de disponibilidad en todos los calendarios
- Análisis de tiempo en lenguaje natural ("mañana", "la próxima semana")
Corrección de errores
Modo Slate
- Los botones Aceptar/Rechazar ya no se ocultan detrás del contenido del editor
- Resaltado de diferencias a nivel de palabra (no líneas enteras)
- Las múltiples llamadas a
propose_changeahora se acumulan correctamente - El interruptor de vista ya no vuelve a su estado anterior de forma inesperada
Cambio de marca
- Renombrado de "ContextFlow" a "Caiioo"
Versión 0.3.0 (22 de noviembre de 2025)
Nuevas funciones
Acceso móvil y LAN
- Servidor LAN: Accede a Caiioo desde cualquier dispositivo en tu red local
- Barra lateral de conversaciones: Abre conversaciones en una pestaña del navegador para aprovechar una pantalla más grande
- Exportación móvil: Exporta conversaciones como HTML independiente para visualización sin conexión
Corrección de errores
- Se corrigió un error crítico en la lógica de ramificación de mensajes
- Se corrigieron las operaciones en hilos archivados
Versión 0.2.0 (21 de noviembre de 2025)
Nuevas funciones
Soporte extendido de razonamiento (Extended Thinking)
- Los modelos Claude ahora soportan bloques de razonamiento/pensamiento extendido
- Interfaz de razonamiento plegable para ver el proceso de pensamiento del modelo
- Detalles de razonamiento almacenados en caché para continuidad en múltiples turnos
Nuevos proveedores de LLM
- Integración con Ollama: Ejecuta LLMs locales a través de Ollama
- Selección de proveedor en el panel de configuración
Soporte de formatos de imagen
- Soporte HEIC/HEIF: Formatos de imagen de Apple convertidos automáticamente para mayor compatibilidad
Mejoras en la interfaz
- El menú de herramientas se guarda automáticamente al cerrar
- Mejor organización del panel de configuración
Corrección de errores
- Posicionamiento mejorado del autocompletado de variables
Versión 0.1.x (Versiones anteriores)
Funciones principales
- Chat con IA multi-modelo (OpenRouter, Anthropic, OpenAI, Ollama)
- Automatización de navegador y web scraping
- Slate para edición de código y documentos
- Integración con servidor MCP
- Capacidades de captura de pantalla y visión
- Entrada de voz
- Gestión y ramificación de hilos
- Sistema de perfiles y modos