Esta es una traducción automática del documento original en inglés. En caso de cualquier discrepancia entre esta traducción y la versión original en inglés, prevalecerá la versión en inglés. Leer la versión original en inglés


Herramientas: Qué puede hacer la IA

La IA no solo chatea, puede realizar acciones reales. Usa herramientas para navegar por la web, leer documentos, generar imágenes, gestionar tu calendario y más. La IA decide automáticamente qué herramientas usar en función de lo que pidas.

Caiioo utiliza un modelo de acceso de lectura/escritura: los usuarios gratuitos obtienen acceso de solo lectura a la mayoría de las herramientas, mientras que Pro desbloquea el acceso completo de escritura en todos los ámbitos.

Todos obtienen estas herramientas (Gratis)

Navegación Web (Solo lectura)

La IA puede navegar por su navegador, leer páginas, tomar capturas de pantalla, buscar en Google y extraer contenido. Perfecto para investigación y recopilación de datos.

Qué puede preguntar:

  • "Lee esta página y resúmela"
  • "Toma una captura de pantalla de esto"
  • "Encuentra todos los precios en esta página"
  • "Busca en Google las mejores tiendas de campaña"

Google Workspace (Solo lectura)

Busque y lea su Gmail, Google Drive, Docs, Sheets y Calendar — sin configuración adicional más allá de conectar su cuenta de Google. Las búsquedas de Gmail entienden filtros naturales —remitente, asunto, etiqueta, categoría, antigüedad, archivos adjuntos y estado no leído— para que no tenga que conocer la sintaxis de búsqueda de Gmail.

Qué puede preguntar:

  • "Busca en mi Drive el informe del cuarto trimestre"
  • "Encuentra correos no leídos de Bob de la última semana que tengan archivos adjuntos"
  • "Lee mis correos más recientes"
  • "¿Qué hay en mi calendario hoy?"

Sundial Agenda (Solo lectura)

Vea sus eventos de calendario y recordatorios, verifique disponibilidad y encuentre franjas de tiempo libre. Funciona con Google Calendar en todas las plataformas.

Búsqueda Web

Búsqueda impulsada por IA con citas. Haga preguntas y obtenga respuestas con fuentes en lugar de buscar usted mismo entre los resultados de búsqueda.

Slate Editor

Colaboración de IA en tiempo real para código y documentos. Consulte Slate para más detalles.

Calculadora

Matemáticas rápidas. La IA puede realizar aritmética, trigonometría, estadística y más sin utilizar herramientas externas.

Integración de API (Solo lectura)

Realice solicitudes GET a APIs REST externas. Útil para obtener datos de servicios para los que aún no tenemos soporte integrado.

Base de datos SQL

Cree y consulte bases de datos SQLite locales. Útil para analizar datos CSV, crear tableros ligeros o prototipar flujos de trabajo de datos.

Sub-Agentes

Delegue partes de una tarea compleja a agentes paralelos para que se ejecuten de forma independiente e informen de vuelta. Útil cuando desea que la investigación, el análisis y la redacción ocurran al mismo tiempo. Los resultados de los sub-agentes se renderizan en línea en el chat principal.

Preguntar al Usuario

Pause la ejecución de una IA a mitad del proceso y muestre un diálogo de decisión. La IA presenta hasta 4 opciones (aprobar, aprobar con notas, rechazar, rechazar con notas) y espera su entrada. Sus notas regresan como guía en inglés sencillo que anula el plan, y el agente continúa en su lugar.

Self Checker

Califique y verifique cada turno del asistente. Haga clic en el botón ⚖ junto a cualquier respuesta para abrir una tarjeta de veredicto. Elija entre un juicio impulsado por LLM más comprobaciones deterministas (coincidencia exacta, contiene subcadena, patrón regex, rango numérico, aritmética). Los resultados se muestran en línea. El costo se suma al total de su hilo.

Instant Tool Chooser

Selección semántica de herramientas en el dispositivo. La IA elige la herramienta adecuada en ~10ms sin llamar a un modelo. Activado por defecto en todos los niveles — alterne entre "Instant Tool Chooser" y "Quick Tasks LLM" en Settings > Tools.

Herramientas del Nivel Pro ($9/mes)

Pro desbloquea el acceso completo de escritura a herramientas que son de solo lectura en el nivel Free, además de capacidades adicionales.

Cuando estés ejecutando un modelo de chat local (como Ollama), las herramientas impulsadas por AI que enviarían tus datos a un proveedor de AI remoto solicitarán tu aprobación primero. Consulta Privacidad y DatosProveedores de AI remotos.

Automatización Web Completa

Todo lo incluido en la navegación de solo lectura, más: hacer clic en enlaces, rellenar formularios, escribir texto, interactuar con elementos de la página y ejecutar JavaScript. Perfecto para el llenado de formularios, entrada de datos y automatización del navegador.

Qué puedes pedir:

  • "Rellena este formulario con mi información"
  • "Haz clic en la pestaña de Reseñas y lee lo que dice la gente"
  • "Inicia sesión en este sitio y descarga mi factura"

Google Workspace Completo

Crea, edita y gestiona Google Docs, Sheets, Slides, borradores de Gmail, archivos de Drive y eventos de Calendar. Google Sheets obtuvo nuevas acciones: pegar CSV/TSV/HTML, dividir texto en columnas, recortar espacios en blanco, eliminar duplicados, aplicar y borrar filtros de la barra de herramientas, mover filas y columnas, insertar y eliminar rangos de celdas, proteger rangos, definir y actualizar rangos con nombre, adjuntar metadatos de desarrollador y aplicar formato condicional. Google Docs obtuvo comentarios nativos (añadir, responder, resolver, eliminar), soporte para documentos de múltiples pestañas y reconocimiento de smart-chips (personas, enlaces, ecuaciones, saltos de página, fechas).

Google Drive — Crea carpetas, mueve archivos, gestiona permisos de uso compartido Gmail — Redacta y envía correos electrónicos, descarga archivos adjuntos Google Docs & Sheets — Crea y edita documentos, escribe fórmulas, formatea celdas Google Slides — Crea presentaciones, añade texto/imágenes/tablas, edita diseños Google Calendar — Crea eventos y recordatorios, programa reuniones en todos los calendarios de tu cuenta (calendarios de equipo, familiares y personales)

Sundial Agenda Completo

Crea eventos y recordatorios, programa reuniones y gestiona tu calendario a través de diversos proveedores.

Integración de API Completa

Solicitudes POST, PUT, PATCH y DELETE a cualquier endpoint REST — no solo GET.

Ingesta de Documentos

Sube y analiza PDFs, documentos de Word (DOCX), hojas de cálculo de Excel (XLSX) e imágenes con OCR. La extracción de mayor calidad en documentos complejos está disponible a través de modelos OCR accedidos mediante tu clave de OpenRouter.

Generación de Imágenes

Crea imágenes a partir de descripciones de texto. Los modelos disponibles incluyen FLUX.2 (Flex, Klein, Max, Pro), Gemini (2.5 Flash, 3 Pro, 3.1 Flash), GPT-5 Image, Seedream 4.5 y Riverflow v2. Perfecto para ilustraciones, maquetas o visualizaciones.

Qué puedes crear:

  • Una maqueta de producto para un nuevo diseño
  • Una ilustración para una publicación de blog
  • Una textura para un proyecto 3D
  • Variaciones de una imagen existente

Generación de Vídeo

Genera vídeos a partir de descripciones de texto. Modelos disponibles accedidos a través de OpenRouter: Google Veo 3.1, OpenAI Sora 2 Pro y ByteDance Seedance. Las duraciones y resoluciones válidas varían según el modelo. Los vídeos se guardan como archivos adjuntos del hilo.

Qué puedes generar:

  • Vídeos de demostración de productos
  • Explicativos animados
  • Transiciones de escenas para ediciones
  • Secuencias de guion gráfico (storyboard)

Generación de Música

Genera música original a partir de descripciones de texto a través de Google Lyria 3 Pro Preview (accedido mediante OpenRouter). Crea pistas libres de regalías que se guardan como archivos de audio integrados en tu hilo.

Qué puedes generar:

  • Música de fondo para vídeos
  • Paisajes sonoros ambientales
  • Temas musicales para proyectos
  • Versiones instrumentales de descripciones

Perro Guía (Seeing-Eye Dog)

Respaldo de visión para modelos de solo texto. Si el modelo elegido no admite imágenes (como Ollama local, DeepSeek V4 Pro, Kimi K2.6), adjunta imágenes de todos modos: se enviarán a través de un modelo de visión económico para generar subtítulos y luego el texto se enviará a tu modelo principal. El valor predeterminado es Gemini 3.1 Flash Lite a través de OpenRouter. El subtitulado automático ocurre al momento de construir el mensaje con almacenamiento en caché por archivo adjunto. Usa la herramienta vision({action: "inspect"}) para un seguimiento específico. Configúralo en Settings > Tools > Vision Fallback Model.

Archivos del Workspace

Lectura, escritura, edición y búsqueda en un entorno aislado (sandbox) dentro de una carpeta que tú indiques. No puede salir de esa carpeta ni acceder a la red. Analiza automáticamente .docx, .xlsx, .pptx y PDF. Perfecto para trabajar con archivos de proyectos locales sin subirlos a la nube. Configúralo en Settings > Tools > Workspace Files.

Ejecutor de Pruebas (Test Runner)

Ejecuta una lista de prompts con evaluadores: coincidencia de subcadenas, patrones (regex), llamadas a herramientas esperadas o puntuación de 1 a 10 mediante un segundo modelo. Cada prompt se ejecuta en su propia conversación nueva. Exporta los resultados como un informe de aprobado/fallido en CSV.

Seguimiento de Cambios a Nivel de Celda en XLSX

Las hojas de cálculo de Slate ahora admiten el control de cambios al estilo DOCX mediante propose_change({editMode: 'xlsx_cell'}). Los cambios se anclan por cellRef y nombre de hoja, representados en línea como <del>antiguo</del><ins>nuevo</ins>, con una barra de herramientas para siguiente, anterior, aceptar y rechazar. La AI y el usuario realizan la fusión celda por celda, prevaleciendo las ediciones del usuario en caso de conflicto.

Análisis Estructural y de Física

Calcula movimiento de proyectiles, colisiones, energía, impulso, fuerza, impulso mecánico, velocidad al objetivo, carga de vigas, pandeo de columnas y propiedades de materiales.

Sincronización Privada

Sincroniza tus ajustes y conversaciones entre dispositivos a través de una copia de seguridad en la nube cifrada. Consulta Sincronización Privada para más detalles.

Servidores MCP

Conéctate a servidores MCP remotos a través de HTTP/SSE, o ejecuta herramientas de escritorio (MCP local a través de la aplicación de escritorio) en tu propia máquina. Crea integraciones de herramientas personalizadas o conéctate a servicios de terceros.

Recuperación de Reuniones (Meeting Recall)

Recupera detalles de videollamadas recientes: transcripciones, puntos de acción y resúmenes para que puedas incorporar el contexto de la reunión en cualquier conversación.

Pasarela de Mensajería (Messaging Gateway)

Responde y envía mensajes a través de WhatsApp, Telegram y más, con el agente respondiendo por ti. Consulta Pasarela de Mensajería.

Más Funciones Pro

  • Modos personalizados ilimitados — Crea tus propias personalidades de AI con prompts y variables personalizadas
  • Variables de perfil personalizadas — Personaliza el comportamiento de la AI en todos los modos
  • Instrucciones por acción — Personaliza cómo se comporta cada acción de herramienta
  • Caiioo Benchmarks — Compara el rendimiento de los modelos con evaluaciones de calidad y pruebas de rendimiento
  • Soporte prioritario — Envía tickets de soporte directamente desde la aplicación

Herramientas experimentales

Activa las herramientas experimentales mediante un interruptor en el dispositivo. Estas rotan a medida que las funciones maduran hacia los niveles GRATIS o Pro. Las opciones disponibles incluyen integración con GitHub, Slack, razonamiento espacial avanzado, automatización de pruebas y más.

Habilitar o deshabilitar herramientas

Ve a Ajustes > Herramientas para ver qué hay disponible y activar o desactivar herramientas. Algunos modos vienen con herramientas específicas preconfiguradas.

Ver también


This guide is maintained by the Caiioo team using Slate, our built-in editor.