本文档由英文原版机器翻译而成。如果翻译版本与英文原版之间存在任何冲突,请以英文原版为准。 阅读英文原版


工具:AI 能做什么

AI 不仅仅是聊天 —— 它还可以采取实际行动。使用工具浏览网页、阅读文档、生成图像、管理日历等。AI 会根据您的需求自动决定使用哪些工具。

Caiioo 使用读/写访问模型:免费用户对大多数工具拥有只读权限,而 Pro 用户可解锁全面的写入权限。

所有人均可使用的工具 (免费)

网页浏览 (只读)

AI 可以操作您的浏览器、阅读页面、截屏、搜索 Google 并提取内容。非常适合研究和数据收集。

您可以这样问:

  • “阅读此页面并进行总结”
  • “对此页面进行截屏”
  • “找出此页面上的所有价格”
  • “在 Google 上搜索最好的露营帐篷”

Google Workspace (只读)

搜索并阅读您的 Gmail、Google Drive、Docs、Sheets 和 Calendar —— 除了连接您的 Google 账户外无需任何设置。Gmail 搜索支持自然语言过滤器——发件人、主题、标签、类别、时间、附件和未读状态——因此您无需了解 Gmail 的搜索语法。

您可以这样问:

  • “在我的 Drive 中搜索第四季度报告”
  • “查找上周 Bob 发来的带有附件的未读邮件”
  • “阅读我最近的邮件”
  • “我今天的日程安排是什么?”

Sundial Agenda (只读)

查看您的日历事件和提醒,检查忙闲状态,并查找空闲时间段。支持所有平台上的 Google Calendar。

网页搜索

带有引用的 AI 驱动搜索。直接提问并获取有来源的答案,无需亲自翻阅搜索结果。

Slate 编辑器

针对代码和文档的实时 AI 协作。详见 Slate

计算器

快速计算。AI 可以进行算术、三角函数、统计等运算,无需使用外部工具。

API 集成 (只读)

向外部 REST API 发起 GET 请求。适用于从我们尚未内置支持的服务中获取数据。

SQL 数据库

创建并查询本地 SQLite 数据库。适用于分析 CSV 数据、构建轻量级仪表板或原型化数据工作流。

子智能体 (Sub-Agents)

将复杂任务的部分内容委派给并行智能体,使其独立运行并汇报结果。当您希望研究、分析和起草同时进行时非常有用。子智能体的结果会直接在主对话中内联渲染。

询问用户 (Ask User)

在 AI 执行过程中暂停并弹出决策对话框。AI 最多提供 4 个选项(批准、带备注批准、拒绝、带备注拒绝)并等待您的输入。您的备注将作为纯英语指导反馈,覆盖原计划,随后智能体将在原位继续执行。

自检器 (Self Checker)

对助手的每一次回复进行评分和验证。点击任何回复旁边的 ⚖ 按钮即可打开裁决卡。可选择由 LLM 驱动的判断以及确定性检查(精确匹配、包含子字符串、正则表达式模式、数字范围、算术)。结果将内联显示。成本计入您的线程总额。

即时工具选择器 (Instant Tool Chooser)

设备端语义工具选择。AI 在约 10ms 内即可选出正确的工具,无需调用模型。所有层级默认启用——可在“设置 > 工具”中切换“Instant Tool Chooser”与“Quick Tasks LLM”。

Pro 订阅层级工具 (每月 $9)

Pro 版解锁了在免费版中仅限读取工具的完整写入权限,并提供额外功能。

当您运行本地聊天模型(如 Ollama)时,如果 AI 驱动的工具需要将您的数据发送到远程 AI 提供商,系统会先征求您的同意。请参阅 隐私与数据远程 AI 提供商

完整网页自动化

包含只读浏览的所有功能,外加:点击链接、填写表单、输入文本、与页面元素交互以及执行 JavaScript。非常适合表单填写、数据录入和浏览器自动化。

您可以这样要求:

  • “用我的信息填写这份表单”
  • “点击‘评论’选项卡并阅读大家的评价”
  • “登录此网站并下载我的发票”

完整 Google Workspace

创建、编辑和管理 Google Docs、Sheets、Slides、Gmail 草稿、Drive 文件和 Calendar 事件。Google Sheets 增加了新操作:粘贴 CSV/TSV/HTML、文本分列、修剪空格、删除重复项、应用和清除工具栏过滤器、移动行和列、插入和删除单元格范围、保护范围、定义和更新命名范围、附加开发者元数据以及应用条件格式。Google Docs 增加了原生评论(添加、回复、解决、删除)、多标签文档支持和智能芯片识别(人员、链接、方程式、分页符、日期)。

Google Drive — 创建文件夹、移动文件、管理共享权限 Gmail — 撰写并发送电子邮件、下载附件 Google Docs & Sheets — 创建和编辑文档、编写公式、格式化单元格 Google Slides — 创建演示文稿、添加文本/图像/表格、编辑布局 Google Calendar — 创建活动和提醒、安排会议,支持您账户中的所有日历(团队、家庭和个人日历)

完整 Sundial Agenda

创建活动和提醒、安排会议,并跨平台管理您的日历。

完整 API 集成

支持对任何 REST 端点进行 POST、PUT、PATCH 和 DELETE 请求 —— 不仅仅是 GET。

文档摄取

上传并分析 PDF、Word 文档 (DOCX)、Excel 表格 (XLSX) 以及带有 OCR 的图像。通过您的 OpenRouter 密钥调用 OCR 模型,可对复杂文档进行更高质量的提取。

图像生成

根据文本描述创建图像。可用模型包括 FLUX.2 (Flex, Klein, Max, Pro)、Gemini (2.5 Flash, 3 Pro, 3.1 Flash)、GPT-5 Image、Seedream 4.5 和 Riverflow v2。非常适合插图、原型设计或可视化。

您可以创建:

  • 新设计的产品原型
  • 博客文章的插图
  • 3D 项目的纹理
  • 现有图像的变体

视频生成

根据文本描述生成视频。通过 OpenRouter 访问的可用模型包括:Google Veo 3.1、OpenAI Sora 2 Pro 和 ByteDance Seedance。有效时长和分辨率因模型而异。视频将作为会话附件保存。

您可以生成:

  • 产品演示视频
  • 动画讲解视频
  • 剪辑用的场景过渡
  • 分镜序列

音乐生成

通过 Google Lyria 3 Pro Preview(通过 OpenRouter 访问)根据文本描述生成原创音乐。创建无版权音轨,并作为内联音频附件保存在会话中。

您可以生成:

  • 视频背景音乐
  • 环境音效
  • 项目的主题音乐
  • 描述内容的器乐版本

导盲犬 (Seeing-Eye Dog)

为纯文本模型提供视觉回退方案。如果您选择的模型不支持图像(如本地 Ollama、DeepSeek V4 Pro、Kimi K2.6),仍可附加图像 —— 它们会通过一个廉价的视觉模型生成描述文字,然后将文本发送给您的主模型。默认使用通过 OpenRouter 访问的 Gemini 3.1 Flash Lite。自动生成描述发生在构建消息时,并针对每个附件进行缓存。使用 vision({action: "inspect"}) 工具进行针对性的后续跟进。在“设置 > 工具 > 视觉回退模型”中进行配置。

工作区文件 (Workspace Files)

在您指定的文件夹内进行沙盒化的读取、写入、编辑和搜索。无法脱离该文件夹或访问网络。自动解析 .docx、.xlsx、.pptx 和 PDF。非常适合在不上传到云端的情况下处理本地项目文件。在“设置 > 工具 > 工作区文件”中进行配置。

测试运行器 (Test Runner)

运行一系列提示词并配合评分器 —— 子字符串匹配、模式 (regex)、预期的工具调用或第二个模型的 1-10 分评分。每个提示词都在独立的全新对话中运行。将结果导出为 CSV 通过/失败报告。

XLSX 单元格级修订追踪

Slate 表格现在通过 propose_change({editMode: 'xlsx_cell'}) 支持 DOCX 风格的修订。更改通过 cellRef 和工作表名称锚定,内联渲染为 <del>旧内容</del><ins>新内容</ins>,并配有用于“下一个”、“上一个”、“接受”和“拒绝”的工具栏。AI 和用户逐单元格合并,冲突时以用户编辑为准。

物理与结构分析

计算抛体运动、碰撞、能量、动量、力、冲量、目标速度、梁载荷、立柱失稳和材料特性。

私有同步 (Private Sync)

通过加密云备份在设备间同步您的设置和对话。详情请参阅 私有同步

MCP 服务器

通过 HTTP/SSE 连接到远程 MCP 服务器,或在您自己的机器上运行桌面工具(通过桌面应用运行本地 MCP)。构建自定义工具集成或连接到第三方服务。

会议回顾 (Meeting Recall)

检索近期视频会议的详情 —— 转录文本、待办事项和摘要,以便您可以将会议上下文引入任何对话。

消息网关 (Messaging Gateway)

在 WhatsApp、Telegram 等平台上接收和发送消息,由智能体代您回复。请参阅 消息网关

更多 Pro 功能

  • 无限自定义模式 — 使用自定义提示词和变量创建您自己的 AI 人格
  • 自定义个人资料变量 — 在所有模式下个性化 AI 行为
  • 单项操作指令 — 自定义每个工具操作的行为方式
  • Caiioo 基准测试 — 通过质量评估和吞吐量测试比较模型性能
  • 优先支持 — 直接从应用内提交支持工单

实验性工具

通过设备端开关切换实验性工具。随着功能成熟进入免费或 Pro 档位,这些工具会轮换。可用选项包括 GitHub 集成、Slack、高级空间推理、测试自动化等。

启用或禁用工具

前往 设置 > 工具 查看可用内容并切换工具的开启或关闭。某些模式预配置了特定工具。

另请参阅


This guide is maintained by the Caiioo team using Slate, our built-in editor.