Problem
You want to let the AI use tools — browse, write files, send messages — but only after you see what it intends to do and can stop or scope the action.

本文档由英文原版机器翻译而成。如果翻译版本与英文原版之间存在任何冲突,请以英文原版为准。 阅读英文原版


在 AI 执行操作前进行控制

每个智能体供应商都会告诉你“完全自主!”Caiioo 的契约则相反:智能体描述它将要执行的操作,而由您决定是否允许——可以按操作、按对话或永久决定。以下是端到端的展示。

在您开始之前

打开 设置 > 工具 查看当前模式启用了哪些工具。禁用任何您不希望智能体接触的工具。审批仅适用于已启用的工具 —— 禁用的工具永远不会提供给模型。

当智能体想要使用工具时

要求执行需要工具的操作。“搜索网页了解欧盟 AI 法案的最新变化”、“列出我明天的日历”、“将此笔记保存到文件” —— 任何这些操作都会导致智能体提议调用工具。

智能体 不会 自行继续。一个名为 需要审批 的弹窗会阻止运行并显示:

  • 意图 —— 用智能体自己的话描述它试图做什么的一行文字。这是您目光首先落下的地方。
  • 工具名称与操作 —— 例如 googleCalendar.listEventsfileSystem.writeFile
  • 风险等级 —— 颜色编码的盾牌:绿色代表低风险读取,琥珀色代表写入,红色代表破坏性或涉及资金的操作。高风险工具还会显示警告横幅:“这是一项高风险操作。仅在您了解其后果时批准。”
  • 详情 —— 一个可展开的部分,显示脱敏后的参数。敏感信息(API 密钥、令牌、密码)在显示前会被剔除。内部的 显示原始 JSON 开关可以展示未经处理的数据,如果您想确切了解传输内容的话。

选择适合风险的范围

页脚提供四个按钮。每个按钮对应不同的信任决策:

按钮 功能
拒绝 拦截此次单一操作。智能体会收到拒绝信息并可以尝试其他方案。
批准一次 允许此次特定调用,下次调用时再次询问。适用于一次性任务。
在此对话中批准 允许在当前会话中一直使用此工具。开始新对话时重置。适用于常见情况:“我接下来一小时要查资料,让智能体自由搜索。”
总是批准 跨所有对话的永久全局权限。高风险工具会以红色显示,防止习惯性点击。适用于您经常使用的低风险工具(如计算器)。

观察执行过程

批准后,工具调用将执行并出现在对话旁边的侧边栏中,显示实时状态 —— 等待中 → 执行中 → 成功失败 —— 以及实际运行的参数和返回的结果。没有您没看到的运行,也没有在后台静默运行的操作。

随时停止

如果您批准的工具表现异常,或者对话走向不符合您的意图,请点击输入框上的停止按钮。智能体会立即停止,清除待处理的审批,并干净地关闭任何运行中的浏览器会话。没有孤立的工具调用,也没有失控的循环。

当智能体暂停向您提问时

审批是智能体在请求许可。有时智能体需要 输入 —— 它不确定两条路径中您想要哪一条,或者它希望在执行涉及十几次工具调用的计划前让您签字。为此,它使用一个独立的“人工干预”面板,暂停当前轮次并直接询问您。

面板显示标题、Markdown 渲染的提议(智能体的计划、草案或问题)以及四个响应按钮:

  • 批准 —— 按提议继续。
  • 批准但... —— 按照您在出现的备注栏中输入的调整建议继续。智能体会带着您的指导继续当前轮次。
  • 拒绝但... —— 不要这样做,并说明原因(或说明您更倾向的做法)。同样,带着您的理由继续当前轮次。
  • 拒绝 —— 完全放弃这个方向。

如果智能体的提议提供了一组具体的选项,它们会以快速选择标签的形式出现在按钮上方,以便您点击回答而非打字。高风险提议在正文上方会有红色警告横幅。您的响应会就地解决 —— 智能体不会重新开始,而是带着您的答案在上下文中继续对话。

将其设为默认:让 Caiioo 创建一个“谨慎”模式

上述工作流是按操作的版本。如果您希望将其作为整类任务的默认姿态,最简洁的答案是创建一个模式。

只需开口询问。在编辑器中输入类似以下内容:

“创建一个名为‘谨慎’的新模式,在执行任何工具之前始终展示计划,要求我批准计划,并且在我确认之前不继续执行。”

Caiioo 将使用其内置的配置工具为您创建该模式——包括系统提示词、名称和默认设置。从页眉模式选择器切换到该模式,智能体的每次运行都将从计划开始,暂停等待您的批准,然后才触碰工具。稍后以同样的方式编辑模式:“更新‘谨慎’模式,使其在每一步后也总结结果。” 智能体会自我编辑。

创建或更新自定义模式是 Pro 层级的能力。请参阅模式与个性以了解模式可以配置的完整内容——系统提示词、启用的工具、变量等。

另请参阅

  • 工具与集成 —— 工具目录中的内容以及如何启用或禁用每一项
  • 模式与人格 —— 模式可以配置的内容以及如何切换
  • 隐私与数据 —— 为什么工具使用的凭据保存在 Keychain(或同等组件)中而非共享配置文件中
  • 为什么这样设计 —— 揭示与“自主”智能体安全差异的博客文章