Problem
You want to let the AI use tools — browse, write files, send messages — but only after you see what it intends to do and can stop or scope the action.

本文件為英文原版的機器翻譯。若翻譯版本與英文原版之間存在任何歧義,概以英文原版為準。 閱讀英文原版


在 AI 執行操作前控制它的行為

每個代理供應商都告訴您「完全自主!」Caiioo 的契約則相反:代理會描述它即將要做的事情,而由您決定是否允許它執行 — 可以按操作、按對話或永久設置。以下是端到端的呈現方式。

在您開始之前

開啟 設定 > 工具 以查看您目前的模式啟用了哪些工具。停用任何您不希望代理接觸的工具。核准僅適用於已啟用的工具 — 停用的工具永遠不會提供給模型。

當代理想要使用工具時

要求執行需要工具的任務。例如「搜尋網頁以獲取歐盟 AI 法案的最新變更」、「列出我明天的日曆」、「將此筆記儲存到文件」— 這些都會導致代理提議調用工具。

代理 不會 自行繼續。一個標題為 需要核准 的彈窗會阻斷執行並顯示:

  • 意圖 — 用代理自己的話描述它試圖做什麼。這是您第一眼看到的內容。
  • 工具名稱與動作 — 例如 googleCalendar.listEventsfileSystem.writeFile
  • 風險等級 — 顏色編碼的盾牌:綠色代表低風險讀取,琥珀色代表寫入,紅色代表破壞性或涉及金錢的操作。高風險工具還會顯示警告橫幅:「這是一項高風險操作。請僅在您了解其影響時才核准。」
  • 詳細資訊 — 一個可展開的區段,顯示經過清理的參數。機密資訊(API 金鑰、權杖、密碼)在顯示前會被移除。內部的 顯示原始 JSON 切換開關可讓您查看發送的確切負載。

選擇適合風險的範圍

頁尾提供四個按鈕。每個按鈕對應不同的信任決策:

按鈕 功能
拒絕 阻斷此單次動作。代理會收到拒絕訊息並可以嘗試其他方法。
核准一次 允許此特定調用,下次調用時再次詢問。適合一次性任務。
對話內核准 允許在當前對話執行緒中所有使用此工具的操作。開始新對話時重置。適合常見情況:「我接下來一小時要進行研究,讓代理自由搜尋。」
總是核准 跨所有對話的永久全域權限。對於高風險工具會以紅色顯示,以免您因習慣而誤點。適合您經常使用的低風險工具(如計算機)。

觀察執行過程

核准後,工具調用會執行並出現在對話旁的側邊欄,顯示即時狀態 — 等待中 → 執行中 → 成功失敗 — 以及實際運行的參數和獲得的結果。沒有您沒看到的運行;沒有任何內容在背景靜默運行。

隨時停止

如果您核准的工具表現異常,或者對話走向不符合您的意圖,請點擊輸入框上的停止按鈕。代理會立即停止,待處理的核准會被清除,任何執行中的瀏覽器工作階段也會乾淨地關閉。沒有孤立的工具調用,也沒有失控的迴圈。

當代理暫停向您提問時

核准是代理在請求許可。有時代理需要 輸入 — 它不確定您想要兩條路徑中的哪一條,或者它希望您在它執行十幾次工具調用前簽署一項計劃。為此,它使用一個獨立的「人工介入」面板,暫停輪次並直接詢問您。

面板顯示標題、以 Markdown 渲染的提議(代理的計劃、草稿或問題)以及四個回應按鈕:

  • 核准 — 按提議繼續。
  • 核准但... — 在出現的備註欄位中輸入調整建議後繼續。代理會帶著您的指導繼續同一輪次。
  • 拒絕但... — 不要這樣做,並說明原因(或說明您更想要什麼)。同樣會帶著您的理由繼續同一輪次。
  • 拒絕 — 完全放棄此方向。

如果代理的提議提供了一組具體選項,它們會以快速選擇標籤的形式顯示在按鈕上方,以便您點擊答案而無需打字。高風險提議會在正文上方顯示紅色警告橫幅。您的回應會直接在行內解決 — 代理不會重新開始,只會根據您的答案繼續對話。

將其設為預設:告訴 Caiioo 創建一個謹慎模式

上述工作流是按操作的版本。如果您希望將此作為整類任務的預設姿態,最乾淨的答案是使用模式。

直接要求即可。在編輯器中輸入類似以下的內容:

「創建一個名為『謹慎』的新模式,在執行任何工具之前始終呈現計劃,要求我核准計劃,並且在我確認之前不繼續執行。」

Caiioo 將使用其內置的配置工具為您建立該模式 — 系統提示、名稱、預設值。從標題的模型選擇器切換到該模式,每次代理運行都會從計劃開始,暫停等待您的核准,然後才觸及工具。稍後以同樣的方式編輯模式:「更新謹慎模式,在每一步之後也總結結果。」 代理會自我編輯。

創建或更新自定義模式是 Pro 層級的功能。請參閱模式與個性以了解模式可以配置的完整圖景 — 系統提示、啟用的工具、變數等。

延伸閱讀

  • 工具與整合 — 工具目錄中的內容以及如何啟用或停用每一項
  • 模式與個性 — 模式可以配置的內容以及如何切換
  • 隱私與數據 — 為什麼工具使用的憑據保留在 Keychain(或同等功能)中而非共享設定檔中
  • 為什麼這樣設計 — 探討與「自主」代理安全性對比的部落格文章