本文件為英文原版的機器翻譯。若翻譯版本與英文原版之間存在任何歧義,概以英文原版為準。 閱讀英文原版


版本 0.9.720 (2026年5月1日)

品牌

  • 通用:PebbleFlow 現已更名為 Caiioo:產品已更名為 Caiioo —— 同樣的小動物,同樣您一直在使用的 App。您將在側邊欄、設定、網站、macOS 主程式選單和 Safari 主程式中看到新名稱。現有數據、帳號、登入狀態和同步保持不變 —— 僅更改顯示名稱。行銷網站目前仍位於 pebbleflow.ai 並具備向前相容性以顯示新品牌;規範的 caiioo.ai 路由將在後續版本中推出。

新功能

  • 通用:新用戶預設開啟 Simple Mode:首次安裝現在會進入 Simple Mode —— 這是一個更簡潔的編輯器,隱藏了每條訊息的 token 和成本詳情、無損壓縮下拉選單以及分頁上下文指示器。模型選擇器仍然可見,因為選擇模型是一項核心操作。現有用戶保留其原有的 Simple Mode 設定。編輯器中新增的眼睛圖示切換開關可一鍵顯示或隱藏完整詳情。
  • 通用:帳號刪除:您現在可以從網站的 Account 頁面刪除您的 Caiioo 帳號(根據 Apple 的帳號刪除要求,iOS App 中也提供了相關連結)。刪除操作將移除您的個人資料、登入憑據、AI 額度餘額以及已配置 OpenRouter key 的加密副本;根據法律要求,將保留不含帳號 ID 的最低限度合規審計日誌。新的隱私政策章節詳細說明了哪些內容會被移除以及哪些會被保留。
  • iOS:原生裝置端文字轉語音 (Kokoro 82M):Kokoro 語音合成現在透過 OnnxRuntime 在 iOS 主進程中運行,而非在 WKWebView 內部,這與 0.9.719 的 e5-embeddings 架構一致。該模型獲得了主進程增加的記憶體配額,而不是與側邊欄 UI 競爭 WebKit 的單個進程上限,因此裝置端 TTS 在 iPhone 13/14 高負載下不再導致 WebView 崩潰。

改進

  • 通用:圖像生成器支援慢速串流模型:圖像生成工具現在對 OpenRouter 圖像模型啟用串流傳輸,修復了在 gpt-5.4-image-2 等慢速模型(端到端約 167 秒)上出現的 "Network error: Unable to connect to OpenRouter" 錯誤。之前的緩衝路徑在實際 JSON 到達前會等待約 1.8 MB 的 keepalive 填充,導致連接層先發生超時。
  • 通用:免費層級模型選擇動態挑選真實模型:之前的 openrouter/free 元路由器在 OpenRouter 內部進行路由,無法感知下游模型是否支援工具(tools)或視覺(vision)—— Android 用戶發送圖片加工具調用時會遇到 "No endpoints found that support tool use"。Caiioo 現在自行路由:引導流程、設定和升級彈窗中的「使用免費模型」CTA 都會挑選一個支援工具(以及圖片輸入,如果可用)的真實免費模型,並在遇到速率限制或功能錯誤時自動切換。使用 openrouter/free 的現有用戶將在下次啟動時延遲遷移。
  • 通用:Personal Intuition 在長訊息中尋找正確上下文:檢索查詢以前被切片為訊息的最後 500 個字元,並嵌入為單個向量。在長篇貼上後提問或多主題對話中,這會導致在實際問題前被截斷,或者將所有內容模糊成一個評分較低的主題扁平質心。Caiioo 現在會提取顯著查詢 —— 保留逐字開頭,並附加從後續最多 3000 個字元中提取的去重內容 token 包 —— 這樣即使您的提示詞很長,檢索也能保持在主題上。
  • 通用:設定 → 「Minimal settings」切換開關停止翻轉標題:該開關標籤以前在「Minimal settings」(開啟)和「Advanced settings」(關閉)之間切換,導致關閉狀態看起來像是勾選後會進入進階模式 —— 與實際情況相反。現在標題保持不變;描述前綴增加「On — 」/「Off — 」以使當前狀態明確。
  • 通用:語音模型下載對話框處理不確定進度:下載期間的模型資訊卡片在狹窄的側邊欄中可能會溢出;現在佈局已固定。當伺服器未返回 Content-Length 時,進度塊會顯示不確定的旋轉圖示,而不是凍結在 0% 的進度條。
  • 通用:Simple Mode 顯示精簡統計條而非隱藏所有內容:Simple Mode 以前會隱藏整個對話統計摘要。現在它顯示一個精簡條 —— 上下文視窗環、簡約的總 token(例如 "1k")、成本和剩餘額度 —— 編輯器中的眼睛切換開關可一鍵展開至完整詳情。
  • 通用:子代理成本正確匯總:每條對話的成本統計以前缺少子代理 Perplexity / 網頁搜尋支出、助手成本、圖像/影片/音樂生成成本、PDF OCR 成本和語音成本。所有類別現在都匯總到父級的 sub_agent_cost 行中。
  • 通用:設定 → Tools 選擇器覆蓋隱藏的預設關閉工具:在預設禁用的工具上選擇「Always」或「Auto」以前會被靜默忽略。您的動態工具配置選擇現在會覆蓋預設值。
  • 通用:本地 sidecar 在用戶介面中更名為「Desktop app」:所有用戶可見的「PebbleFlow Relay」(支援本地 stdio MCP 伺服器和僅限桌面工具的 sidecar)引用現在均改為「Desktop app」,這正是用戶實際安裝的內容。
  • 通用:隱私文案精簡:刪除了法律政策、商店列表、網站隱私頁面和 App 內指南中冗餘的「telemetry」措辭。「No analytics」已涵蓋該內容;App 實際收集或不收集的內容沒有事實性變化。
  • 通用:提供商帳號視圖標籤平衡來源:提供商帳號面板現在會說明每個餘額對應的 key(您的 BYOK key 與 Caiioo 配置的 key),因此額度和剩餘餘額不再會被一眼誤認。

Bug 修復

  • 通用:品牌過渡後的 Apple 登入:由於 OAuth Services ID 仍指向舊的 com.sixcailloux.PebbleFlow.web,新用戶的 Apple 登入失敗。已切換至 com.sixcailloux.Caiioo.web,使「透過 Apple 登入」在 iOS、macOS 和網頁帳號頁面上恢復運作。
  • 通用:需要 OAuth 的 MCP 伺服器上的「Sign in」按鈕:安裝遠端需要 OAuth 的 MCP 伺服器(例如 Notion)時,即使因需要 OAuth 導致初始連接失敗,伺服器也會寫入存儲,但不會註冊客戶端。隨後的「Sign in」按鈕發送的刷新請求會返回原始的 "MCP server not found" 錯誤,而不是打開 OAuth 對話框。現在當客戶端未註冊時,刷新會回退到新的 addServer 調用,從而顯現 OAuth/DCR 形式並實際打開登入對話框。
  • 通用:從原生 App 提交的錯誤報告現在記錄正確的 App 版本:iOS、macOS 和 Android 外殼現在在啟動時將安裝的 App 版本注入 WebView,因此提交的錯誤報告能識別其來源版本,而不是留空或顯示封裝的側邊欄版本。
  • Android:更名後的啟動崩潰:過於急促的 PebbleFlow → Caiioo 更名重命名了 Kotlin 端的 Application 類和 JNI 符號,但未重命名對應的原生導出,導致 App 在啟動時因無法解析符號而崩潰。已還原重命名;App 現在可正常啟動。
  • 通用:Google Workspace 重新授權循環:用戶因存儲的 OAuth 連接缺少 refresh_token 而陷入每小時重新授權 Google Workspace 的困境。六項相關修復確保每次授權都能獲得刷新權杖並透過雲端同步保留,使 Google 連接在 1 小時 access-token TTL 後仍能存續,無需跳轉至授權頁面。
  • 通用:從 OpenRouter 的「User not found」中恢復:當配置的子 key 對應的用戶記錄已消失但 key 實體仍存在時,OpenRouter 會返回 HTTP 401 "User not found"。Caiioo 以前將其顯示為失效的擴充功能,只能透過登出再登入修復。提供商現在會透過更換新的配置 key 並重試一次請求來實現自我修復。
  • 通用:Google Docs insert_component 返回誤導性錯誤:在先前插入的表格後插入組件會顯示 "Document not found",因為插入的表格未綁定到其 componentName。現在表格在同一插入階段會獲得一個命名範圍,位置解析器支援非預設的 tabId,且 App 層級的錯誤不再被誤分類為 404。
  • 通用:新發佈的 OpenRouter 模型丟失 ZDR 路由:當模型尚未進入 Caiioo 的情報資料庫時,合成的回退記錄會將其標記為不具備 ZDR 能力,即使僅限 ZDR 的提供商實際上支援它。ZDR 路由現在使用與常規路徑相同的提供商列表回退機制。
  • 通用:API /v1/runs 在首次調用時忽略附件:當 API 端點針對新對話啟動代理時,用戶訊息上的附件列表會丟失,因為空對話分支僅推送了文本。附件現在可以正確傳輸。
  • 通用:原生 App 在模型更改後可能讀取過時設定:在記憶體壓力較大的 Android 上,切換模型選擇器並立即發送訊息可能會讓代理從磁碟讀取到舊模型,因為 500 毫秒的防抖刷新尚未觸發。發送路徑現在會在啟動代理前強制執行狀態刷新。
  • 通用:測試人員 Bug 分類 (PF-260429 / PF-260430):五項修復 —— 託管 key(免費層級)用戶現在可以透過 PDF OCR 導入文件而無需輸入自己的 key;macOS 將 Node sidecar 的時區固定為主機時區,以便在沙盒下正確解析日期;排程任務現在可在 iOS/macOS/Tauri 外殼中持久化(WebView 存儲存根曾靜默丟棄寫入);配置工具將一次性和手動排程作為核心選項顯現;工具調用點現在以與代理運行器相同的方式從 OpenRouter 401 自我修復中恢復。
  • 通用:升級彈窗停止混淆層級訂閱與額度/BYOK:「Add Credits」實際上打開了訂閱門戶 —— 標籤具有誤導性。彈窗現在僅專注於層級訂閱;此外,根據 Apple §3.1.1 規定,iOS 隱藏了任何額度購買介面。
  • Web:刪除帳號章節移至帳號頁面底部:具破壞性的 Delete Account 區塊以前渲染在身份卡片與訂閱/帳單 UI 之間。它現在位於頁面最底部,在 FAQ 之後。iOS 深度連結至僅限刪除視圖的行為保持不變。
  • iOS:Manage Plan 現在打開 Apple 的訂閱頁面:iOS 上的 Manage Plan 以前會針對免費、試用、Stripe 和來源不明的用戶跳轉至網頁帳號頁面,而 WKWebView 中的 Google OAuth 會在那裡失敗。現在在 iOS 上點擊 Manage Plan 始終會打開 Apple StoreKit 的 showManageSubscriptions 頁面。
  • iOS:刪除帳號網頁視圖摺疊為僅限刪除頁面:當 iOS 的 Delete Account 按鈕打開網站時,該頁面現在會隱藏所有帳單介面(訂閱、方案、額度、Stripe 門戶、FAQ)並僅顯示刪除章節,以符合 §3.1.1 規定。
  • iOS:ITMS-90208 框架版本驗證修復:onnxruntime 框架的 Info.plist 現在在封存時會進行修補以匹配主程式的部署目標,解決 App Store Connect 因「框架不支援 Info.plist 中指定的最低 OS 版本」而拒絕構建的問題。
  • Android:外部連結在 Custom Tab 中打開以支援 Google OAuth:點擊如「Open pebbleflow.ai/account」之類的連結以前會在 Android WebView 內部打開,而 Google 會以 disallowed_useragent(錯誤 403)封鎖 OAuth。外部連結現在透過原生橋接路由至 Google 信任的 Chrome Custom Tab。
  • Android:訊息下方的複製按鈕現在可以實際複製:複製圖示以前直接使用 navigator.clipboard.writeText,當用戶激活在非同步邊界過期時,這在 Android WebView 中會靜默失效。複製現在透過原生剪貼簿橋接進行路由。

版本 0.9.719 (2026年4月25日)

安全性

  • Common: 已修復 protobufjs CVE-2026-41242 (CVSS 9.8):將 protobufjs 鎖定在 >= 7.5.5(已解析至 8.0.1),以堵塞 Root.fromJSON 中一個嚴重的任意代碼執行漏洞。Caiioo 並未直接導入 protobufjs —— 它是 onnxruntime-web 的傳遞依賴 —— 且實際風險較低,因為我們僅提供捆綁的模型,而非用戶提供的架構。儘管如此,由於修復方式簡單,我們仍進行了修補。
  • Common: @xmldom/xmldom — 已修復 4 個高嚴重性 CVE:將 @xmldom/xmldom 鎖定在 >= 0.9.10。XML 解析用於 DOCX/XLSX 修訂流水線及各種擴充功能代碼路徑。
  • Server: undici — 已修復 3 個高嚴重性 CVE:在 cloud/relay 中將 undici 鎖定在 >= 7.24.0。僅影響中繼伺服器的 HTTP 客戶端。
  • Desktop: rustls-webpki + quinn-proto — 已修復 2 個高嚴重性 CVE:升級了這些 Tauri Rust 依賴項。影響通過 Tauri 外殼運行的 Windows 和 Linux 桌面版本。

新功能

  • Common: 影片生成 (Pro):透過 OpenRouter 使用 Google Veo 3.1、OpenAI Sora 2 Pro 和 ByteDance Seedance 生成或製作短片動畫。該工具會根據每個模型選擇有效的時長和解析度,持續輪詢直到任務完成,並將結果保存為對話串附件。
  • Common: 音樂生成 (Pro):透過 OpenRouter 使用 Google 的 Lyria 3 Pro Preview 生成歌曲和樂器片段。輸出結果保存為音訊附件,可直接在線播放。
  • Common: 動態影片模型目錄:影片生成器在運行時獲取當前支援影片功能的 OpenRouter 模型列表,因此無需更新 Caiioo 即可顯示新的供應商和模型。內置的快照可確保離線狀態下仍能運作。
  • Common: 動態音樂模型目錄:音樂生成功能亦同 —— 該工具會在 OpenRouter 發佈新音樂模型時自動獲取,並具備離線回退機制。
  • Common: Pro 版自定義 OAuth:自帶驗證 (BYOK) 功能 —— 包括 Google Workspace 嚮導、Microsoft 365 嚮導以及通用的「添加自定義提供商」流程 —— 現已在「設定 → 自定義 OAuth」中對所有 Pro、Platform、Teams 和 Enterprise 用戶開放。此前,該標籤和添加按鈕僅對測試人員開放,付費用戶無法進行 BYOA 設置。
  • Common: 物理與結構分析 (Pro):物理模擬工具(拋體運動、碰撞、動能/位能、動量、力、衝量、目標速度)和結構分析(樑載荷、柱失穩、材料特性)現已與其他創意和實用工具一起向 Pro 用戶開放。
  • Common: 導盲犬 (Seeing-Eye Dog) — 純文本 LLM 的視覺回退方案:DeepSeek V4 Pro、Kimi K2.6、MiMo V2.5 Pro 等純文本模型以及本地 Ollama 模型現在可以處理圖像附件,方法是將其路由至配置好的廉價視覺模型(預設為 Gemini 3.1 Flash Lite)。自動標註在構建消息時觸發,並按附件緩存,因此後續對話無需重複支付費用;專用的 vision({action: "inspect"}) 工具讓模型可以進行針對性的後續訪問。可在「設定 → 工具 → 視覺回退模型」中選擇輔助模型。
  • Common: XLSX 單元格級別修訂追蹤:試算表組件現在支援與 DOCX 相同的修訂 UX。透過 propose_change(editMode: 'xlsx_cell') 提出的 AI 建議會產生定位於單元格的修訂追蹤,並由 cellRef + sheetName 錨定;用戶在修訂模式下的手動編輯會生成單元格級別的差異;含有待處理更改的單元格會直接渲染 <del>舊內容</del><ins>新內容</ins>;現有工具欄的下一個/上一個/接受/拒絕功能同樣適用於單元格更改;並行的 AI 與用戶編輯將逐個單元格合併,若發生同單元格衝突則以用戶編輯為準。
  • Common: 影片與音樂生成器的成本追蹤:生成的影片(透過 OpenRouter /api/v1/videos)和音樂(透過 chat-completions)現在與圖像生成一樣,將成本計入對話串總額中,側邊欄成本下拉選單中新增了 video_gen_costmusic_gen_cost 的明細行。

改進

  • Common: GPT-5 系列穩定性:OpenAI 的 gpt-5、gpt-5.1、gpt-5.4、gpt-5.4-pro 和 gpt-5.3-codex 在執行重度工具調用的代理對話時,不再產生無聲的空回應。此前由於函數工具架構的交互問題,導致 OpenAI 後端在未產生任何輸出的情況下終止串流;Caiioo 現在會按照這些模型要求的格式序列化工具。
  • Common: 優化 GPT-5.4+ 的長對話行為:與 gpt-5.4、gpt-5.4-pro 和 gpt-5.3-codex 的多輪對話不再於長工具調用序列中提前停止 —— OpenAI 用於區分中間評論與最終答案的階段標記現在可以在多輪對話中保留。
  • Common: GPT-5.x 推理過程在思考面板中可見:gpt-5、gpt-5.1、gpt-5.4、gpt-5.4-pro 和 gpt-5.3-codex 現在會在思考時將其推理摘要串流傳輸到聊天中的思考面板,與 Gemini 的行為一致。此前,儘管 OpenRouter 正在串流傳輸推理文本,這些模型的思考面板仍保持空白。
  • Common: 透明化恢復瞬時上游故障:當 OpenRouter 將請求路由至上游,且在任何內容串流前返回瞬時 5xx 錯誤時,Caiioo 會安靜地在不同的上游重試,而不是顯示空回覆。
  • Common: 模型串流失敗時提供更清晰的錯誤提示:供應商端崩潰、內容過濾器拒絕以及其他串流中斷故障現在會顯示具體的錯誤消息,而不是在沒有解釋的情況下直接「停止」對話。
  • Common: 生成的影片和音樂直接在線渲染:生成的影片和音樂現在像生成的圖像一樣出現在對話中 —— 影片或音訊播放器會顯示在最終答案上方,並帶有一個顯示生成模型的小標籤,而不是隱藏在摺疊的工具部分內。
  • Common: 影片與音樂工具的預設模型選擇器:「設定 → 工具」現在包含影片和音樂生成器的預設模型下拉選單,與現有的圖像生成器選擇器一致。代理預設使用您選擇的模型;您仍可以透過指定不同模型名稱來覆蓋每項請求。
  • Common: 個人直覺 (Personal Intuition) 索引狀態顯示:個性化設置面板現在顯示實時的「已索引:N 個對話串 · M 個區塊 · K 個標記 · 上次索引於 X 分鐘前」信息,以便您確認記憶索引器正在運作。上次回填摘要在運行完成後也會保持可見,不再消失。
  • iOS: 原生設備端嵌入(更快、佔用內存更少):Multilingual-e5-small 推理現在透過 Apple 的 onnxruntime-objc 在 iOS 宿主進程中運行,而非在 WKWebView 內部。這解決了導致 WebView 在模型加載後約 7 秒崩潰(登錄後崩潰)的單個進程內存限制問題。在首次對工具目錄進行編碼後,後續的工具選擇調用將命中每段文本的內存緩存,並在約 10 毫秒內完成,而非約 5 秒。共享流水線重構還防止了個人直覺和設備端工具選擇各自加載約 115 MB 的模型副本。
  • Common: 個人直覺與設備端工具選擇共享單個 e5 流水線:這兩個功能此前分別實例化各自的 multilingual-e5-small 加載器(每個約 115 MB,渲染器中總計約 230 MB)。現在它們委託給單個共享流水線,該流水線會對並行加載進行去重,使冷啟動成本減半。

錯誤修復

  • Common: 瀏覽器會話 Cookie 不再洩漏至 API 調用:如果您曾在瀏覽器標籤頁中訪問過 openrouter.ai,擴充功能曾無意中將您的 OpenRouter 瀏覽器會話(Clerk / Stripe / 分析 Cookie)附加到每個 API 調用中。現在 API 調用嚴格採用 Bearer 身份驗證。
  • Common: GPT-5.4 回應不再出現兩次:修復了 gpt-5.4、gpt-5.4-pro 和 gpt-5.3-codex 的回應會連續顯示兩次相同文本的錯誤 —— 最終答案的負載與已經渲染過的標記流被重複累加。
  • Common: 重新加載後刷新模型選擇器:模型列表現在會在版本升級時失效,並遵循較短的內存 TTL,因此新發佈的 OpenRouter 模型會在重新加載後出現,而不會被過時的緩存隱藏。長期運行的 Service Worker 不再保留凍結的目錄。
  • Common: 生成媒體的短連結可開啟播放器:當模型在生成音訊/圖像/影片後寫入如 [收聽](audio-…) 的短連結時,點擊它現在會開啟 slate 播放器,而不會因無效的外部 URL 而失敗。同樣的修復也適用於圖像和影片連結。
  • Common: 以 Markdown 圖像嵌入方式生成的媒體渲染損壞:當模型將影片或音訊附件寫為 ![影片 1](video-…) 而非 [影片 1](video-…) 時,它會渲染為損壞的 <img> 而非開啟播放器。現在會移除領先的 !,以便連結開啟 slate 查看器。
  • Extension: 側邊欄「位置權限被拒絕」死循環:修復了一個回歸問題,即無論用戶點擊什麼,每個側邊欄位置請求都返回「位置權限被拒絕。請在瀏覽器設置中允許位置訪問。」嘗試透過離屏文檔路由會立即觸發 PERMISSION_DENIED,因為離屏上下文無法顯示權限提示,且清單文件未聲明 geolocation。側邊欄現在恢復使用此前有效的「內容腳本後接 IP 地理定位」鏈條。
  • Common: 個人直覺完全重建後殘留過時的索引計數:修復了完全重建回填時跳過每條對話串索引更新的問題,導致「設定 → 個性化」在重建後顯示重建前虛高的總數。由完全重建掃描但此前未索引的對話串現在對檢索也變為可見。
  • iOS: 登錄後 WKWebView 崩潰循環:針對登錄後崩潰進行了三項綜合修復。(1) 原生 e5 嵌入現在以 8 個為一組分批運行,並將 ORT 內存池設置為在運行間隙縮小 —— 峰值工作集保持在約 100 MB 以下,不再飆升至約 3 GB 並觸發 iOS 的單個進程內存清理機制。(2) 設備端檢索器現在在 requestIdleCallback 期間預熱,而非在啟動時同步預熱,因此不再與許可證同步、身份恢復、UI 渲染和雲端同步初始化競爭資源。(3) 設備端檢索器現在會在身份/等級變更時重新配置,因此新安裝的應用不再因首次註冊時等級未定義而安靜地回退到雲端輔助程序。
  • iOS: 錯誤的「路徑遍歷被封鎖」403 錯誤:修復了 LocalFileSchemeHandler 將每個 404 錯誤誤標記為路徑遍歷企圖的問題,因為 NSString.standardizingPath 僅對磁盤上存在的文件解析 /var/private/var。指向不存在資源的合法路徑(iOS 捆綁包排除 *.wasm,以及 chrome-extension API 路徑如 api/active-tab-context)返回 403 而非 404,導致 transformers.js 的 wasm 預取回退機制失效。已替換為與 Android 處理程序一致的基於字符串的 .. / NUL 檢查。
  • Common: PDF 嵌入圖像導致純文本模型出錯:向純文本 OpenRouter 模型(DeepSeek V4 Pro、Kimi K2.6 等)發送帶有嵌入圖像的 PDF 時,會觸發「未找到支持圖像輸入的端點」—— 這正是新的「導盲犬」路由旨在消除的警告。PDF 傳輸路徑現在遵循與圖像塊傳輸相同的每模型 supportsVision 標誌,因此純文本模型接收純文本 PDF,代理可以根據需要啟動視覺子代理。
  • Common: 廣告攔截器級別切換未生效:切換廣告攔截器級別(關閉 / 標準 / 強力)僅更改了持久化值,而實時的 DNR 規則 + 靜態規則集仍保持生效,直到 Service Worker 恰好重啟 —— 因此在切換到「關閉」後,ads.google.com 等網站仍被封鎖。存儲監聽器現在會監視實際寫入設置的 globalSharedSettings 存儲桶,且舊有的 adBlockerEnabled 標誌也透過同一存儲桶路由。
  • Extension: 超大圖像被靜默丟棄:當圖像附件超過 API 限制時,擴充功能 Service Worker 沒有註冊壓縮實現(僅伺服器端的 sharp 實現已註冊)—— 因此 pushImageBlock 中的防禦機制捕獲了異常並完全丟棄了圖像。SW 現在透過 createImageBitmap 探測原始尺寸,並透過現有的離屏文檔路由編碼,因此擴充功能上下文調用者將獲得壓縮後的圖像,而非被丟棄的佔位符。
  • Common: 生成的圖像和截圖被供應商拒絕:Anthropic 將 base64 圖像限制在 5 MB 以內;其他供應商也有類似限制。來自 FLUX / Gemini / Seedream 的生成圖像和大型截圖曾以全尺寸傳輸,導致 4xx 錯誤並中止整個代理輪次。現在設有三層防禦:圖像生成器在存儲前進行壓縮;新的 pushImageBlock 輔助程序將每個 image_url 輸出透過「壓縮或丟棄」路徑路由;截圖重建與實時截圖注入均通過同一輔助程序。採用保守的 4 MB 限制,適用於所有供應商。

版本 0.9.718 (2026年4月22日)

新功能

  • Common: Personal Intuition — 關聯式跨對話記憶:Caiioo 會悄悄記住您以前談論過的內容 —— 涵蓋每一個對話,而不僅僅是當前這一個。當您聊天時,相關的記憶會浮現;您的代理程式可能會直接使用其中一項,或者僅將其作為回覆的背景參考。就像氣味能讓人想起某個地方一樣。您可以在 Personalization → Personal Intuition 下找到此功能;預設為關閉。包含「完整重建 (Full-rebuild)」和「增量回填 (Incremental backfill)」,以便您可以為現有對話建立索引,且私密對話絕不會成為跨對話儲存庫的一部分。
  • Common: Personal Intuition 備份與還原:您可以在 Backup & Restore → Personal Intuition 下將完整的記憶語料庫快照儲存為 JSON 檔案,並在發生問題或想要將其移至其他裝置時進行還原。私密對話絕不包含在內。
  • Common: 所有方案等級預設啟用 Instant Tool Chooser:語義工具選擇器現在可在所有裝置、所有方案等級(包括免費版)上本地運行。在每次對話中僅需約 10 ms 即可選出正確工具,且完全在您的裝置上完成。Settings → Tools 中的選擇器介面將選項明確區分為「Instant Tool Chooser」與「Quick Tasks LLM」(後者使用您在模型選擇器中標記閃電圖示的模型)。
  • iOS / Android: 原生應用程式中的 Instant Tool Chooser:相同的裝置端工具選擇器現在已部署在 iOS 和 Android 應用程式的 WebView 中,而不僅限於瀏覽器擴充功能和桌面版。

改進項目

  • Common: Slate 沙盒允許 HTTPS 指令碼 CDN:HTML slate 成品現在可以從信譽良好的 HTTPS CDN(如 jsdelivr、unpkg 等)載入常用的函式庫,例如 Chart.js 或 D3。資料抓取仍鎖定為同源 (same-origin),因此請使用 bind_data 將附件資料導入 slate。
  • Common: 更清晰的 Personal Intuition 進度顯示:回填功能現在會在設定面板中顯示每個對話的進度(例如「47/75 個對話 · 2,134 個區塊」),而不再是保持靜默直到完成。
  • Common: 記憶索引後的工具選擇速度提升:為大型記憶語料庫建立索引後,不再會清除裝置端檢索器中的工具目錄快取 —— 下一次工具調用將保持熱啟動狀態,而無需支付重新編碼的成本。

錯誤修復

  • Common: 並行子代理程式觸發錯誤的方案升級提示:修復了兩個並行運行的子代理程式可能互相覆蓋活動對話上下文的競態條件,這曾導致 Pro 限制的操作(如 update_slate 等)在錯誤的子代理程式中被拒絕。方案權限執行現在已限定於發送調用的特定對話範圍。
  • Common: Slate CSV 資料綁定導致 forEach 失效:修復了 CSV 綁定資料以非迭代物件形式進入沙盒的問題 —— 現在沙盒 JavaScript 內部的 data.forEach(...) 可按預期運作。

Version 0.9.717 (2026年4月17日)

新功能

  • Common: 所有應用程式統一 Pro 層級:Pro 現在改為單一的 $9/月訂閱制,可解鎖所有 Caiioo 應用程式 — Chrome、Desktop 和 Mobile — 不再按應用程式類別分開計費。Platform ($14/月) 重新定位為「Pro + 基礎設施」(本地伺服器、API 存取預覽、Messaging)。
  • Common: Pro Mobile 層級:提供僅限行動裝置的 Pro 方案,價格為 $2.99/月,直接在 App Store 和 Play Store 銷售。應用內購買本身即為授權證明 — 無需額外許可證。
  • Common: 人機協作的 Ask-User 工具:代理人現在可以在執行中途暫停,並彈出四向決策對話框(核准、核准並附註、拒絕、拒絕並附註)。您的附註會以純英文引導回傳給模型,並覆蓋原定的計劃 — 不會觸發新的循環,代理人將在原地繼續執行。
  • Common: 應用內指南搜尋:直接從 Document 選單搜尋使用者指南。結果會深層連結至 caiioo.ai/guide,並保留現有的重定向流程。
  • iOS: 每月/每年付費牆切換:iOS 訂閱頁面現在允許您在購買前切換每月或每年計費。
  • Desktop: Windows 與 Linux 自動更新:Tauri 桌面應用程式現在出貨時已啟用更新程式,因此 Windows 和 Linux 版本可以原地接收更新,不再需要手動重新安裝。
  • Web: 指南與部落格的分頁搜尋:行銷網站的指南和部落格佈局現在包含一個搜尋欄,支援分頁範圍切換 — 標題匹配的排名高於內文匹配,且活動分頁會自動切換至有結果的地方。
  • Web: 專屬 Linux 安裝頁面:安裝頁面會將 Linux 使用者引導至 /install/linux,其中列出了 AppImage、.deb.rpm 選項以及各發行版的指令。
  • Web: 穩定的下載路徑/download/macos/download/linux/download/windows 現在是穩定的、由 edge-worker 支援的 URL,始終指向最新版本 — 每次發布不再需要重新構建網站。

改進事項

  • Common: 應用內支援工單:支援請求現在以應用內工單流程作為主要路徑,並在發生錯誤時提供更清晰的額度錯誤訊息,引導您前往正確的位置。
  • Common: 更智慧的 Google OAuth 重新驗證:Google 工具現在會驗證 Google 實際授予的範圍 (scopes),並在 403 錯誤指示缺少範圍時,觸發即時重新授權提示,而非靜默失敗。
  • Common: Google 寫入操作使用完整 Drive 範圍:針對 Google Drive 的寫入操作現在會請求完整的 drive 範圍,以便對非您建立的文件進行編輯時能成功執行,而不會遇到權限錯誤。
  • Common: 圖像生成模型描述:圖像生成工具會顯示每個可用模型的描述,以便更輕鬆地為任務選擇合適的模型。
  • Common: 更準確的 Slate Artifact 訊息:當工具建立或更新 Slate artifact 時,模型不再聲稱 artifact 「顯示在編輯器中」 — 措辭現在反映了實際發生的情況。
  • Common: 更好的分頁動態工具選擇:分頁上下文提示現在會發出工具 ID,因此動態工具選擇器可以根據可用的工具實際應用基於上下文的選擇規則。
  • Common: 語音費用歸屬至 Thread:串流 TTS (ElevenLabs, Resemble) 和 STT (ElevenLabs Scribe) 的使用量現在會作為語音費用匯總到發生該行為的對話中,與現有的單次合成路徑一致。
  • Extension: 登入副標題強調本地代理人:登入畫面上的微小文案更新。

錯誤修復

  • Desktop: 恢復 Linux 檔案選擇器:修復了 Tauri 桌面應用程式在 Linux 上檔案選擇器失效的問題。
  • Desktop: 版本回報錯誤:修復了 Tauri 桌面應用程式在 UI 和遙測中回報錯誤版本字串的問題。
  • Desktop: 降低 Linux 音訊噪音並清晰化錯誤:抑制了 Linux 上的 PipeWire 日誌噪音,顯示 OpenRouter 錯誤而非隱藏,恢復了 API 切換讀取路徑,並修復了錯誤的平價橫幅。
  • Common: Gmail 內文提取遺失連結:反轉了 Gmail 提取的優先順序,先嘗試保留連結的 markdown,僅在 markdown 輸出為空時才回退到純文字 — 電子郵件在一般情況下不再遺失連結。
  • Common: 公開 API 設定未持久化:修復了公開 API 切換和存取權杖在某些設定下儲存失敗的問題,並確保這些設定嚴格保持在本地,而不會同步到雲端。
  • Common: 封存與重新命名感覺遲鈍:刪除、封存、取消封存和重新命名現在會樂觀地更新 UI,使列表立即反映更改,而無需等待伺服器往返。
  • Common: 封存刪除未同步:修復了封存刪除直接應用於存儲而繞過協議路徑的問題 — 它們現在會像其他 thread 操作一樣傳播到所有客戶端。
  • Common: 議程顯示錯誤的「缺少範圍」:修復了提醒/議程小工具在您授予 Google Calendar 範圍後立即讀取過時工具上下文配置文件的問題,導致它在工具運作正常時標記缺少範圍。UI 現在會讀取最新的配置文件,且重新整理會自動按順序對任何仍需要的已連接 Google 帳戶執行增量範圍同意流程 — 無需打開同步對話框尋找「授予存取權」。
  • Common: Google 工具調用被拒絕並顯示 "Unknown name exclusiveMinimum":修復了 Gemini 拒絕參數架構中使用數值 exclusiveMinimum / exclusiveMaximum 邊界的工具調用的問題 — 這些現在在發送到 Google 受限的 OpenAPI 子集之前會被移除。
  • Common: 無 DCR 的遠端 MCP 伺服器連線失敗:修復了添加不支援動態客戶端註冊 (DCR) 的遠端 MCP 伺服器(例如 Slack)的問題:客戶端現在遵循 RFC 9728 受保護資源元數據,當授權伺服器與資源主機不同時跟隨 authorization_servers 前往 AS 主機,並停止虛構不存在的 /register 端點。
  • Server: Tester 層級使用者被門控端點拒絕:修復了組織、hub、管理員和預置金鑰端點拒絕有效層級(來自許可證)高於其驗證權杖中快照的過時層級的使用者的問題。門控端點現在評估有效層級的方式與 /api/auth/me 一致。
  • Extension: 身份同步乒乓循環:修復了擴充功能與轉發伺服器之間因身份衝突而在 IDENTITY_SYNC 上無限循環的問題。擴充功能現在會針對相同的衝突遠端確認一次,警告必須在一側登出以解決,並在斷開連線 / 匹配 / 遠端採用時重置。
  • Common: Gemini Flash TTS 無法選擇或配置:修復了 Gemini Flash TTS (語音) 全程無法使用的問題 — 選擇它會在關閉設定時還原,且 API 金鑰欄位似乎不接受輸入。該提供者現在是首選 TTS 選項:選擇會持久化,API 金鑰 + 語音選擇器可正確儲存,且合成使用 SSE 串流端點,因此音訊播放可以在完整語句生成完成前開始。
  • iOS: 新 Thread UI 未切換:修復了 iOS 應用程式無法將活動視圖切換到新建立的 thread 的問題,並修復了可能導致編輯器崩潰的相關 modelName ReferenceError。
  • iOS: 啟動時可選存儲掛鉤崩潰:修復了啟動期間 storage.primeSettingsCache 不可用時的 iOS 崩潰問題 — 該調用現在已受到保護。
  • Common: 定價重塑後的層級審計差異:修復了層級審計發現的六處定價和功能不一致,使授權門控、升級提示和功能旗標在擴充功能、網站和行動應用程式中達成一致。

iOS App Store 合規性

  • iOS: 註冊流程中隱藏外部註冊 CTA:註冊流程不再顯示引導使用者離開裝置進行帳號建立或付費升級的行動呼籲 (CTA)。
  • iOS: 隱藏額度購買 UI:根據 Apple §3.1.1 規則,iOS 上隱藏了額度購買介面;訂閱改由 StoreKit 處理。
  • iOS: 更新支援與額度錯誤措辭:/support 頁面和額度錯誤訊息在 iOS 上已重新措辭,以符合 Apple 關於外部購買引用的指南。

版本 0.9.716 (2026年4月12日)

新功能

  • Common: Gemini 3.1 Flash TTS:由 Google 的 Gemini 3.1 Flash TTS 提供支援的新語音輸出選項。包含 30 種預設語音、70 多種語言,並支援 [whispers][sighs] 等行內音訊標籤以實現富有表現力的合成。請自備 Gemini API 金鑰;可在 aistudio.google.com 免費獲取。音訊帶有 SynthID 水印。
  • Common: 對話總額中的語音成本:文字轉語音和語音轉文字的 API 使用量(Gemini、ElevenLabs、Resemble)現在會與聊天、圖像生成、輔助工具和 OCR 成本一同計入每條執行緒的成本摘要中 —— 因此您看到的數字即為實際總額。
  • Common: SQL 資料庫工具:將 SQLite 資料庫附加到對話中並使用 SQL 進行查詢。結果可以在 Slate artifact 中渲染為即時儀表板。
  • Common: 日曆邀請與 Google Meet:建立日曆活動現在會向參與者發送邀請郵件,並可自動添加 Google Meet 視訊連結。
  • Common: 逐工具供應商路由:透過「設定」將個別工具(圖像生成、搜尋、PDF OCR 等)路由至特定供應商,而非全部經由預設模型處理。
  • Common: 對話分享:將對話分享為 Markdown 或純文字。
  • Common: 14 天平台試用:從擴充功能 UI 或網站帳戶頁面開啟 14 天 Platform 層級試用。Pro 訂閱者亦符合資格。
  • Common: 模型選擇器中的 ZDR 快速篩選:模型選擇下拉選單中的新按鈕,可快速篩選零數據保留(zero-data-retention)模型。
  • Common: 簡化設定:設定現在預設以精簡的「簡單」視圖開啟,僅顯示核心選項。隨時可切換至「進階」模式查看完整內容。
  • Common: 免費 Google Gemini 存取:自備 Google AI Studio 金鑰即可免費使用 Gemini 2.5 Flash —— Google 的免費層級現已開放給所有用戶,無需付費方案。
  • Common: Baseten 自託管模型:連接您自己的 Baseten 部署,直接在 Caiioo 中使用自託管模型。
  • iOS: WhisperKit 裝置端語音轉文字:聽寫功能現在透過 WhisperKit 完全在裝置端執行 —— 音訊絕不離開手機。
  • Android: 裝置端 Whisper STT:透過 whisper.cpp 在 Android 上完全在裝置端執行語音轉文字,並配備麥克風權限流程。
  • Android: GPU 加速 Moonshine STT:在具備 GPU 能力的 Android 裝置上,聽寫可以透過 Moonshine 執行,實現亞秒級推論。僅限英語;whisper.cpp 仍作為多語言備援。
  • Web: 在帳戶與 Hub 頁面使用 Apple 登入:Apple 登入現已在網站帳戶和 Hub 頁面可用。

改進項目

  • Common: 更好的 PDF 匯出:從 Slate 匯出 PDF 現在會產生真正的 PDF 檔案,而非開啟列印對話框,確保您每次都能獲得乾淨的文件。
  • Common: Google Slides 全文:在未指定頁面的情況下請求投影片文字,現在會返回簡報中所有投影片的文字。
  • Common: 更聰明的網頁搜尋:針對近期 Google 版面變動,現在能以更好的結構提取 Google 搜尋結果,更可靠地擷取標題、摘要和連結。
  • Common: 所有平台皆支援 Kokoro 文字轉語音:Kokoro 語音選項現在出現在 iOS、macOS 和 Android 上 —— 此前在原生應用程式中是隱藏的。
  • Common: 更清晰的額度餘額顯示:預付費和自備金鑰(BYOK)設定的帳戶餘額現在顯示您的實際餘額,不再使用令人困惑的「限制(Limit)」框架。
  • Common: 高保真 PDF 轉 Word:PDF→DOCX 匯出現在使用 Slate 中專用的「文件」視圖,產生的 Word 檔案能更忠實地保留來源 PDF 的版面與結構。
  • Web: 更簡潔的帳戶與驗證頁面:在帳戶和驗證頁面停用了 Google Analytics 和 Cookie 同意橫幅,以提供更簡潔的登入流程。

錯誤修復

  • Common: 設定搜尋無法導航:修復了設定搜尋下拉選單和深層連結無法跳轉至多個區塊(API Access、Private Sync、Backup & Restore、Voice 等)的問題 —— 目標類別保持摺疊狀態導致無法捲動至視圖中。
  • Common: 子代理中的 OAuth 提示:修復了從子代理觸發時,OAuth 授權和層級升級提示被靜默丟棄的問題,這曾導致連接流程在執行中斷。
  • Common: 新手引導後未儲存 Ollama 模型:修復了在新手引導期間選擇的 Ollama 模型在之後未持久保存的問題。
  • Common: 速率限制期間 UI 區塊載入失敗:修復了靜態 UI 資源與 API 請求一同被限流的問題,這曾導致在重新整理前出現空白螢幕或面板缺失。
  • Common: Composer 預處理的附件元數據遺失:修復了在發送給模型前,於 Composer 中預處理的文件附件元數據在伺服器端被丟棄的問題。
  • Common: 空閒時間將參加的活動計為忙碌:修復了議程空閒時間計算將您僅作為參加者的活動標記為忙碌的問題 —— 現在僅計算您自己日曆上的活動。
  • Common: Google 搜尋結果損壞:修復了 Google 更改搜尋頁面版面後,網頁搜尋返回空結果的問題。
  • Desktop: Windows/Linux 登入與其他平台不同步:修復了 Tauri 桌面版登入流程與 Chrome/macOS/iOS 分歧的問題 —— 包括錯誤的層級偵測以及登出後無法重新登入。
  • Desktop: 公開 API 阻擋了桌面版 UI:修復了啟用 Public API 設定時,桌面應用程式自身的 UI 被 API 驗證阻擋的問題。
  • Common: Google Docs OAuth 錯誤被隱藏:修復了 Google Docs 操作在驗證過期時靜默失敗而非顯示明確錯誤的問題。
  • Common: 設定面板崩潰:修復了還原已配置的 API 金鑰時設定面板崩潰的問題。
  • Common: Google Drive 同步重複文件:修復了 Google Docs 在每次同步執行時重複建立而非就地更新的問題。
  • Common: Google Drive 同步遺失行內程式碼:修復了將文件同步到 Google Docs 時行內程式碼格式遺失的問題。
  • Common: Gemini 思考內容提取:修復了無法從 Gemini 模型回應中正確擷取思考/推理內容的問題。
  • Common: 切換設定檔數據過時:修復了切換設定檔時有時會顯示前一個設定檔的對話,直到手動重新整理為止。
  • Common: 任務排程器「找不到方法」錯誤:修復了在某些設定下,排程任務每 60 秒拋出一次錯誤的問題。
  • Common: Google Docs 文字插入換行符號:修復了文字插入中出現字面量 而非實際換行符號的問題。
  • Common: 工具上的 Google 帳戶提示:修復了 Google 工具在 API 調用時有時使用錯誤 Google 帳戶的問題。
  • Common: 設定與執行緒匯入往返:修復了設定和執行緒匯出後無法正確匯回的問題。
  • Common: 子代理 Token 使用量:修復了子代理的 Token 使用量未計入父對話的問題。
  • Common: 重試期間的訊息橋接回覆:修復了當助手重試回應時,訊息橋接回覆失敗的問題。
  • Common: Slate 紅線定位:修復了存在 Markdown 時,紅線刪除落在錯誤位置的問題。
  • Common: 瀏覽器連接在睡眠/喚醒後存續:修復了電腦睡眠或長時間閒置後出現「未連接瀏覽器」錯誤的問題。
  • Common: 排程任務在 Service Worker 睡眠後存續:修復了循環任務在長時間閒置後停止的問題。
  • macOS: Safari Google 搜尋失敗:修復了 macOS 上 Safari 擴充功能中 Google 搜尋無法運作的問題。
  • iOS: 行動應用程式存取:修復了 iOS 應用程式錯誤要求付費方案的問題 —— 行動應用程式現已開放給所有用戶。

Version 0.9.715 (2026年4月3日)

新功能

  • Common: Hub 交付系統:第一方工具定義、模式配置和 MCP 目錄現在準備從雲端 Hub 交付,而非硬編碼在軟體包中,並具備本地快取和離線回退機制,為社群發佈做準備。
  • Common: 瀏覽器工具單分頁模式:新的各模式瀏覽器分頁策略,在對話中重複使用單一分頁進行所有導航,防止在 WhatsApp 等訊息密集型工作流中累積過多分頁。
  • Common: API Integration 二進位檔案上傳:api_integration 工具現在支援二進位檔案上傳,並可透過預簽名 URL 直接上傳本地檔案,不再總是將請求主體進行 JSON 字串化。
  • Common: 透過工具進行憑證管理:透過 api_integration 工具以程式化方式儲存、列出和刪除 API 憑證,此前僅能透過 Settings UI 進行。
  • macOS: 音訊輸入裝置選擇:選擇用於語音輸入的麥克風 — 列出所有可用的音訊裝置並持久化您的選擇。
  • Android: 低記憶體下的 OAuth 恢復:Android OAuth 流程現在能在系統因記憶體原因關閉應用程式時,於 Activity 重建後存續,無縫恢復驗證工作階段。
  • Common: 3 層行動端 CSS 架構:全新的行動端響應式 CSS 系統,包含平台層、佈局層和組件層,確保在手機、平板和桌面視窗中擁有一致的 UI。

改進

  • Extension: 透過分頁進行增量 OAuth:增量權限範圍請求現在會開啟完整的瀏覽器分頁而非彈出視窗,解決了需要互動式同意的帳戶發生掛起的問題。
  • Common: MCP 工具 Schema 品質:所有 MCP 工具現在都通過了品質 Lint 測試,驗證了完整的 Schema、正確的描述和一致的參數定義。
  • Extension: 停止時自動關閉瀏覽器分頁:由助手開啟的瀏覽器分頁現在會在執行停止時關閉,且 macOS 上的 OAuth Safari 視窗也會關閉。
  • Android: 工具鏈升級:Android 建置升級至 AGP 9.1、Kotlin 2.2.10 和 Gradle 9.3.1。

錯誤修復

  • Common: Google Docs 表格定位:修復了當表格位於 Google Docs 目標文字之前時,變更會落在錯誤位置的問題。
  • Common: 頁面內容頁尾剝離:修復了頁面內容擷取會錯誤地從擷取頁面中剝離頁尾元素的問題。
  • Common: 網頁瀏覽分頁:修復了在未指定明確 maxLength 時,第 2 頁及之後的分頁失效的問題。
  • Common: 內容腳本回退:修復了當內容腳本不可用時,頁面內容擷取因未能回退至 executeScript 而靜默失敗的問題。
  • Common: URL 導入文件的 PDF 渲染:修復了透過 URL 導入的文件無法進行 PDF 原生渲染的問題。
  • Common: Gemini 工具調用解析:修復了 LLM 工具調用參數中的雙引號鍵導致 Gemini 模型解析失敗的問題。
  • Common: Amazon Nova 相容性:修復了 Amazon Nova 因空白文字欄位而拒絕 tool_call 訊息的問題。
  • Common: Agent 執行未終止:修復了 Agent 執行在 Service Worker 上下文中未能可靠調用 endRun,導致瀏覽器分頁和狀態未清理的問題。
  • macOS: 語音音訊恢復:修復了 macOS 應用程式休眠或 Dock 最小化後語音音訊無法恢復的問題。
  • macOS: 螢幕截圖未出現:修復了由於內容偵測錯誤導致 macOS 螢幕截圖未出現在助手 UI 中的問題。
  • macOS: 定位功能失效:透過增加 CoreLocation 橋接並修復 IP 回退,修復了 Safari 和原生 macOS 應用程式中定位失效的問題。
  • macOS: 缺少定位權限:修復了缺少的定位權限 (Entitlement) 並增加了原生定位逾時時間。
  • iOS: 檔案選擇器失效:透過加入 runOpenPanel 委託,修復了 iOS WKWebView 中檔案選擇器無法開啟的問題。
  • Extension: OAuth 權限過度授予:從網頁彈出視窗和登入後 OAuth 路徑中移除了 include_granted_scopes,以防止非預期的權限範圍膨脹。
  • Extension: 跳過 OAuth 同意畫面:修復了在增量權限範圍請求期間,OAuth 權限提升會跳過同意畫面的問題。
  • Desktop: Windows 上顯示主控台視窗:修復了在 Windows 上啟動 Tauri Sidecar 時出現主控台視窗的問題。
  • Desktop: Windows 建置失敗:修復了 Windows Tauri 建置的 Node 二進位路徑解析並扁平化了 node_modules。
  • Server: 重複的 Webhook 處理:修復了當多個用戶端連接時,Webhook 被多次處理的問題。
  • Server: 購買額度時的促銷代碼:在 Stripe 結帳中停用了購買額度時的促銷代碼功能。

版本 0.9.714 (2026年3月29日)

新功能

  • Common: 重新設計的入門導覽:新的入門畫面呈現 6 條清晰的 AI 存取路徑,讓新用戶更容易理解連接 AI 提供商的選項。
  • Common: Markdown 轉 PDF:從頭開始創建的新文件現在可以匯出為 PDF,將 markdown 內容轉換為格式化的 PDF 輸出。
  • Common: 統一的 Google OAuth:Google 帳戶連接現在使用單一經過驗證且包含所有權限範圍(scopes)的 OAuth 應用程式,取代了之前的多應用程式設置。連接流程更簡單,提示更少。
  • Common: 儲存至 Slate 元參數:工具現在可以透過 _save_to_slate 參數直接輸出到 slate 文件,無需複製貼上即可擷取結構化結果。
  • Common: Slate 錨點連結:帶有 slate 參照的對話訊息現在包含可點擊的錨點連結,可捲動至文件中的相關章節。
  • Common: Sandbox 數據橋接:HTML artifact sandboxes 現在可以透過 postMessage 橋接動態存取 slate 數據,實現即時儀表板和互動式視覺化。
  • Common: 等級徽章:設定、工具和自動化功能現在會顯示等級徽章,標明所需的存取級別,讓擴展存取權限的用戶了解功能限制。
  • macOS: 原生語音轉文字 (WhisperKit):透過 WhisperKit 和 CoreML 進行裝置端語音識別,取代基於瀏覽器的 STT,提供更快速、私密且原生的實現。
  • macOS: Sparkle 自動更新:透過 Sparkle 為 macOS 應用程式和 Safari 擴充功能提供生產級別的自動更新,支援 appcast 饋送和增量更新。
  • macOS: 原生分頁上下文:基於 AppleScript 的分頁上下文提取,讓 macOS 應用程式能夠感知最前端的瀏覽器分頁。
  • macOS: 語音熱鍵串流:語音熱鍵現在在錄音期間顯示即時串流疊加層,並自動加載 WhisperKit 模型。
  • Safari: 原生傳訊:Safari 擴充功能現在透過原生傳訊(native messaging)與 macOS 應用程式通訊,而非 HTTP 輪詢,提高了響應速度和可靠性。
  • iOS/Android: 原生儲存對話框:JSON 匯出現在使用原生儲存對話框(macOS 上的 NSSavePanel,Android 上的 SAF),取代了失效的 blob 下載。
  • Web: Teams 落地頁面:新增 /teams 頁面,為潛在客戶提供團隊和企業傳訊資訊。
  • Web: 部落格區塊:Caiioo 網站新增部落格區塊。
  • Web: 免費試用啟用:帳戶頁面現在支援免費試用啟用,並配有統一的入門流程。
  • Common: 共用雲端硬碟支援:Google Picker 和所有 Drive API 調用現在支援共用雲端硬碟,允許存取團隊共用的文件。

改進項目

  • Common: 適應性問候語:適應性問候語現在會根據自定義歡迎訊息進行延伸,而非忽略它們,從而保留用戶的個性化語氣。
  • Common: OAuth 回呼清理:OAuth 回呼分頁現在會透過倒數計時器自動關閉,不再保持開啟狀態。
  • Common: OAuth 引導:當工具需要帳戶連接時,錯誤訊息現在包含關於應連接哪個帳戶的具體引導。
  • Common: Drive Sync 強制重寫:Drive Sync 工作流現在支援強制重寫選項,用於重新同步所有檔案。
  • macOS: 統一偵錯日誌檢視器:偵錯日誌檢視現在將伺服器、Swift 和 UI 日誌整合到單一的時間線串流中。
  • macOS: 分桶設定儲存 (Bucketed Settings Storage):伺服器儲存適配器重構為分桶架構,具備強健的遷移機制、持久化標記、多設定檔原子性以及「首位寫入者勝出」的衝突解決方案。
  • macOS: 已公證的 Safari 擴充功能:Safari 擴充功能現在使用 Developer ID 簽署並具備公證兼容的權限(entitlements),移除了分發版本對「允許未簽署擴充功能」的要求。
  • iOS: 預設使用 Apple 提醒事項:iOS 和 macOS 現在預設使用 Apple Reminders,並在同步檢視中自動獲取。
  • Common: OAuth 權限提升:增量權限請求不再顯示全部 22 個權限範圍——僅顯示新請求的範圍,並提供更簡潔的帳戶選擇提示。
  • Common: Google 帳戶自動重試:當文件返回 404 錯誤時,系統會在顯示錯誤前自動嘗試其他已連接的 Google 帳戶。
  • Common: 設定深層連結導航:所有設定區塊現在都已正確註冊,支援搜尋和深層連結導航。

錯誤修復

  • Common: 工具路由錯誤:修復了當模型在回應中使用冒號分隔的 tool:action 格式時,工具被錯誤路由的問題。
  • Common: 表格儲存格格式:保留了表格儲存格中的格式和連結,並清除了在儲存格之間洩漏的繼承列表編號。
  • Common: Slate 高亮捲動:修復了 TipTap 編輯器在背景分頁、預覽模式和原生視圖中,使用可靠的 ProseMirror 定位進行的高亮捲動問題。
  • Common: 程式碼區塊文字搜尋:修復了當 slate 文件中程式碼區塊的結構化區塊映射失敗時,回退至文字搜尋的功能。
  • macOS: 模式切換時設定遺失:在 macOS/iOS 上切換模式時,全域設定(API 金鑰、連接)不再被清除——現在由明確的白名單控制哪些設定會重置。
  • macOS: 儲存清理一致性:完整儲存清理現在會一致地清除所有狀態欄位,與 chrome.storage.local.clear() 行為一致。設定檔刪除和保留清理也正確地透過分桶進行。
  • macOS: 設定並行處理:applyModeDefaults 中的設定讀取現在會先獲取鎖定,防止競爭條件。儲存統計數據改從分桶讀取,而非過時的扁平快取。
  • macOS: 遷移穩定性:儲存遷移在失敗時會重試,使用持久化完成標記,並自動清理過時的遷移前數據。
  • macOS: MCP Server 殭屍進程:當 macOS 應用程式退出時,MCP server 子進程現在會被正確終止。
  • macOS: 議程中的行事曆/提醒事項:修復了 Apple Calendar 事件和 Reminders 未出現在議程彈窗中的問題。
  • macOS: Google OAuth 流程:透過轉發伺服器網頁流程路由 OAuth,修復了 Google 登入在 macOS WKWebView 中失敗的問題。
  • macOS: 登出導航:修復了 macOS 上登出後未返回登入畫面的問題。
  • macOS: 遠端存取驗證:透過移除錯誤的驗證要求,修復了 set-remote-access 端點的 401 錯誤。
  • Server: WhatsApp 回覆遞送:修復了 WhatsApp 回覆未回傳至 WhatsApp,僅保留在 PF 對話串中的問題。
  • Server: WhatsApp 轉發逾時:將 WhatsApp 轉發逾時從 120 秒延長至 10 分鐘,並修復了生成錯誤時的處理。
  • Server: 私人同步重新驗證:修復了私人同步重新驗證流程、伺服器端 OAuth 防護以及 macOS 上的登出清理。
  • Server: 本地資料夾同步驗證:修復了本地/網路資料夾同步操作中的 401 驗證錯誤。
  • Server: Google 工作階段重新驗證:當 Google 工作階段過期時,解鎖對話框現在會觸發重新驗證,而非顯示死胡同錯誤。
  • Safari: 擴充功能簽署:透過在 Developer ID 簽署版本中使用不含 get-task-allow 的發佈權限,修復了 Safari 擴充功能顯示為未簽署的問題。
  • Common: OAuth 帳戶不匹配:修復了 OAuth 建立不匹配連接的問題,現在會正確建立新連接,而非使用不同帳戶覆蓋現有連接。
  • Common: OAuth 權限膨脹:修復了不匹配的連接繼承原始帳戶權限範圍的問題,這曾導致非預期的權限過度授予。
  • Common: 對話串列表抹除:修復了 STATE_UPDATE 逾時/重試使用錯誤欄位名稱的問題,該問題可能導致對話串列表被抹除。
  • Common: 等級徽章準確性:修復了等級徽章在免費層級功能上錯誤顯示為 "Tester" 的問題。
  • Common: 設定面板溢出:修復了設定面板卡片列中的 flex 溢出導致的佈局問題。
  • Server: 私人同步 API 金鑰遺失:修復了在裝置間同步時私人同步遺失 API 金鑰的問題。
  • Server: 傳訊橋接:修復了傳訊橋接中的封存對話、停止按鈕和模式選擇。
  • macOS: 自定義模式設定遺失:修復了由於無效的儲存路徑導致自定義模式設定在 macOS/iOS 上靜默遺失的問題。
  • macOS: OpenRouter 標頭被阻擋:修復了轉發 CORS 阻擋 macOS/iOS 上 OpenRouter 歸屬標頭的問題。
  • macOS: 分頁上下文切換:修復了在瀏覽器分頁之間切換時,分頁上下文未更新的問題。

版本 0.9.713 (2026年3月28日)

新功能

  • Common: 子代理 (Sub-Agents):完整的子代理系統,具備持久化具名代理、對話歷史記錄、並行執行(委員會模式)、順序與插話模式、中止級聯,以及帶有按時間順序狀態追蹤的專用 UI 渲染。
  • Common: MCP 工具審批:已註冊的 MCP 工具現在會出現在工具審批系統中,讓用戶能夠查看並控制代理可以調用哪些 MCP 工具。
  • macOS: 側邊欄推播模式 (Sidepanel Push Mode):側邊欄現在除了覆蓋模式外,還支持推播模式,預設寬度為 425px,且停靠寬度可在不同會話間持久保存。
  • Server: WhatsApp 富媒體訊息:WhatsApp 連接現在除了文字和媒體外,還支持位置共享、聯絡人、回應(reactions)和貼圖訊息。
  • Server: API Key 靜態加密:存儲在 relay D1 存儲中的 API keys 現在進行靜態加密。服務器端 OAuth 金鑰在本地保存後會被刪除。

改進

  • Common: 模型別名顯示:子代理工具調用參數現在會顯示註釋的模型別名,以便於識別。
  • Common: BYOA 連接優先級:擴大範圍的 OAuth 請求現在優先選擇 BYOA 替代連接而非基礎連接,減少不必要的重新驗證提示。
  • Common: 思維簽名保留:現在為 OpenAI Responses API 和 Gemini 多輪工具調用流程正確保留思維/推理簽名。
  • macOS: 偵錯日誌傳播:偵錯日誌切換現在會傳播到 Node.js 服務器子進程。
  • Common: 孟加拉語支持:平台和網站現在支持孟加拉語,並更新了網站上的商標免責聲明和媒體貼文。

錯誤修復

  • Common: Safari/WKWebView 串流:為 kokoro-js 填充了 ReadableStream 異步迭代,修復了 Safari 和 WKWebView 中的 TTS 串流失敗問題。
  • Common: 自定義模式創建:修復了導致自定義模式在首次嘗試創建時失敗的過時 React 閉包問題。
  • macOS: 代理存儲變更丟失:由於缺少持久化橋接,macOS 上的代理子進程存儲變更(模式創建、設置、技能)會靜默丟失。
  • macOS: 剪貼板複製:修復了 macOS WKWebView 中剪貼板複製靜默失敗的問題。
  • macOS: WKWebView 中的 WASM/WebGPU:在 macOS 原生應用中強制為 TTS/STT 和本地 ONNX 路徑使用 WASM 後端 —— CDN 跨域導入和 WebGPU JSEP 模組導入在 localhost WKWebView 中會失敗。
  • macOS: 傳輸請求衝突:修復了 requestId 衝突導致 macOS 上工具審批中斷的問題,並改進了 MCP 顯示名稱。
  • macOS: WhatsApp 自動回覆:修復了 macOS relay 服務器上 WhatsApp 自動回覆的端到端連線,包括線程可見性。
  • iOS: 語音聽寫卡住:修復了當跳過 stopRecording 清理時,語音聽寫卡在錄音狀態的問題。
  • Safari: 瀏覽器命令超時:修復了由於 Service Worker 掛起後 WebExtension API 停滯導致的 Safari 瀏覽器命令超時問題。
  • Safari: 心跳過時檢查:跳過 Safari HTTP 輪詢瀏覽器的心跳過時檢查,以防止錯誤斷開連接。
  • Server: 私有 Relay 穩定性:修復了 Durable Object 休眠、空閒超時 (1006)、重連延遲、過時 Socket 處理以及殭屍 readyState 問題。消除了 serverState 與 ctx.state 之間的歧義。
  • Server: Webhook 廣播:Webhook 現在在 DO 休眠喚醒後向所有服務器 Socket 廣播,以解決殭屍 readyState 問題。
  • Server: MV3 訊息傳遞競爭:修復了 Webhook 到達時延遲初始化訊息橋接的競爭條件,防止 MV3 Service Worker 崩潰。
  • Server: Webhook 驗證 CORS:通過服務器路由 Webhook 驗證測試,以避免瀏覽器中的 CORS 拒絕。
  • Extension: 登出清理:登出現在能正確清除 macOS 上的本地 relay 服務器會話,並檢測 localhost 環境。
  • Common: 安全性 — 線程隔離:狀態廣播現在按當前配置文件過濾線程,防止跨配置文件數據洩漏。

版本 0.9.712 (2026年3月26日)

新功能

  • Common: WhatsApp 連線診斷:WhatsApp 的測試連線功能現在除了檢查 API token 外,還會檢查 webhook 訂閱狀態和 app secret 有效性,以捕捉來自 Meta 的隱性傳送失敗。
  • macOS: 原生 OAuth 流程:macOS app 現在使用 ASWebAuthenticationSession 進行 OAuth,取代瀏覽器重定向,並會自動升級缺乏 refresh tokens 的過期連線。

改進事項

  • Common: DOCX 搜尋/取代穩定性:DOCX 文件的搜尋與取代功能現在可處理雙空格、不換行空格、智慧引號、數字實體以及大小寫不匹配。包含當精確匹配失敗時的區分大小寫回退機制,以及取代多個實例時的警告。
  • Common: DOCX 列表編號:DOCX 匯出現在會生成正確的 Word 列表編號 (w:numPr),而非字面上的項目符號字元,使 Word 能正確識別編號和項目符號列表。
  • Common: Agent 啟動效能:消除了由幽靈 MCP 伺服器、HTTP 就緒逾時和冗餘模型獲取所導致的 30-50 秒 Agent 啟動延遲。模型快取現在會傳遞給 Agent 子程序。
  • Server: 安全強化:修復了 URL 處理程序中的指令注入漏洞、採用定時安全(timing-safe)的 token 比較、在 relay 伺服器上加入 Content-Security-Policy 標頭、對 session 端點進行速率限制、將 CORS 限制在已知來源,以及平行 E2E 廣播加密。
  • Server: Webhook 簽名驗證:Webhook 負載現在使用 base64 編碼的原始主體,以防止因 JSON 來回轉換損壞而導致 HMAC 簽名失效。
  • Server: OAuth Token 持久化:修復了伺服器狀態物件之間的裂腦(split-brain)問題,該問題曾導致 OAuth 連線(Google Drive 等)在 app 重啟後遺失。
  • macOS: 效能與穩定性:選單驅動的系統匣輪詢(原為無條件 3 秒定時器)、防抖處理的視窗狀態儲存、非阻塞式日誌記錄、具備指數退避機制的 WKWebView 崩潰恢復,以及修復腳本訊息處理程序的記憶體洩漏。
  • macOS: 集中式日誌:Relay 伺服器輸出和 app 生命週期事件現在會記錄到 ~/Library/Logs/caiioo/ 並具備 10MB 自動輪替功能,取代了先前會被默默捨棄的輸出。

Bug 修復

  • Common: 檔案選取器指令pick_files 工具現在會向使用者回傳清晰的指令,而非導致靜默失敗的無效 UI 動作訊號。
  • Server: 活動分頁輪詢垃圾訊息:當沒有瀏覽器擴充功能連線時,relay 模式下的活動分頁輪詢不再產生無止盡的逾時錯誤。在連續失敗時採用指數退避(30 秒至 5 分鐘)。
  • Server: 原生 App 的 CORS 問題:修復了 127.0.0.1 來源被 CORS 白名單阻擋的問題,該問題曾導致 macOS 原生 app 的 WKWebView 無法進行 Google OAuth。
  • Server: 孤兒 Agent 程序:現在在伺服器關閉和發生未捕獲異常時,會正確清理 Agent 子程序。
  • macOS: 瀏覽器編排器日誌垃圾訊息:修復了擴充功能連線中瀏覽器協定訊息的「Unhandled message type」警告。

版本 0.9.711 (2026年3月24日)

新功能

  • Common: 自動儲存設定:設定欄位現在會在編輯時自動持久化,文字欄位設有 500ms 的防抖(debounce)處理,切換開關/選擇框則立即儲存,防止因程式崩潰或頁面導覽導致資料遺失。

改進項目

  • Common: 保留 DOCX 編號格式:編號型 DOCX 章節中的製表符(Tab characters)(例如法律文件中的「3.2.3 → 標題」)現在會在編輯往返過程中保留,不再被無故刪除。
  • Common: 更智慧的工具選擇:動態工具選擇器現在能處理需要網路驗證的事實查詢(營業時間、價格、地址),而不僅僅是匹配嚴格的觸發詞。
  • Common: Agent 語言變更:由 Agent 發起的語言變更現在會立即生效,不再需要手動切換設定。
  • Common: 多帳號 OAuth 備援機制:當主要 Google 帳號缺乏所需權限範圍(scopes)時,系統會在提示重新驗證前先檢查已連接的次要帳號。修復了次要帳號權杖(tokens)過期時未捕獲的錯誤。
  • Server: 模式設定驗證:Server 現在會在儲存設定時驗證方案權限,防止免費版用戶持久化專業版(pro-tier)設定。
  • Common: 安全性強化:對推理預覽輸出進行 DOMPurify 淨化處理、限制 CORS 僅允許已知來源、優先使用 HTTPS 進行 IP 地理位置查詢,並收緊了 web_accessible_resources 限制。

錯誤修復

  • Common: Google 搜尋結果 URL:瀏覽器 Google 搜尋現在會回傳帶有實際 URL 的結構化連結。先前由於 AgentMarkdown 遺失了來自 Google 複雜嵌套 HTML 的連結 href,導致 Agent 需要 5 次工具調用才能提取 URL —— 現在連結會直接從 DOM 中提取並包含在首次搜尋結果中。
  • Common: Private Sync 無限迴圈:修復了因 manifest 備份檔案寫入持續觸發重新同步而導致的同步迴圈。空設定物件現在能正確地在裝置間傳播。
  • Common: 訊息橋接更新:傳入訊息、Agent 回覆和轉發(relay-back)回應現在會立即廣播至 UI,而非等到 Agent 完成回應後才顯示。
  • Extension: Private Relay 重新連線:修復了 MV3 service worker 重啟後 Relay 保持斷開狀態的問題,改為回退至儲存的啟用狀態。同時修復了 enable() 期間的自我替換競爭條件(race condition)以及身份變更時的重新連線問題。
  • Extension: Private Relay 競爭條件:強化了啟用/停用時的競爭條件處理,在訊息橋接回呼中加入了未處理拒絕(unhandled rejection)防護,並修復了設定面板卸載時的計時器洩漏問題。

版本 0.9.710 (2026年3月22日)

新功能

  • Common: Zero-Day Risk (ZDR) 強制執行:與 OpenRouter 進行即時 ZDR 數據同步並提供強制執行開關 —— 可查看供應商數量明細,並封鎖被標記為具有零日風險的模型。
  • Common: 工具調用修復 (Tool Call Healing):現在會自動檢測並修復在推理區塊中發出 XML 工具調用的弱模型,提升非前沿模型 (non-frontier models) 的可靠性。
  • Common: 統一 Token 生命週期:透過統一的 TokenLifecycleManager 在所有平台(擴充功能、伺服器、macOS、iOS)實現對稱的 OAuth Token 刷新,並在過期前進行主動刷新。
  • iOS: Composer 圖示縮放:iOS 上的 Composer 操作圖示現在縮放 1.18 倍以獲得更好的點擊目標,並為平台特定樣式增加了專用的 native-ios body class。

改進事項

  • Common: Slate 建議修改:Slate 編輯器中建議修改之間的導航、基於懸停的接受/拒絕以及計數更新現在可以正常運作。
  • Common: Slate 選擇器下拉選單:Slate 類型選擇器現在使用內嵌下拉選單而非門戶化彈窗 (portaled popover),修復了 z-index 和定位問題。
  • Common: Propose Change 全文替換propose_change 現在允許對小型文件(500 字元或以下)進行全文替換,而不再要求局部編輯。
  • Common: 語音發送等待逐字稿:在錄音時按下發送/回車鍵,現在會等待逐字稿完成後再發送,防止發送空白或不完整的訊息。
  • Common: Private Sync 設定流程:在 Private Sync 設定期間,密碼對話框會在 OAuth 後自動顯示,簡化了新手引導流程。
  • Common: BYOA 註冊表刷新:BYOA 供應商註冊表現在會在 Private Sync 下載新憑證後重新初始化,確保匯入的連線可以立即使用。
  • Common: 術語一致性:用戶指南內容中的「Cloud Sync」更名為「Private Sync」,並增加了術語防護測試以防止回歸。
  • Server: Private Relay 穩定性:更新了相容性日期,改進了 Durable Object 崩潰處理,並強化了 MV3 重新連線邏輯以實現可靠的長效連線。
  • Server: 排除 Private Sync 設定:Private Relay 設定不再包含在雲端同步負載中,防止跨裝置的 Relay 配置衝突。

錯誤修復

  • Common: SVG 圖片處理:SVG 檔案不再作為 image_url 發送給供應商,這曾導致不支援 SVG 格式的模型出現 HTTP 400 錯誤。
  • Common: Private Sync 競態條件:修復了 Private Sync 初始化期間因競態條件導致的訊息轉發失敗。強化了同步迴圈和隔離 (quarantine) 邏輯。
  • Common: Private Sync 數據刪除:停用 Private Sync 後,雲端數據刪除和稽核現在可以正常運作。
  • Common: 模型匹配污染:修復了自動調整系統中的跨系列模型匹配問題,該問題曾導致模型在不同供應商系列之間錯誤映射。
  • Common: 動態工具選擇器:強化了動態工具選擇器的提示詞,以防止可能導致工具選擇失敗的代理式推理 (agent-like reasoning)。
  • Common: 驗證錯誤訊息:必填欄位驗證現在返回具體的錯誤訊息,而非通用的失敗提示。
  • Extension: Private Relay WebSocket 斷連:修復了因 MV3 service worker 暫停導致 WebSocket 連線在約 60 秒後斷開的問題。改進了 Keepalive 和重新連線邏輯。
  • Extension: Google OAuth 增量權限範圍:修復了在擴充功能環境中使用 launchWebAuthFlow 進行 OAuth 權限範圍擴展時靜默失敗的問題。
  • Extension: Relay 切換設定重載:抑制了切換 Relay 時不必要的設定重載,防止 UI 閃爍和診斷噪音。
  • Server: Durable Object 休眠:修復了 Durable Object 休眠後的 WebSocket 關閉處理,該問題曾導致連線處於陳舊狀態。
  • Server: 訊息憑證持久化:訊息憑證現在在更改時立即持久化,而不再等待下一個儲存週期。
  • iOS: 陳舊的 WebSocket 回呼:WebSocket 處理程序現在在關閉時會被清除,防止 iOS 重新連線後觸發陳舊的回呼。
  • Desktop: NSIS 安裝程式上傳:Windows NSIS 安裝程式現在可以透過 API 正確上傳到草稿發佈版本。

版本 0.9.709 (2026年3月21日)

新功能

  • 通用:Slack 訊息配接器:為訊息橋接器新增 Slack Events API 配接器,支援機器人簽名驗證、媒體下載支援以及設定介面配置。
  • 通用:Slate 檔案雙向編輯:可直接在 Slate 中開啟並儲存本地檔案,具備檔案系統句柄持久化與基於雜湊(hash)的變更追蹤功能。Slate 選擇器對話框中的新「載入檔案」按鈕可預處理文件並使用正確的編輯器開啟。
  • 通用:Slate 檔案選單重構:檔案類型選單重組為文件(Documents)、可渲染(Renderable,如 HTML/Vega/Mermaid)以及程式碼與數據(Code & Data)類別,並在重新命名時自動偵測。
  • 通用:遠端瀏覽器應用程式:遠端瀏覽器用戶端現在可以透過 Private Relay 獲取側邊欄資源,實現無需安裝擴充功能即可透過瀏覽器存取。
  • 通用:Private Relay 中的裝置識別:Relay 用戶端現在會顯示易於辨識的裝置名稱。當被另一個裝置取代時,介面會顯示是哪個裝置取代了您。
  • 通用:Composer 麥克風按鈕重新設計:麥克風按鈕重新設計為顯眼的膠囊狀按鈕(chip/pill),具有清晰的錄音狀態指示器、針對行動裝置的 44px 最小觸控目標,以及在輸入區域上方渲染的語音疊加層。
  • 通用:使用者指南連結:使用者指南現在已連結至「文件與法律」設定區塊。
  • iOS:BYOA 設定限制:行動裝置上的 BYOA 精靈現在會顯示訊息,引導使用者在桌面端設定 Private Apps,因為 8 步驟的瀏覽器流程在行動裝置上難以操作。
  • 伺服器:登入挑戰:基於電子郵件的 6 位數 MFA 登入驗證,具備同意追蹤與工作階段撤銷功能。

改進項目

  • 通用:私有同步設定優先:設定現在會先於對話進行同步,確保權杖(tokens)和配置能立即可用,而大量對話串同步則在背景持續進行。
  • 通用:WebSocket 請求關聯:WebSocket 和 Private Relay 傳輸現在會正確等待伺服器回應,而非立即完成,修復了 macOS 側邊欄和 Relay 用戶端上的 40 多項介面操作(如 Drive 稽核、Ollama 測試、MCP 操作等)。
  • 伺服器:Webhook 簽名驗證:將 Webhook 簽名驗證移至路由層級的應用程式金鑰(app secret),以實現更簡潔的架構。

錯誤修復

  • 通用:WhatsApp 回應傳遞:修復了代理程式回應被靜默吞沒而未傳回 WhatsApp 的問題。訊息回傳路徑現在會在傳遞失敗時記錄診斷詳情,使未來的問題能立即被診斷。
  • 通用:跨模型的思考區塊簽名:修復了從非 Claude 模型切換到具備思考模式的 Claude 時出現的「思考區塊簽名無效」錯誤。推理格式偵測現在預設為「unknown」,而非錯誤地識別為 Anthropic 格式。
  • 通用:新文件的 Slate 可編輯性:新的 DOCX、PDF、RTF 和 XLSX Slate 現在能正確在各自的編輯器中開啟,而非渲染為靜態 HTML。
  • 通用:Slate 匯出備案:不含原始二進位數據的新文件現在能順暢匯出 —— XLSX 回退至 CSV,RTF 轉換為 HTML,PDF 則使用瀏覽器列印。
  • 通用:Sandbox 預覽渲染:修復了因 postMessage 目標中的 Sandbox 來源不匹配導致的空白 HTML 和 Vega 預覽。
  • 通用:修訂追蹤欄位偏移:修訂追蹤中的刪除操作現在能正確對應 HTML 到文字的偏移,修復了 TipTap 中位置偏移的變更。
  • 通用:私有同步驗證恢復:同步過程中過期或被撤銷的 OAuth 權杖現在會自動觸發重新授權,而非要求手動重新連線。
  • 通用:語音串流草稿指示器:語音轉錄疊加層現在會顯示「預覽」狀態並降低透明度,以提示該文字在停止錄音前僅為過渡內容。
  • 通用:原生平台上的 MCP 工具:本地 MCP 伺服器工具現在已在 macOS、Windows 和 Linux 上正確註冊 —— 此前處理程序雖啟動了 MCP 程序,但未曾獲取或註冊其工具。
  • 通用:Slate 上下文標籤更新:當 Slate 分頁標題在從 Drive 或 GitHub 載入後發生變更時,活動分頁上下文標籤現在會從儲存空間重新整理。深色模式下的標題輸入文字不再無法閱讀。
  • 擴充功能:Chrome Stub Polyfill:在 localhost 且具有 window.chrome 但無擴充功能 API 的 Chrome 瀏覽器分頁,現在會獲得正確的 Stub 注入而非被跳過。
  • 擴充功能:Relay 用戶端封裝當機:透過定義建置時環境變數,修復了 Relay 用戶端 IIFE 封裝中的 import.meta.env 當機問題。
  • 擴充功能:遠端應用程式登入:清理了遠端瀏覽器應用程式的登入方式,將 Google OAuth 作為主要方法,並將電子郵件/密碼作為收摺的次要選項。

版本 0.9.708 (2026年3月19日)

改進項目

  • Common: 生成指示器協調:每條訊息的輸入中點點現在與執行緒層級的備用指示器協調,消除了生成期間重複跳動的點點。點點現在會在推理和工具執行階段持續顯示,僅在最終答案開始串流時隱藏。
  • Common: 串流游標:串流文字末尾現在會出現閃爍游標,提供回應仍在生成中的清晰視覺指示。
  • Common: 推理預覽格式化:摺疊的推理區塊現在會渲染行內粗體和斜體格式,而非原始的 markdown 語法。
  • Common: Slate 文件列表list_slates 現在能正確顯示透過輕量級執行緒查詢載入的 DOCX、PDF 和 XLSX 檔案內容大小。列表現在也包含編輯 DOCX 和 XLSX 文件的流程指引。
  • Common: Private Sync 設定區塊:Private Sync 設定現在移至獨立的專屬區塊,與一般設定分開,使組織更清晰。
  • Extension: 連線設定重構:Private Relay 區塊重組為兩個清晰的子區塊 —— Private Relay(遠端存取切換開關,始終可見)和 Caiioo Bridge(本地 MCP 伺服器和系統工具)。遠端存取切換開關不再需要 Bridge 正在執行。
  • Desktop: Tauri 統一二進位檔:Windows/Linux 桌面應用程式從編譯時變體整合為單一二進位檔,並採用執行時等級門控 —— 側邊欄的可見性由執行時的訂閱等級決定。

錯誤修復

  • Extension: 無需 Bridge 的 Private Relay:Private relay 現在可以獨立連接,無需 Caiioo Bridge 應用程式。先前,身分驗證僅由 Bridge 連線初始化,導致僅使用擴充功能的用戶(包括 Linux/Windows)無法接收訊息 Webhooks 或使用遠端存取。
  • Extension: Google OAuth 路由:修復了 Chrome 上 OAuth 彈出視窗失敗的問題,當 getAuthToken 不可用時會跳過並回退至 BYOA 憑證。COOP 彈出視窗韌性處理可防止在限制性網站上出現空白視窗。
  • Common: ElevenLabs 串流 STT:修復了當 ElevenLabs 串流遇到連線中斷時,語音轉錄掉話或失敗的問題。原生應用程式語音輸入現在可以優雅地回退。
  • iOS: WKWebView 中的外部連結:應在 Safari 中開啟的連結現在能正確地在外部開啟,而非在應用程式的 WebView 內載入。
  • Common: 廣告攔截器孤立規則:修復了 Service Worker 重啟後動態 DNR 廣告攔截規則持續存在的問題。disableAllBlocking 現在即使在攔截器實例為 null 時,也會直接查詢並移除孤立規則。
  • Common: 切換設定檔時的授權同步:切換設定檔現在會從伺服器同步授權,確保等級門控工具立即重新整理,而無需重啟。
  • Common: 佈署前的 Token 刷新:過期的 OAuth token 現在會在佈署 API 金鑰前刷新,防止無聲失敗。新伺服器現在可以採用現有的身分連線。
  • Web: iOS Safari 上的行動版選單:行銷網站上的漢堡選單在 iOS Safari 上不再是透明的。
  • Common: React-18 批次處理競態:新增執行緒層級生成指示器作為備用方案,以應對 React-18 狀態批次處理導致每條訊息輸入點點無法顯示的情況。

版本 0.9.707 (2026年3月17日)

改進項目

  • BYOA 重新配置預填:重新配置現有的 Google 或 Microsoft 私人應用程式時,現在會預填用戶端密鑰和租戶 ID,無需重新輸入。

  • 模型列表排序:每個供應商群組內的模型現在按發佈日期排序(最新優先),確保跨平台排序的一致性。

錯誤修復

  • 私人同步驗證恢復:修復了私人同步初始化期間的 OAuth 權杖失敗(工作階段過期、權杖撤銷、Chrome 設定檔權杖),現在會正確顯示在 UI 中,而非靜默進入錯誤狀態。

  • Slate 修訂追蹤可靠性:針對修訂追蹤進行了 10 項關鍵修復 —— 修訂合併競態條件、所有更新路徑的差異基準持久化、DOCX 匯出格式保留、用於 TipTap 匹配的 HTML 標籤剝離、全部接受/拒絕排序,以及實體轉義和標籤正規表達式匹配的收斂修復。

  • Slate 資料完整性:修復了貼上圖片寫入失效本地快取、雲端來源元資料未持久化,以及中繼/行動模式下即時 AI 更新的 BroadcastChannel 回退機制。

  • Slate 安全性:修復了圖片檢視器中的 XSS 注入問題,並將萬用字元 postMessage 來源替換為限定範圍的擴充功能 URL。

版本 0.9.706 (2026年3月16日)

新功能

  • 供應商錯誤橫幅:當 AI 供應商傳回錯誤(如 402 需支付費用、缺少 API 金鑰、速率限制)時,現在會顯示具備操作指引的橫幅,提供明確說明而非通用的失敗訊息。

改進項目

  • DOCX 跨區段編輯propose_change 工具現在能正確處理跨多個格式區段(例如部分粗體文字)的搜尋/取代操作。意圖將被傳遞,以便代理程式進行上下文編輯。

  • PDF 儲存效能:原生 PDF 儲存速度顯著提升 —— 消除冗餘解析、快取匯入模組,並跳過不必要的運算符清理。

  • 訊息傳遞中的模式名稱:訊息設定模式選擇器現在會顯示模式的品牌名稱,而非內部 ID。

錯誤修復

  • Google OAuth 權杖重新整理:修復了重新整理 Google OAuth 權杖時出現的「未授權」錯誤,該錯誤曾導致無法存取日曆、Gmail 和雲端硬碟。

  • 預置金鑰錯誤訊息:使用預置 API 金鑰的使用者不再看到誤導性的「增加資金」錯誤 —— 訊息現在會解釋實際問題及後續步驟。

  • 並行執行緒競態條件:修復了在生成過程中切換執行緒可能導致 GENERATION_COMPLETE/ERROR 事件套用到錯誤執行緒的問題。

  • 修訂歷史還原按鈕:當目前內容與所選修訂版本不一致時,Slate 修訂歷史中的還原按鈕現在會正確顯示。

  • 重複 OAuth 彈出視窗:新的 Chrome 擴充功能使用者在首次登入時,不再會看到兩個 OAuth 彈出視窗。

版本 0.9.705 (2026年3月15日)

新功能

  • 設定類別分組:19 個設定區塊現在被整理成 5 個可摺疊類別,以便逐步揭露資訊。「代理模式」區塊顯示了與受影響區塊(工具配置、模型配置、外觀)導覽連結的交叉指示。API 提供者區塊預設開啟,並附有模型功能警告。

錯誤修復

  • 議程同步重複行事曆:當同一個電子郵件同時存在登入(身分)連線與私有連線時,Google Workspace 行事曆帳戶不再重複出現在同步分頁中。連線在渲染前會先進行去重處理。
  • i18n 設定類別:設定類別標籤現在已翻譯成所有支援的語言。

版本 0.9.704 (2026年3月14日)

新功能

  • Microsoft 365 整合基礎:新增 Microsoft 權限範圍路由、Graph API 客戶端,以及支援 BYOA 的帳戶服務。為 Microsoft 提供商定義了權限層級結構與工具範圍註冊表擴展。Microsoft 已作為 relay-proxied 提供商加入。
  • 豐富內聯渲染 (RIR):用於在聊天訊息中內聯渲染豐富內容的新編解碼器架構。包含 HTML、Markdown 和 DOCX 編解碼器,並具備可擴展的編解碼器介面。
  • PDF 結構樹與佈局分析:用於語義化文件理解的標記化 PDF 結構樹解析器。針對未標記 PDF 的啟發式段落分組提供回退佈局分析。支援圖片替換/插入及內容溢出檢測。
  • 訊息模式選擇:Messaging bridge 設定現在包含預設模式選擇器,讓代理在處理傳入訊息時能以正確的個性進行回覆。

改進事項

  • 提供商速率限制重試:所有 LLM 提供商現在遇到 429 (速率限制) 和 529 (負載過重) 回應時,將自動以指數退避演算法進行重試,而非立即失敗。最多重試 3 次並包含隨機抖動 (jitter)。
  • Google OAuth 權限範圍超集匹配:寫入權限現在可滿足讀取權限需求(例如:drive 涵蓋了 drive.readonly)。這能防止在已授予更廣泛權限時進行不必要的重複授權。
  • BYOA 全權限初始認證:當需要私有連接 (Private Connection) 時,初始認證流程現在會預先請求所有必要權限,而非提示兩次(一次基本權限,一次擴展權限)。
  • Google 404 轉擴展存取提升:當 BYOA 連接在存取 Google Workspace 檔案收到 404 錯誤時,該錯誤會提升為擴展存取提示,而非顯示死胡同般的錯誤訊息。
  • 訊息憑證私密同步:Messaging bridge 憑證現在透過端到端加密的私密同步在裝置間同步,不再僅限於特定裝置。同步清單版本已升級至 v10。
  • OAuth 等待逾時延長:BYOA 與擴展存取 OAuth 流程的逾時時間現已延長至 5 分鐘(原為 2 分鐘),為用戶提供足夠時間完成 Google Cloud Console 的步驟。
  • Sparkle 框架簽署:macOS 發行版本現在會依據由內而外的順序正確簽署 Sparkle 框架的嵌套二進位檔,修復了公證 (notarization) 失敗的問題。
  • Tauri Node 二進位檔打包:Tauri 配置現在將 Node.js 二進位檔打包為資源,以便在 Windows/Linux 上作為 sidecar 執行。
  • 訊息設定搜尋:Messaging bridge 區塊現在可透過設定搜尋列搜尋,支援 "whatsapp"、"telegram"、"webhook" 等關鍵字。
  • 設定中繼轉發:設定儲存現在會透過 WebSocket 橋接轉發至中繼伺服器 (relay server),確保訊息憑證與其他配置變更同步至伺服器的狀態檔案。

Bug 修復

  • Slate 貨幣與數學公式衝突:Markdown 表格中的金額(如 $9/mo)不再被誤判為 LaTeX 內聯數學定界符。數學正則表達式現在會尊重轉義後的貨幣美元符號。
  • 對話頁面 ToastProvider:彈出式對話分頁先前缺少 ToastProvider,導致依賴 Toast 的功能靜默失效。現在提供商樹狀結構已與側邊欄一致。

Version 0.9.703 (2026年3月14日)

新功能

  • Google Picker 整合:完整的 Google Drive 檔案選取器,採用彈出視窗/iframe 混合模式,支援多視圖篩選(Docs、Sheets、Slides、PDFs),並在編輯器中提供雲端硬碟引用標籤。透過 Google Picker 選取的檔案會自動獲得 drive.file 存取權限。
  • Google Sheets 原生同步:在 Slate 中開啟 Google Sheets,支援完整的儲存格級別雙向編輯。Sheets 編解碼器可將試算表網格數據轉換為 TipTap HTML 表格並還原,並透過 Drive 的 modifiedTime 進行衝突檢測。支援讀取、批量儲存格更新及結構性變更(新增/刪除工作表、合併儲存格)。
  • Google Slides 唯讀檢視:Google Slides 簡報可在 Slate 中渲染,顯示投影片縮圖並提取文字內容以供搜尋。
  • Gmail 批量獲取與 Markdown 轉換:Gmail 工具現在改為批量獲取郵件元數據(一次最多 100 條)而非逐一獲取,具備 5 分鐘標籤名稱快取,並自動將郵件正文從 HTML 轉換為 Markdown,以便 LLM 更清晰地讀取。
  • 選取內容浮層:在任何網頁上選取文字時會出現「新增至提示詞」按鈕,讓您快速將選取內容加入對話。
  • Relay 浮層管理器:Agent 浮層指令現在透過瀏覽器擴充功能路由,實現由 Agent 驅動的活動網頁 UI 浮層。
  • 行內快速任務模型選取器:快速任務的模型選擇現在直接嵌入在模型選取下拉選單中,不再使用獨立選單。
  • 從 Google Drive 匯出 Slate DOCX:在 Slate 中載入的 Google Docs 現在可匯出為 DOCX(透過 readFileContentAsBinary),啟用具備修訂追蹤功能的完整 TipTap 視覺化編輯器,而非僅以純 Markdown 開啟。
  • 私有連線設定精靈:改進的 BYOA 精靈,新增專用的「新增測試使用者」步驟,與目前的 Google Cloud Console 流程一致。授權畫面子步驟現在遵循 Google 實際的 4 步摺疊面板。當使用者身份已知時,電子郵件說明將進行個人化處理。
  • 私有連線推廣橫幅:當 Agent 需要擴展 Google 權限範圍(Gmail、Calendar 等)且不存在私有連線時,會出現動畫橫幅,提供一鍵通往設定精靈的路徑。使用者完成設定期間 Agent 會保持暫停,並在連線儲存後自動恢復。
  • 匯出忠實度警告:在將文件匯出為不同格式(例如 PDF 轉 DOCX)之前,忠實度對話框會針對潛在的格式損失發出警告,並按嚴重程度分類(資訊、警告、嚴重)。
  • PDF 註釋提取:在文件處理和重建過程中,現在會提取並保留 PDF 文字註釋和標記。
  • 提醒事項行事曆同步:提醒事項彈窗現在支援行事曆同步,並設有擴展存取權限管控。

改進項目

  • Google Docs 同步忠實度:改進了格式跨度提取,具備正確的標籤匹配(處理自閉合標籤、嵌套不匹配),以及針對並行編輯的衝突檢測。
  • 私有同步帳號不匹配檢測:同步設定帳號下拉選單現在會檢測配置的同步電子郵件是否與任何已連線的 Google 帳號不符,並顯示「未連線」指示器及切換選項。
  • 團隊/企業有效層級:授權驗證現在使用來自團隊/企業委派的 effectiveTier,確保當使用者的層級繼承自團隊方案時能正確存取功能。
  • 「Private App」更名為「Private Connection」:所有面向使用者的參考資料現在均使用「Private Connection」(私有連線)而非「Private App」——這對不將 OAuth 整合與「App」聯繫起來的非開發者來說更清晰。
  • Google OAuth 權限範圍對齊 (drive.file):對於非 BYOA 使用者,所有提升的 Google Drive 權限範圍(drivedrive.readonlydocuments.readonlyspreadsheets.readonlypresentations.readonly)現在均替換為較窄的 drive.file 權限範圍,以符合 Google 的已驗證應用程式要求。BYOA 使用者保留完整權限範圍。
  • 權限選取器中顯示 Gmail 權限:Gmail 讀取、撰寫和修改權限範圍現在對所有使用者在 Google 權限編輯器的「高度敏感權限」下可見,不再僅限於 BYOA。這些權限範圍在授權畫面獲得批准,並在 Gmail 工具需要時透過 JIT 請求。
  • Google Picker 授權恢復:當 Google 權限在外部被撤銷時(例如從 Google 帳號設定中),應用程式現在會自動檢測過期的權限範圍、使其失效、重新授權並重試,而非靜默失敗並顯示 403 錯誤。
  • Agent Google Drive 指引:工具錯誤訊息和空結果提示現在會指示 Agent 告知使用者點擊編輯器中的 + 按鈕並選擇 Google Drive,而非建議不可用的工具操作。
  • 簡化 Slate Drive 選取器:Slate 的「從 Google Drive 載入」現在直接載入檔案,跳過側邊欄樣式的「在雲端硬碟中處理」與「加入對話」的選擇畫面。
  • 官方 Google Drive 標誌:雲端硬碟標籤和附件選單現在使用官方 Google Drive 標誌,而非通用的綠色三角形。
  • 統一模型選取器:輔助模型選擇會回退至預設模型,並使用單一合併的模型下拉選單。
  • DOCX 非文字元素透傳:DOCX 重建會保留不屬於文字編輯流程的非文字元素(圖片、圖表、嵌入物件)。
  • PDF 多段線條編輯:PDF WYSIWYG 編輯器可處理跨多個文字段落分割的線條。
  • 提高 Auth 速率限制:Auth 端點速率限制從 10次/分鐘提高到 30次/分鐘,以適應 BYOA 設定期間快速的 OAuth Token 交換。
  • OAuth Token 端點重新分類:OAuth Token 交換從 Auth 速率限制貯槽移至通用貯槽,防止在多權限範圍授權流程中觸發限流。

錯誤修復

  • iOS 彈窗堆疊:修復了當另一個彈窗(如瀏覽器浮層)已顯示時,呈現檔案選取器或 Slate 浮層導致的崩潰問題。選取器和浮層現在會呈現在最頂層的 View Controller 上。
  • Slate 行範圍驗證:當 startLine 超出文件長度時,get_slate_content 現在會返回明確的錯誤,而非靜默返回空內容。
  • 伺服器路徑遍歷:儲存金鑰現在會針對目錄跳脫進行驗證,防止對同步儲存端點的路徑遍歷攻擊。
  • 廣告攔截器正則表達式上限:DNR 轉換器現在將正則表達式規則限制在 Chrome 的 1000 條規則上限內,並捨棄超過 RE2 記憶體限制的大型有界量詞,防止擴充功能安裝失敗。
  • 擴展存取時的 OAuth 超時:修復了當 Agent 需要擴展 Google 權限範圍(Gmail、Calendar)時發生的 120 秒超時問題。待處理的 OAuth 等待時間現在為 BYOA 設定延長至 5 分鐘,且在設定中完成連線後會自動恢復暫停的 Agent。
  • 聊天 UI 凍結:修復了可能導致聊天介面凍結的重疊非同步間隔和靜默廣播錯誤。
  • 雲端同步下載批次:修復了雲端同步下載批次處理程序中的 TypeScript 空值檢查錯誤。
  • Service Worker 動態匯入:將動態匯入轉換為靜態匯入,以符合 Chrome MV3 Service Worker 相容性。
  • 僅限 BYOA 權限範圍強制執行convert_to_google_docconvert_to_google_sheet 操作現在正確地僅要求 drive.file,而非廣泛的編輯器寫入權限。
  • Drive 標籤格式:雲端硬碟引用標籤採用三段式格式,並設有正確的僅限 BYOA 權限範圍管控。
  • Google Picker CORS:Picker 現在託管在私有 Relay 上,以解決彈出視窗權限範圍流程中的跨來源問題。

版本 0.9.701 (2025年3月6日)

改進

  • Ollama 上下文視窗指示器:現在通過查詢 /api/show 端點的 num_ctx 來渲染 Ollama 模型的上下文使用圓環,而不是依賴不包含本地模型的 OpenRouter 模型列表。
  • Ollama 工具調用:修復了 Ollama 的動態工具選擇——將 tool_choice 傳遞給 API(自 Ollama v0.5.1 起支持),在工具激活時禁用思考模式以防止 JSON 損壞,並在主模型不支持工具調用時回退到輕量級非串流輔助模型。
  • OpenRouter 推理快取:修復了推理文字被串流提供者過早清除的問題。快取生命週期現在由 agent-runner 在迭代邊界擁有,與 Anthropic 和 Google 提供者保持一致。
  • PDF WYSIWYG 可靠性:全局文字對齊處理 PDF.js 跨多個 TextItems 的拆分操作符。在不匹配的跨度(註釋/頁首文字)上禁用塊編輯以防止匯出錯誤。CMap 2 位元組解碼不再損壞帶有 1 位元組 ASCII 字體的 Word 生成的 PDF。操作符匹配邊界檢查防止空文字項上的索引越界。
  • 桌面平台檢測:動態工具選擇器使用 localFolderSync 能力而不是 caiiooReminders 進行桌面檢測,並使用 appleScript/appleNotes 而不是 Calendar/Reminders 進行 macOS 檢測(Calendar/Reminders 通過 EventKit 跨 Apple 設備)。

Version 0.9.700 (2025年3月5日)

新功能

  • 檔案管理員 (File Manager):完整的檔案管理系統,支援巢狀資料夾、使用者標籤、星號標記以及專用的檔案管理員介面。可按資料夾層級組織附件,按類型(螢幕截圖、AI 圖像、照片)進行篩選,並支援搜尋、排序以及網格或列表模式查看。對話串自動標籤功能可將檔案與對話連結。透過 manifest v9 支援 Private sync。
  • 本地資料夾同步 (Local Folder Sync):本地檔案系統資料夾與檔案管理員之間的雙向同步。由變動驅動的重新同步功能會自動將刪除、批次刪除和移動操作同步至磁碟,並設有 2 秒的防抖處理。子資料夾移動偵測功能可在 Caiioo 中重新組織時同步調整磁碟檔案位置。進入同步樹中的任何子資料夾皆會觸發自動重新同步。
  • 跨檔案類型修訂追蹤 (Cross-Filetype Tracked Changes):針對 DOCX、PDF 和 Markdown 提供統一的接受/拒絕工作流。DOCX 編輯現在記錄為修訂追蹤,使用與 Markdown 和程式碼 Slate 相同的差異引擎。PDF 修訂追蹤已與視覺化編輯器整合。resolve_tracked_changes 動作允許 Agent 以程式化方式接受或拒絕修訂。
  • PDF WYSIWYG 編輯:直接在渲染的 PDF 頁面上進行文字編輯,並保持與文件匹配的樣式。文字層透過 textItemIndex 將編輯內容連結至原始內容流運算子,以便在匯出時進行精確重構。包含用於變動偵測的 plainText 基準線。
  • DOCX 渲染保真度:豐富的 DOCX 預覽,支援段落對齊、超連結、字體顏色/大小、行距、縮排和表格儲存格底紋。程式碼視圖顯示 Markdown 轉換結果,以便 LLM 進行高效的 Token 消耗。
  • 通用訊息 (Universal Messaging,僅限內部測試):透過 WhatsApp、Telegram 和 Slack 發送和接收訊息,具備本地優先的隱私保護。Agent 可以撰寫和發送訊息、列出對話並回覆對話串——所有路徑皆經由您自己的裝置路由。
  • Google Meet 整合:具備多項動作的會議回溯工具,包含 list_meetings(透過日期範圍篩選發現近期會議)和 get_meeting(獲取逐字稿)。透過完整的 OAuth/JIT/範圍批准流程進行串接,並支援憑證保險箱。
  • Gmail 發送郵件:透過 Gmail API 直接發送電子郵件,受高風險工具審核機制保護。單一動作風險等級覆蓋功能允許 send_email 要求明確確認,而草稿動作則維持在中等風險。
  • Microsoft BYOA:針對 Microsoft 365 的 Bring Your Own App 支援。可為 Microsoft OAuth 連線註冊 Azure AD 應用程式。支援多供應商 BYOA 註冊表(Google + Microsoft),支援租戶 ID 並提供 3 步驟 Azure Portal 設定精靈。
  • Poe 供應商:新增 Poe 的 LLM 供應商整合,包含模型列表、按供應商分組的模型選擇器、視覺/工具/推理能力偵測以及價格顯示。
  • 新功能對話框 (What's New Dialog):由 API 提供的內容管線,發送版本說明和使用者指南頁面。非同步新功能對話框會在更新時顯示版本亮點。
  • Private Sync 帳號選擇器:選擇用於 Private sync 的 Google 帳號,而非預設使用主帳號。
  • 原生 TipTap 差異標記:將用於 AI 修訂預覽的獨立 marked.js 渲染層替換為原生 ProseMirror 標記(DiffAdded/DiffRemoved)。修訂內容現在以行內修訂追蹤形式渲染,具備一致的排版,並支援區塊級別的接受/拒絕目標。
  • Mermaid 圖表:在 Slate 的 TipTap 預覽模式下,支援程式碼區塊內的即時 Mermaid 圖表渲染。
  • 說明工具中的模糊章節搜尋:說明工具現在支援在搜尋文件頁面中的特定章節時進行模糊比對。

改進項目

  • 檔案管理員 UX 優化:資料夾同步圖示指示、刪除確認對話框、Shift+點選範圍選取、工具列在寬度不足時自動換行而非溢出,並修復了重新載入後的標籤持久性。
  • 響應式編輯器佈局:三區段彈性佈局可防止新對話按鈕在寬度不足時被擠出螢幕。模式和模型選擇器使用交錯的文字隱藏斷點。自定義 Agent 和 AI 晶片圖示取代了通用的預設圖示。
  • 設定 UX:重新排列區段以優化流程(個人化 → 憑證 → 工具批准 → Agent 模式 → 工具配置 → 技能庫 → 工具伺服器 → 文件處理 → 語音)。
  • 修訂狀態完整性:修復了在活動 AI 修訂期間刪除大型內容塊時導致的損壞問題——確保 sourceContent 不可變性、將區塊遷移閾值提高至 0.7、自動拒絕過期區塊,並加強版本歷史完整性檢查。
  • Agent 迴圈可靠性:修復了中止控制器(abort controller)的競態條件,避免舊運行刪除新運行的控制器。取消信號現在會傳播至排隊中的工具。孤立的運行狀態會廣播錯誤,而非留下空白訊息。
  • 插話處理 (Interjection Handling):統一伺服器端與 UI 端的 getActiveBranchMessages 遍歷邏輯,以一致地跳過插話。修復了當串流 parentId 指向插話而非使用者訊息時,追問後回覆消失的問題。
  • macOS 原生穩定性:修復了程序紀元追蹤的重啟競態條件、重新連線時的 URLSession 洩漏,以及 pipe 處理程序與停止動作之間的 LineBuffer 資料競爭。
  • Google Sheets 修復create_table 現在會寫入欄位標題名稱,而非讓第一列保持空白。
  • 中間件清理:從 apple-routes、mcp-routes 和 attachment-routes 的 10 個行內驗證檢查中提取出 requireAuth 中間件。
  • 圖像類型篩選:檔案管理員透過獨立的篩選選項和獨特的圖示來區分螢幕截圖、AI 生成圖像和使用者照片。
  • 模式/模型選擇器一致性:統一了模式選擇器與模型選擇器之間的字體粗細和圖示線條。
  • Beta 階層門檻:憑證保險箱會根據階層檢查來限制 Beta 功能的使用。
  • CIDFont 重新編碼:PDF 重構支援使用 ToUnicode CMap 表的 CIDFont 編碼,並針對不在表中的字元提供識別回退。
  • PDF 匯出更名:在整個 PDF 工作流中將「下載」更名為「匯出」以求清晰。

錯誤修復

  • PDF 文字消失:修復了 PDF 視圖文字在失去焦點時消失,以及從 WYSIWYG 編輯匯出時內容亂碼的問題。
  • PDF 修訂追蹤路由:防止 PDF 修訂追蹤通過統一差異引擎,避免損壞 PDF 特有的運算子數據。
  • PDF 匯出完整性:PDF 下載現在會顯示診斷錯誤並失敗,而非靜默回退至 Markdown 匯出。
  • Markdown 表格換行:Markdown 表格中的 <br> 標籤現在會渲染為實際換行,而非字面文字。
  • DOCX 修訂刪除保留:修復了在視覺視圖與程式碼視圖切換時,DOCX 追蹤刪除內容被移除的問題。
  • 儲存的 Markdown 修訂追蹤:修復了從儲存空間載入時,Markdown Slate 上的 propose_change 不顯示修訂紅線的問題。
  • 拒絕還原內容:針對 Markdown 和程式碼 Slate,使用「拒絕」執行 resolve_tracked_changes 現在能正確還原內容。
  • Slate 儲存迴圈:修復了在修訂追蹤活動時觸發的無限儲存迴圈。
  • 訊息穩定性:修復了路由、回覆串接、設定檔處理、隊列韌性、Webhook 簽名、發送者清理和負載限制等問題。

Version 0.9.662 (2025年2月27日)

新功能

  • 自備應用程式 (BYOA):使用您自己的 Google OAuth 憑證,而非 Caiioo 內建的應用程式。多應用程式支援讓團隊能在組織內共享單一 OAuth 客戶端,同時保留各自的 API 金鑰。BYOA 連線會自動偵測過期權杖並提示重新驗證。
  • 維基連結 (Wikilink) 導覽:在 Slate 文件之間使用 Obsidian 風格的雙括號維基連結,以建立互連的知識庫。點擊維基連結即可立即在 Slate 之間切換。
  • 技能選單 (Skills Menu):支援 Tab 鍵快速插入技能、動態高度下拉選單、帶有變數標籤的行內編輯,以及用於從編輯器進行完整 CRUD 操作的共享 SkillForm 元件。
  • DOCX 下載:將 Slate markdown 和文字文件下載為 DOCX 檔案,並保留修訂追蹤記錄。
  • 表格自動填充insert_component 現在會從結構化數據自動填充表格儲存格,消除空白的佔位表格。
  • Gemini 3.1 Flash:新增為圖像生成模型選項,與現有的 Gemini、FLUX 和 Seedream 模型並列。
  • 所有帳戶皆支援 Google Drive 儲存:現在任何已連線的 Google 帳戶皆可使用「儲存至 Google Drive」功能,不再僅限於主帳戶。
  • 統一 Diff 引擎:完全重寫了 Slate 的修訂追蹤 diff 系統(階段 0–7),具備 TOCTOU 安全性、快取功能、單項修訂接受/拒絕小工具,以及行動端點擊切換支援。

改進項目

  • 適應性私有同步 (Adaptive Private Sync):同步輪詢頻率會根據活動情況動態調整。僅下載鎖定優化減少了資源爭奪。
  • OAuth 電子郵件擷取:Google OAuth 始終包含身分識別範圍,以便在每次連線時擷取使用者的電子郵件,修復了某些帳戶電子郵件空白的問題。
  • 安全性強化:強化了 OAuth PKCE 流程、代理程式子程序邊界,以及針對重複驗證失敗嘗試的單一帳戶暴力破解鎖定。
  • 瀏覽器標籤佈局:瀏覽器選擇器標籤變得更小,且會自動換行而不會超出容器。
  • 註冊表驅動的圖像提供者:將硬編碼的圖像提供者列表替換為動態註冊表,使新增模型變得非常簡單。
  • 內容 i18n 管線:為所有文件頁面提供統一的雜湊追蹤內容同步,並支援增量翻譯。

錯誤修復

  • 預覽中的數學表達式:修復了從 TipTap 預覽切換到程式碼檢視時,數學表達式損壞的問題。
  • 預覽中的維基連結:修復了在 TipTap 預覽和程式碼檢視之間切換時,維基連結語法被移除的問題。
  • 對話串訊息消失:修復了對話串訊息被 STATE_PATCH 移除,或在對話中途切換模型時消失的問題。
  • 插話孤立節點:修復了插話訊息過濾後 parentIds 孤立導致的渲染錯誤。
  • 私有同步無限迴圈:解決了由並行集合項目時鐘衝突和 thread_data_ 前綴污染引起的無限同步迴圈。
  • BYOA 邊緣案例:修復了清除時 BYOA 設定未還原、非同步儲存競爭、擴充功能使用失效的 localhost 彈出視窗而非 launchWebAuthFlow,以及過期的 issuedByClientId 優先級問題。
  • 私有同步權限範圍恢復:修復了當 Google Drive 權限範圍過期或缺失時,私有同步解鎖靜默失敗的問題。
  • 重複技能:防止在私有同步合併後出現重複技能。
  • 修訂追蹤路由:將 get_tracked_changesget_comments 接入 SlateTool 動作路由,使代理程式可以讀取修訂狀態。
  • DOCX 下載來源:修復了 downloadAsDocx 使用過期的成品內容而非即時編輯器狀態的問題。
  • 智慧模型名稱縮寫:修復了長模型名稱超出緊湊型選擇器的問題,現具備智慧縮寫功能。
  • Markdown 連結渲染:修復了渲染的 markdown 連結中 chrome-extension: 和 Caiioo: URL 被阻擋的問題。
  • 對話串建立速度:透過消除冗餘的設定級聯查找,將對話串建立時間縮短了一半。
  • Chrome 分頁標題:恢復了根據活動對話串顯示的動態 Chrome 分頁標題。
  • 適應性問候語權杖:調高了適應性問候語的 max_tokens,以防止在使用推理模型時內容被截斷。

Version 0.9.661 (2025年2月25日)

新功能

  • Agent 插話 (Agent Interjection):在 AI 運行期間,您可以直接輸入訊息並按 Enter 來引導它。Agent 會在下一個決策點看到您的指引並調整方向,無需取消並重新開始。當您有文字待發送時,停止按鈕旁會出現一個帶有琥珀色標記的發送按鈕。
  • API 工具管理:API 整合工具現在支援 save_toollist_toolsdelete_tool 作為一級操作,讓您可以直接從對話中輕鬆管理 Agent 發現的 API。免費用戶可使用 GET 和 list_tools;Pro 用戶可使用完整功能集。
  • 即時 Token 計數器:Token 和成本消耗現在會在串流傳輸期間即時更新,並顯示在每條訊息的頁尾。特定成本(圖像生成、網頁搜尋)會在每個工具完成時逐步累加。
  • 自動展開工具卡片:工具卡片在開始接收串流參數或需要核准時會自動展開,並在成功完成後自動摺疊。錯誤和被拒絕的工具將保持展開狀態以供檢查。
  • Monaco Diff 編輯器:Slate 程式碼修訂現在使用 Monaco 原生的行內差異編輯器,並配備逐項變更的接受/拒絕按鈕,取代了之前的自定義裝飾系統。

改進項目

  • Private Sync 驗證恢復:因 Google Token 過期或撤銷導致的 Private Sync 錯誤,現在會顯示具備操作功能的「重新連接 Google」和「授予權限」按鈕,而非被動的錯誤訊息。重新連接會請求正確的 Drive 權限並預先選擇正確的 Google 帳戶。
  • Private Sync 多帳戶支援:Private Sync 現在會根據設定的電子郵件對應 Google 帳戶進行驗證,而不是預設連接第一個帳戶。修復了連接多個 Google 帳戶時同步到錯誤 Drive 的問題。
  • 品牌更新:採用源自 Caiioo 標誌的新款河流藍與岩石灰配色方案,取代了整個應用程式和網站原有的紫色主題。
  • OAuth 安全性:從擴充功能套件中移除了 Google、GitHub 和 Slack 的 OAuth 客戶端密鑰。Token 交換現在透過安全的 Cloudflare 中繼代理進行,消除了客戶端程式碼中的密鑰。
  • 啟動速度提升:附件內容(圖像、提取的文字)現在改為按需加載,而非在啟動時加載,顯著縮短了包含大量附件的對話的初始加載時間。
  • 串流速度提升:Context 視窗使用情況現在透過快速廣播路徑傳輸,而非透過儲存空間往返,在每個 Agent 迴圈中提供即時更新而無需非同步 I/O。
  • Private Sync 速度:Google Drive 檔案 ID 快取現在會跨重啟持久化,消除了第一次同步週期時完整的檔案列表 API 調用。
  • 統一串流渲染路徑:串流內容和最終內容現在流經單一渲染路徑,消除了生成完成時的閃爍,並保留了插話訊息。
  • 跨模型切換:在對話中途切換 AI 提供商(例如從 Gemini 切換到 Claude)不再導致「thinking block 簽名無效」錯誤。外部推理產物會自動扁平化為敘述文字,在保留上下文的同時避免不相容的加密簽名。
  • 禁用工具指引:當 AI 嘗試使用已禁用的工具時,它現在會收到具體的操作建議(類似的已啟用工具、如何啟用),而非通用的「未找到」錯誤。
  • 響應式編輯器佈局:編輯器工具列採用交錯式漸進顯示——模式選擇器、模型選擇器、設定、議程和說明圖示會根據空間顯示,而非被裁切。
  • 設定顏色編碼:設定區塊現在使用三色系統——自定義區塊使用強調色調,其餘部分使用交替的中性色,以實現更清晰的視覺分組。
  • 新手引導錯誤處理:免費金鑰配給現在會在操作按鈕下方顯示描述性錯誤訊息,而非靜默失敗。
  • AI Provider 設定:將「API & Provider」區塊重新命名為「AI Provider」以求清晰。
  • 延長免費試用:Pro 試用期從 7 天延長至 14 天,讓新用戶有更多時間探索 Pro 功能。
  • 樂觀分支切換:在訊息分支之間切換和重新加載訊息現在會立即更新 UI,而無需等待儲存空間往返。
  • MCP 工具配置:Schema 自動校正並改進了 MCP 工具配置,使工具設置更可靠。

錯誤修復

  • 單條訊息成本:單條訊息成本現在累計與對話標題總額一致。Helper、OCR、圖像生成和搜尋成本現在歸屬於單條訊息,而非僅顯示在對話摘要中。
  • 插話渲染:插話訊息現在以緊湊的琥珀色註釋形式顯示在 Assistant 時間軸內,不會在生成完成時丟失。
  • 迴圈檢測:修復了在引用密集的回答中,因 URL 自然重複 3 次以上而導致的誤報重複檢測。
  • Slate 差異對齊:修復了預覽模式下多行區塊的紅線/綠線對齊問題,之前覆蓋迴圈無論區塊跨度如何都僅前進 1 行。
  • Slate 刪除位置:修復了插入偏移重複計算導致刪除內容渲染在成對插入內容之後而非之前的問題。
  • Private Sync 修復:修復了 JIT 作用域請求未跨程式碼分割塊觸發,以及上傳後無限同步迴圈的問題。
  • 新手引導流程:OAuth 流程現在能正確完成新手引導,觸發檢測支援帶連字號的模式 ID,且剩餘 0 天不再被強制轉換為 null。
  • 密碼重設:透過電子郵件連結重設密碼現在會驗證電子郵件地址。為驗證郵件已過期的用戶增加了重新發送驗證的端點。
  • 授權等級:具有管理員授予等級但無授權記錄的用戶不再被卡在升級頁面。
  • 設定捲動:點擊已學習頁面的大腦圖示現在會捲動到正確的設定區塊,不會因上方延遲加載的區塊而停止。
  • Monaco 釋放:修復了差異編輯器模型的釋放順序,以防止懸空引用以及 Monaco 透過 TipTap 預覽顯示出來。
  • 導覽定位:導覽步驟現在會跳過被響應式容器查詢隱藏的元素,而非定位到左上角 16x16 像素的區域。
  • Kokoro TTS:修復了擴充功能中語音轉文字失效的問題——ONNX 運行時檢測在離屏文件中失敗,導致「未找到可用後端」錯誤。
  • 自定義 API 工具儲存:修復了在擴充功能中將 Agent 發現的 API 儲存為自定義工具時,因 Service Worker 環境中禁止動態 import() 而導致的崩潰。
  • 啟動效能:修復了每次存取設定時(啟動時超過 20 次)都會執行會話遷移的問題,這導致了不必要的磁碟寫入和啟動變慢。
  • 重複儲存廣播:抑制了中繼/伺服器模式下可能導致 UI 閃爍的雙重儲存變更通知。
  • Cairn 紋理恢復:修復了當記憶體中的世界快取在加載和渲染之間被移除時紋理生成失敗的問題,並修復了渲染器對附件支援的紋理顯示為黑色的問題。
  • 安全性補丁:更新了 fast-xml-parser(透過 DOCTYPE 實體擴展的 DoS 攻擊)和 tar(硬連結逃逸漏洞)。
  • MV3 合規性:將 CDN 加載的 vega-embed 替換為本地供應商軟體包,確保所有圖表渲染程式碼符合 Chrome Web Store 遠端程式碼政策。
  • Vega-Lite 圖表:AI 現在直接在 Slate 中生成 Vega-Lite 視覺化圖表,而非透過 CDN 加載 HTML,實現了無需遠端腳本依賴的互動式圖表。
  • Google Drive 儲存:修復了從 Slate 儲存到 Google Drive 時,因非 Agent Drive 處理程序中的 OAuth 作用域檢查過期而導致的 403 錯誤。
  • 新用戶引導:修復了登入期間自動配給 API 金鑰時,新用戶完全跳過新手引導畫面的問題。
  • OpenRouter OAuth 彈窗:修復了當彈窗攔截器靜默關閉 OAuth 視窗時,「連接中...」旋轉圖示無限卡住的問題。
  • 試用橫幅文案:試用橫幅不再聲稱模型受等級限制——已更新為準確描述 Pro 功能(寫入權限、圖像生成、自定義模式)。
  • DOCX 審閱工具列:透過延遲捲動直到初始顯示,修復了顯示文件審閱控制項時工具列閃爍的問題。
  • 添加到 Prompt 疊加層:修復了疊加層標誌被內容安全政策(CSP)阻擋以及背景透明度與主題不符的問題。
  • 訊息編輯/重新加載狀態:修復了編輯訊息、重新加載回應或切換分支後,記憶體狀態過期的問題。
  • 伺服器登入掛起:修復了伺服器登入流程中 WebSocket 儲存操作失敗的問題。驗證現在已解耦,因此本地會話可立即運作,而伺服器身份則在背景解析。
  • WebSocket 連接掛起:修復了在初始 WebSocket 連接期間,若 AUTH_STATE: ready 到達可能導致驗證 promise 孤立,進而阻止連接完成的競態條件。

版本 0.9.655 (2025 年 2 月 19 日)

新功能

  • Slack 整合:連接您的 Slack 工作區,透過完整的 OAuth V2 授權啟用 AI 驅動的 Slack 工具
  • API 工具憑據:代理髮現的 API 現在可以儲存為具有儲存憑據的自定義 MCP 工具,以便在不同對話中重複使用
  • 已儲存 API 徽章:代理建立的 API 工具在設定中顯示「已儲存 API」徽章,方便識別
  • 對話匯入:從 ChatGPT、Claude、Gemini、Perplexity 和 Grok 匯入對話——上傳您的匯出檔案,Caiioo 將轉換完整的訊息歷史、附件和元數據

改進

  • 學習到的 API 嵌套:學習到的 API 工具現在在設定中分組在可折疊部分下,使組織更整潔
  • Caiioo 品牌化:內建工具現在顯示 Caiioo 圖示以保持視覺一致性
  • 瀏覽器感知連結:代理開啟的 URL 現在會在您於設定中選擇的瀏覽器中啟動
  • Slate 雲端載入:從 Google 雲端硬碟載入 Slate 文件現在會觸發 JIT OAuth 提示,而不是因不明錯誤而失敗

錯誤修復

  • DOCX 編輯:修復了跨嵌套跨度的段落運行正則表達式匹配,該問題曾導致編輯格式化的 DOCX 文本時內容損壞
  • 搜尋/取代安全性:恢復了在重構過程中丟失的結構化 HTML 模式保護——防止編輯損壞 XLSX/DOCX 內部標記
  • 工具批准循環:修復了導致單次代理運行中對同一工具重複出現批准提示的競態條件
  • 過時身分:修復了授權同步期間 401 錯誤時過時使用者身分未清除的問題,並在回訪使用者引導時增加了登出出口

Version 0.9.651 (2025年2月17日)

新功能

  • 最小權限許可:Google Workspace 工具現在僅針對每項操作請求所需的精確範圍,而非廣泛存取權。讀取電子郵件僅請求唯讀權限;建立活動僅請求日曆寫入權限。
  • 增強型權限對話框:即時授權對話框會精確顯示正在請求哪些權限、為何需要這些權限,以及該操作是唯讀還是讀寫性質。
  • 權限選擇器:手動連接 Google 帳戶時,您可以預先選擇要授予哪些服務(Calendar、Gmail、Drive、Docs、Sheets、Slides)以及存取層級(唯讀 vs 讀寫)。現有連接則新增了「編輯權限」按鈕。
  • 圖片結果:生成的圖片和螢幕截圖現在會顯著地渲染在摺疊的處理步驟與最終答案之間,無需展開工具調用即可查看視覺輸出。

改進事項

  • Private Sync 安全性:並行編輯現在會下載以進行合併而非直接上傳,鎖定刷新會驗證所有權,且資訊清單合併可防止因過早的垃圾回收操作導致數據丟失。
  • 移除 P2P Sync:移除了 P2P 即時同步,消除了超過 100MB 的無效 WebSocket 流量並提升了擴充功能效能。
  • 設定效能:對設定面板進行了 Memoization 處理並隔離了摺疊上下文,以實現更快的渲染速度。
  • DOCX 渲染:改進了文件解析器中的段落渲染、編號和樣式支援。

錯誤修復

  • Google Docs 範圍:修復了索引 Google Docs 時出現的「驗證範圍不足」錯誤 —— index_document 需要命名範圍的寫入權限。
  • Google Docs 讀取:修復了僅授予 Docs 權限時 read_documentget_document_info 失敗的問題 —— 這些操作同時需要 Drive 的讀取權限。
  • 日曆複製:修復了範圍註冊表中缺失的 copy_event 操作,該問題曾導致無法觸發即時權限請求。
  • API Key 持久化:修復了在 Pro 試用啟用期間,當 saveCustomMode 導致設定儲存路徑崩潰時,BYOK API key 會無故丟失的問題。
  • 設定重新載入競態條件:修復了摺疊/展開設定區塊觸發儲存空間重新載入週期時,未儲存的 API key 會被抹除的問題。
  • Chrome Identity 取消:修復了增量範圍請求期間使用者取消操作無法與錯誤區分的問題,且驗證方法現在在取得網頁 OAuth 刷新權杖後能正確轉換。
  • Private Sync 覆蓋:修復了發生並行編輯時 Private Sync 會覆蓋近期對話輪次的問題。
  • 視窗螢幕截圖:停止在最終回覆文字上方顯示視窗螢幕截圖。
  • Agent 協調:修復了涉及對話輪次協調、感知和狀態管理的 7 個問題。
  • 修訂追蹤:修復了由於雙重狀態變數不同步導致 Slate 分解後修訂追蹤模式損壞的問題。
  • 檔案管理員:刪除和下載操作現在適用於所有模式,而不僅限於孤立檔案。
  • MCP 工具名稱:修復了工具使用內部伺服器 ID 而非易於閱讀名稱的問題。
  • Agenda 工具:修復了同步卡片始終顯示權限缺失的問題,現已接入 Google OAuth 連接系統。

版本 0.9.642 (2025年2月16日)

改進

  • 新文件建立:透過「新增檔案」下拉選單建立的新 DOCX、XLSX、PDF 和 RTF 檔案,現在完全可編輯並支援追蹤修訂與正確格式
  • Gemini 穩定性:新增推理重複偵測,自動中斷 Gemini 的思考迴圈,防止洩漏的思考文字出現在聊天中
  • 影像處理:DNG 原始照片預覽現在會遵循 EXIF 方向以正確顯示,防止上傳的影像變形

錯誤修復

  • 新文件可編輯性:修復了透過「新增檔案」建立的空白文件被渲染為靜態預覽而非可編輯富文字編輯器的問題
  • API 金鑰偵測:切換至您自己的 API 金鑰 (BYOK) 現在會立即生效,無需重新整理頁面
  • 螢幕截圖穩定性:修復了附件 ID 處理問題,防止螢幕截圖資料遺失或損毀
  • 分頁分組:修復了瀏覽器存在非標準視窗(例如開發者工具、彈出視窗)時的崩潰問題
  • 控制台雜訊:移除不必要的 llms.txt 探測,該探測會產生大量 404 錯誤
  • 工具逾時:移除可能干擾長時間執行工具呼叫(如使用 Gemini 產生 4k 影像)的脆弱保持連線機制
  • 提示詞快取:修復了提示詞快取最佳化期間多模態內容(影像/螢幕截圖)遺失的問題

內部

  • 在錯誤處理、型別安全和架構分層方面進行了顯著的程式碼品質改進
  • 將核心文件解析器模組化為專注且易於維護的模組

版本 0.9.641 (2025 年 2 月 14 日) - 情人節快樂!

改進

  • 模型選擇器等級獎牌:將硬編碼的推薦徽章替換為 5 個 API 驅動的等級獎牌(Caiioo 首選、品質、穩定性、速度、價值),直接從基準測試數據中顯示金/銀/銅排名
  • 技能系統:技能現在擁有「還原預設值」按鈕以重新添加內建技能
  • 提示詞快取:進一步優化提示詞快取以節省成本

錯誤修復

  • 瀏覽器相容性:OAuth 登入和自動連接現在可在 Vivaldi 和其他非 Chrome 瀏覽器中運作
  • 成本追蹤:修復了取消運行可能覆蓋成本和使用數據的競態條件;現在取消和出錯的運行也會保留成本/使用數據
  • 私有同步:重寫了 purgeAllStorage 以進行徹底清除,修復了同步監聽器競態,鞏固了私有同步 UI
  • i18n:在 conversation.html 彈出頁面中添加了缺失的翻譯初始化
  • 安全性:修復了依賴項漏洞 (qs, @casl/ability, axios, markdown-it)
  • 基準測試頁面:將基準測試頁面後端遷移至 Cloudflare 驗證

版本 0.9.65 (2025年2月13日)

改進

  • MiniMax M2.5 基準測試:完整的基準測試套件已完成 — 工具準確度 91%,可信度 95% (排名第 2),綜合排名第 5,並獲得黃金價值等級
  • 模型智慧 API:將預設回應限制從 100 提高到 500,確保所有獲得徽章的模型都能對客戶顯示

錯誤修復

  • 遺失的模型徽章:修復了 35 個已獲得等級徽章(金/銀/銅)的模型未出現在擴充功能模型列表中的問題 — 包括 Claude Opus 4.6 (綜合金牌)、Claude Sonnet 4.5 (綜合銀牌) 和 Claude Haiku 4.5 (綜合銅牌)。根本原因:API 預設僅返回按可信度排序的前 100 個模型,但等級是根據全部 367 個模型計算的。可信度排名 100 名以外的模型其徽章被靜默移除。

Version 0.9.64 (2025年2月12日)

改進項目

  • Ollama 提供商功能對等:實現與 OpenRouter 的完整功能對等 —— 包含中止訊號 (abort signal) 支援、錯誤處理、推理詳情、已解析的模型 ID,以及透過串流混入 (streaming mixin) 處理 think 標籤。
  • AbortSignal 傳播:子程序 SIGTERM/SIGINT 現在會取消進行中的 LLM API 呼叫。
  • 建置時架構驗證:在建置時進行設定架構驗證,以擷取缺失的 SETTING_METADATA 項目。
  • 平台功能快取:針對效能進行快取,而非在每次存取時重新計算。
  • 網站 i18n:同步所有 22 個語系的信任頁面與價格重構翻譯。

錯誤修復

  • 網站身分驗證:將舊有的 Supabase 驗證替換為直接呼叫 Cloudflare Worker API,用於 Google 登入、電子郵件登入、註冊及密碼重設。
  • Stripe 結帳語系:透過將 navigator.language(例如 en-US)映射至 Stripe 支援的語系(並以 auto 作為備援),修復了結帳與入口網站中的「無效語系」錯誤。
  • 密碼最短長度:同步伺服器註冊、密碼重設及網站重設頁面的最短 12 字元限制。
  • 私有同步設定檔去重:登入現在會偵測並移除由早期同步錯誤導致的重複設定檔。
  • State Manager 初始化競態:修復了 state-manager 中的初始化競態條件。
  • Agent 子程序清理:在 Agent 終止時清理殭屍子程序。
  • 分頁群組/儲存 API 防護:為跨平台的分頁群組與儲存 API 加入適當的防護機制。
  • 地理位置錯誤處理:優雅地處理地理位置權限錯誤。
  • OAuth 重新整理鎖定:防止同時進行多個 OAuth 權杖重新整理嘗試。
  • 設定儲存互斥鎖 (Mutex):並行儲存設定時不再會互相覆蓋。
  • Agent JSON 解析隔離:格式錯誤的 Agent 輸出不再會導致解析器崩潰。
  • 對話串搜尋競態:修復了對話串搜尋結果中的競態條件。
  • 串流版本過期檢查:在串流回應期間檢查版本是否過期。
  • 內容腳本逾時:為內容腳本訊息傳遞增加了逾時機制。
  • 多模態內容修剪:改進了存在多模態內容時的上下文修剪機制。

版本 0.9.63 (2025年2月12日)

錯誤修復

  • 私密同步模式變數:修復了舊版設定遷移在每個同步週期重複執行的問題,該問題會導致最近的本地編輯(例如模式變數更改)被過時的 Drive 數據靜默覆蓋

版本 0.9.62 (2025年2月12日)

新功能

OpenRouter OAuth 一鍵設定

  • PKCE 金鑰建立:全新的一鍵式 OpenRouter OAuth 流程,讓使用者無需離開 Caiioo 即可建立並連結 API 金鑰。
  • 重新設計的入門引導:透過 OpenRouter OAuth 整合,簡化了入門引導與升級流程。
  • 隱私警告:免費模型入門選項現在會顯示清晰的隱私/訓練數據警告。

細粒度私有同步 (Granular Private Sync)

  • 逐項同步:MCP 伺服器、工具授權、設定檔、技能、模式、覆寫 (overrides) 以及提醒事項,現在以個別項目為單位進行同步,而非覆蓋整個集合。
  • 逐項設定同步:設定按鍵值 (key) 進行細粒度同步,防止遠端覆蓋無關的本地變更。
  • 去重讀取:對傳輸中的 WebSocket 儲存讀取進行去重處理,以減少不必要的網路流量。

改進項目

  • 模式設定使用者體驗:覆寫設定現在會自動儲存,「恢復預設值」現在能正確恢復已刪除的模式變數。
  • 響應式編輯器 (Composer):技能按鈕在寬度較窄時會摺疊為僅顯示圖示;移除了技能區塊的佈局間距。
  • 支援工單:現在會自動包含版本號 (Build version) 與日期時間。
  • Slate 搜尋:Slate 工具新增了 search_document 動作。

錯誤修復

  • Google Slides/Sheets OAuth:現在會正確拋出 OAuthAuthorizationRequiredError 而非返回設定文字,從而實現即時授權。
  • 配置工具介面更新:透過配置工具進行的代理程式變更現在會廣播 STORAGE_CHANGED,使介面立即更新。
  • 工具授權彈窗:修復了 React hooks 排序違規問題(在提前返回前使用 useMemo)。
  • Localhost HTTPS:API 整合工具現在可處理本地 HTTPS 伺服器的自簽署憑證。
  • 模式變數持久化:修復了 i18n getter 屬性在儲存前未實例化的問題,該問題曾導致變數在重新載入時消失。
  • Slate 執行緒安全:解決了 Slate 工具在平行 AI 回合中導致產生重複 Slate 的競態條件 (race condition)。
  • Slate DOCX:修復了修訂追蹤中的刪除可見性與基準線損壞問題。
  • 私有同步穩定性:消除了同步衝突導致的編輯跳動與消失現象。

版本 0.9.61 (2025年2月10日)

改進

Slate 編輯器國際化 (i18n)

  • 已翻譯工具列與選單:所有 Slate 編輯器工具列按鈕、右鍵選單和對話框字串現已完全翻譯

錯誤修復

  • OAuth 擷取逾時:所有 OAuth 權杖交換與重新整理請求現在均設有 15 秒逾時,防止網路停滯時發生無限掛起
  • GitHub 私人電子郵件:修復了當使用者的個人資料電子郵件為私人時 GitHub 連線失敗的問題(現在改從 /user/emails API 擷取)
  • OAuth 連線對話框:通用化 OAuth 連線對話框並修復多個權杖/連線錯誤
  • 密碼長度一致性:在所有註冊與重設介面同步 12 字元密碼長度要求

版本 0.9.6 (2025年2月8日)

新功能

國際化 (20+ 種語言)

  • 全面 i18n 支援:Caiioo 現已支援 20 多種語言,包括英語、西班牙語、法語、德語、日語、韓語、中文、阿拉伯語、希伯來語、印地語等
  • RTL 語言支援:針對阿拉伯語、希伯來語和烏爾都語提供完整的從右至左佈局支援
  • UI 語言設定:在「Settings」中選擇您偏好的語言 —— 所有 UI 元素、工具標籤和狀態訊息均已翻譯

改進事項

Settings 面板效能

  • 延遲載入區段:Settings 面板各區段現在改為按需載入,減少初始渲染時間
  • 模組化儲存:設定現在儲存於細粒度的各區段金鑰中,而非單一的大型資料塊,提升了讀寫效能
  • 類型化 Getter:內部設定存取使用具有變更粒度追蹤功能的強類型 Getter

Slate 修訂追蹤可靠性

  • 17 項修訂管理器修復:全面強化修訂追蹤系統,涵蓋差異計算、接受、拒絕及持久化
  • 純文字差異比對:修訂變更現在對純文字進行差異比對,而非原始 markdown,從而產生更整潔、更準確的變更標示
  • 持久化使用者變更:使用者進行的追蹤修訂現在可在頁面重新整理後保留
  • 競態條件修復:在儲存前強制寫入追蹤修訂,以防止資料遺失

錯誤修復

  • Service Worker 崩潰:將 112 個以上的動態 import() 呼叫替換為靜態匯入,以防止 Chrome service worker 崩潰
  • 模式歡迎訊息:修復了模式歡迎訊息中的語言、已配置金鑰檢測及持久化問題
  • Google 工具帳戶選擇:帳戶選擇器現在能動態反映實際已連接的帳戶
  • DOCX 巢狀清單:修復了巢狀清單在往返轉換時的顯示標記及匯出損壞問題
  • LaTeX 數學渲染:修復了貨幣錢字號轉義導致以數字開頭的 LaTeX 數學表達式失效的問題
  • 分頁群組建立:將延遲分頁群組建立推遲到實際使用網頁瀏覽工具時
  • Agenda OAuth:重新拋出 OAuth 錯誤,以便正確觸發即時授權
  • Settings 持久化:補齊了 6 項先前因缺少元資料項目而導致儲存失敗的設定

版本 0.9.5 (2025年2月6日)

安全強化

  • 內容腳本來源驗證:從網頁發送到擴充功能的訊息現在僅限於 caiioo.ai 來源,並通過嚴格的同源檢查防止跨站點訊息注入
  • CSP 政策收緊:從擴充功能頁面的內容安全政策 (CSP) 中移除了僅用於開發的 localhost 腳本來源
  • 身份驗證響應範圍限制:擴充功能的身份驗證響應現在會發送到特定的頁面來源,而不是廣播到所有框架

版本 0.9.4 (2025年2月4日)

新功能

多語言語音轉文字 (STT)

  • 語言選擇:在「設定」中選擇您的 STT 語言,以獲得準確的非英語語音輸入
  • 支援 90+ 種語言:與 Whisper 和 ElevenLabs 搭配使用,涵蓋廣泛的語言

即時語音活動偵測 (VAD)

  • 低延遲 VAD:整合全新的 Silero VAD v5,以極低延遲即時偵測語音
  • 更智慧的錄音:根據語音活動自動開始與停止錄音
  • 減少誤判:更精確區分語音與背景噪音

建議顯示切換

  • 隱藏/顯示建議:新增切換開關,可在需要簡潔介面時隱藏 AI 後續建議
  • 持久狀態:您的偏好設定會被儲存並在不同工作階段間記憶

改進

追蹤修訂自動儲存 (Auto-Bake)

  • 基於差異的追蹤:使用差異演算法進行更高效的變更追蹤
  • 自動儲存:定期儲存變更,防止長時間編輯時資料遺失
  • 退出時快照:退出追蹤修訂模式時會自動儲存所有待處理的變更

增強型供應商串流

  • Gemini 改進:為 Google Gemini 模型提供更好的串流與推理能力
  • 行為一致性:統一 OpenRouter 與原生供應商的串流行為

版本 0.9.3 (2025 年 1 月 31 日)

新功能

引導式新手教學

  • 互動式 UI 導覽:新的逐步導覽在使用者輸入 API 金鑰後引導其了解介面的每個部分
  • 三個階段:涵蓋編輯器(11 步)、設定面板(7 步)和模式系統(5 步)
  • 聚光燈效果:每一步都會用聚焦聚光燈突出顯示相關的 UI 元素
  • 對話式引導:AI 引導的個人檔案建立,從一開始就個人化您的體驗

提示詞歷史

  • 存取先前的提示詞:您最近的提示詞會被儲存,並可在編輯器中存取
  • 快速重複使用:輕鬆重複使用或修改先前的訊息

廣告攔截等級

  • 細粒度控制:廣告攔截現在支援多個等級,而不僅僅是開啟/關閉
  • 選擇您的保護:選擇適合您瀏覽需求的攔截等級

DOCX 審閱工具列

  • 追蹤修訂控制:查看帶有追蹤修訂的 Word 文件時的新工具列
  • 接受/拒絕操作:輕鬆審閱並解決文件編輯

改進

對話保留設定

  • 可配置的清理:設定在自動清理前保留舊對話的時間
  • 儲存管理:更好地控制您的對話歷史記錄

Caiioo 動畫

  • 效能優化:透過改進的渲染實現更流暢的動畫
  • 濕度效果:新的視覺疊加層顯示水分飽和度
  • 直接粒子渲染:透過優化的粒子繪製實現更清晰的視覺效果

個人檔案切換

  • 增強的狀態管理:透過改進的協議處理實現更可靠的個人檔案切換
  • 更好的同步:個人檔案更改在擴充功能中正確同步

Google 日曆

  • 權杖管理:改進了日曆操作的存取權杖處理
  • 更可靠的同步:日曆整合的 OAuth 流程更佳

版本 0.9.2 (2025 年 1 月 26 日)

新功能

廣告與追蹤器攔截

  • 內建廣告攔截器:使用 Ghostery 引擎和相容 MV3 的 declarativeNetRequest 攔截廣告和追蹤器
  • 設定中的切換開關:從設定面板啟用或停用廣告攔截
  • 過濾清單更新:自動快取過濾清單以實現可靠攔截

即時 Google 權限請求

  • 增量授權:Google 工具權限現在僅在需要時請求,而非預先請求
  • 更清晰的權限範圍管理:缺失的權限範圍會觸發有用的錯誤訊息,並提供授予存取權限的選項
  • 更好的隱私:僅請求每個工具所需的特定 Google 權限範圍

改進

Caiioo 動畫

  • 增強的物理效果:改進了粒子動力學,具有更好的海拔、速度和密度力量
  • 更流暢的流動:粒子現在在生成時遵循通道方向,減少聚集
  • 真實的堆疊:當被鵝卵石或水壩阻擋時,粒子會自然堆疊

Google OAuth 流程

  • 更快的登入:現在優先檢索 ID 權杖以實現更快的身分驗證
  • 提高可靠性:更好的權杖處理減少了非 Chrome 瀏覽器上的驗證失敗

新手引導與設定

  • 預覽模式:在不清除使用者數據的情況下測試新手引導流程
  • 更簡潔的免費方案:移除了已棄用的配置 API 金鑰還原 UI

內部

  • 小遊戲系統:用於互動式介紹體驗的新 MinigameContainer 基礎設施
  • 隱藏彩蛋:小遊戲的可見性狀態在對話之間保持不變

Version 0.9.1 (2025年1月25日)

新功能

互動式水流模擬

  • Caiioo Intro:載入介面新增互動式流體模擬 —— 觀察水流通過動態 S 型通道
  • 可拖動的卵石:移動卵石以改變水流方向並建造水壩
  • 泥沙動力學:真實的侵蝕與堆積效果 —— 快速的水流會帶走泥沙,緩慢的水流則會使其沉積
  • 主題自適應:水流顏色會自動匹配您選擇的主題色調

Vega/Vega-Lite 圖表支援

  • 互動式視覺化:直接在 Slate 中查看並編輯 Vega 和 Vega-Lite 圖表
  • 數據視覺化:建立長條圖、折線圖、散佈圖以及複雜的多層視覺化圖表
  • 規格編輯:編輯 JSON 規格並即時查看渲染效果

Mermaid 圖表支援

  • 圖表類型:建立流程圖、時序圖、類別圖、狀態圖等
  • 即時預覽:編輯 Mermaid 語法時可獲得即時視覺預覽
  • 匯出選項:圖表以 SVG 格式渲染,在任何尺寸下都能保持清晰

檔案建立範本

  • 快速建立選單:在 Slate 中建立檔案時新增下拉選單,提供常用檔案類型的範本
  • 範本分類:包含 Markdown、程式碼檔案、數據格式、圖表等
  • 一鍵啟動:直接以正確的結構開始編寫新文件

改進項目

API 錯誤處理

  • 視覺化通知:API 錯誤現在會以可關閉的彈出式通知(toast notifications)顯示
  • 自動關閉:非關鍵錯誤(如取消操作)會在幾秒鐘後自動清除
  • 更清晰的訊息:更優質的錯誤訊息有助於更快地識別並解決問題

平台功能

  • 智慧功能檢測:現在會自動檢測需要特定平台的功能(例如 macOS 上的 Apple Calendar)
  • 優雅降級:工具會適應您的環境,而非無聲無息地失敗
  • Apple 工具改進:Apple Reminders 現在支援取消完成(uncomplete)和列表操作

Safari 與非 Chrome 瀏覽器

  • 更佳的 OAuth 流程:改進了 Google 登入的瀏覽器檢測機制
  • 備用機制:非 Chrome 瀏覽器現在擁有更可靠的身分驗證路徑

版本 0.9.0 (2025 年 1 月 22 日)

新功能

自動數據清理

  • 儲存管理:舊對話和附件會根據您的保留偏好自動清理
  • 可配置的策略:設定自動清理前保留數據的時間

GitHub 同步

  • 備份至 GitHub:將您的 Caiioo 數據同步到 GitHub 儲存庫,以便備份和跨設備存取
  • 智慧衝突解決:來自多台設備的更改會自動合併而不會丟失數據
  • 選擇性同步:使用 .gitignore 風格的模式控制同步哪些數據

GitHub 工具

  • AI GitHub 整合:AI 現在可以代表您與 GitHub 互動——建立 Issue、瀏覽儲存庫、管理 Pull Request 等
  • 儲存庫瀏覽:要求 AI 探索程式碼庫、查找檔案並理解專案結構

改進

瀏覽器自動化

  • 增強的頁面互動:在複雜網頁上實現更可靠的點擊、滾動和表單填寫
  • 更智慧的工具選擇:AI 現在能更準確地為每項任務挑選合適的工具

文件處理

  • 更好的 Word 文件:改進了 DOCX 檔案中表格、列表和格式的處理
  • Google 簡報:對簡報格式、形狀和佈局有更多控制權

設定與 UI

  • 擴展的設定面板:更多配置選項且組織更佳
  • 改進的對話列表:更好地排序和過濾您的對話
  • 位置權限:在為基於位置的查詢授予位置存取權限時,流程更清晰

版本 0.8.9 (2025年1月19日)

新功能

Google 簡報整合

  • AI 驅動的簡報:全新的 Google 簡報工具允許 AI 建立、讀取與修改簡報
  • 完整簡報控制:建立投影片、新增文字方塊、影像、形狀與表格
  • 範本支援:使用內建範本或從空白簡報開始
  • 協作編輯:適用於您現有的 Google 帳戶連線

改進

程式碼品質

  • TypeScript 修復:清理整個程式碼庫中的型別錯誤與未使用的匯入
  • 測試覆蓋率:更新測試夾具以符合目前的型別定義

版本 0.8.8 (2025年1月17日)

新功能

Resemble.ai 文字轉語音

  • 專業語音合成:全新的 Resemble.ai 整合,用於高品質 AI 語音生成
  • 串流音訊:即時音訊串流,實現響應式語音輸出
  • 可配置語音:從多個專業語音選項中選擇
  • 截斷警告:當長文字因合成而被截斷時提供清晰的回饋

日曆同步服務

  • 背景同步:與 Google 日曆自動同步
  • 增量更新:僅同步已變更的事件以提高效率
  • 基於鬧鐘的排程:使用 Chrome 鬧鐘實現可靠的同步排程

改進

桌面應用程式 (Electron)

  • 喚醒偵測:系統現在可偵測您的 Mac 何時從睡眠中喚醒並自動重新整理 OAuth 權杖
  • 改進可靠性:即使在長時間睡眠後,OAuth 連線仍保持有效

豐富的編輯器輸入

  • 增強的撰寫:改進訊息輸入,提供更好的格式支援
  • Tab 自動完成:更靈敏的 Tab 參考建議

Version 0.8.71 (January 15, 2025)

New Features

Thread Search

  • 搜尋您的對話:Thread 列表新增搜尋框,可透過標題或內容快速查找 Thread。
  • 即時篩選:輸入即可篩選——匹配的 Thread 會立即顯示並帶有搜尋高亮。
  • 智慧防抖 (Smart Debouncing):搜尋經過優化,即使有數百個 Thread 也不會延遲。

Physics Simulation Tool

  • AI 驅動的物理運算:全新的物理工具讓 AI 能夠執行物理計算與模擬。
  • 拋體運動:計算軌跡、預測碰撞並解決運動問題。
  • 結構分析:分析結構的應力、樑彎曲、挫曲及穩定性。
  • 材料特性:內建常用工程材料資料庫(鋼、鋁、木材、混凝土等)。
  • 物理公式:動能、動量、力、衝量計算。

Cairn World Builder 增強功能

  • 物理引擎:完整整合 Rapier3D 物理引擎以實現逼真模擬。
  • 接頭與約束 (Joints & Constraints):在物體之間建立鉸鏈、滑塊、球形接頭和固定連接。
  • 感測器與觸發器:定義感測區域以偵測物體的進入或離開。
  • 角色控制器:具備重力、跳躍和碰撞反應的第一人稱角色。
  • 遊戲模式:具有固定時間步長 (fixed timestep) 的即時物理效果,用於互動式探索。

Improvements

Private Sync v2

  • 增量同步:每個 Thread 和附件現在改為單獨同步,而非作為單一大型檔案。
  • 更快的同步速度:僅上傳變更的項目,大幅縮短大型資料庫的同步時間。
  • 更好的衝突處理:逐項向量時鐘 (per-item vector clocks) 可實現更精確的合併衝突解決。
  • 減少 API 呼叫:智慧差異比對 (Smart diffing) 意味著更少的 Google Drive API 請求。

同步可靠性

  • 擴充功能/伺服器一致性:修正了附件儲存空間,以在兩個平台上正確追蹤向量時鐘。
  • 墓碑 (Tombstone) 過濾:已刪除的設定檔現在會在擴充功能和伺服器上正確隱藏。

版本 0.8.70 (2025年1月14日)

新功能

私密同步 (FREE 方案)

  • 跨裝置同步:透過 Google Drive 在所有裝置間同步您的對話串、設定和附件
  • 端到端加密:所有同步數據在離開裝置前都會使用您的密碼進行加密
  • 自動背景同步:每 30 秒自動同步變更,並具備智慧防抖機制
  • 衝突解決:採用 CRDT 風格的向量時鐘,確保變更在不同裝置間正確合併

改進項目

私密同步效率

  • 減少輪詢:同步間隔從 3 秒增加到 30 秒,以減少 API 調用
  • 智慧防抖:在變更穩定後等待 10 秒再進行同步
  • 執行中保護:AI 正在處理的對話串將排除在同步之外,直到完成為止

版本 0.8.69 (2025年1月14日)

新功能

Slate 修訂導覽

  • 在變更間導覽:新增導覽按鈕,可在編輯器中跳轉至待處理的修訂區塊
  • 變更計數器:視覺指示器顯示目前位置(例如「2/5」)
  • 鍵盤快速鍵:使用 Alt+Up/Down 快速在區塊間導覽,無需離開鍵盤

改進

文件處理

  • 遠端 OCR 後備:當本地 PDF 文字擷取失敗或結果不佳時,文件會自動透過雲端 OCR 處理以提高準確度
  • 處理狀態:即時回饋顯示文件何時正在遠端處理

推理模型支援

  • 多輪推理:在對話輪次間更好地快取推理細節,改善擴充思考模型的連續性
  • 更乾淨的訊息:內部系統註解現在會從渲染的訊息中移除,防止指令洩漏

版本 0.8.68 (2025年1月11日)

新功能

長期記憶

  • 內容持久性:AI 現在可在對話間維護長期記憶,記住關於您偏好與工作流程的重要內容
  • 使用量追蹤:增強對權杖使用量與成本的追蹤,並提供詳細記錄

模型智慧

  • 智慧模型選擇:全新的模型智慧功能有助於根據您的使用模式識別最佳模型
  • 排名系統:模型按效能與價值指標進行排名

改進

儲存可靠性

  • 跨平台儲存:模型快取、工具批准與已學習頁面現在可在擴充功能、伺服器與 LAN 模式間可靠運作
  • 驗證逾時:修復連線至轉發伺服器時可能的掛起 — 現在會在 5 秒後優雅逾時,而非無限等待
  • 設定載入速度:設定與模型選擇器在擴充功能重新載入後載入更快

內容分頁

  • 適當的頁面大小:網頁內容現在根據模型的實際內容視窗(例如 131k 權杖)進行分割,而非硬編碼預設值。這意味著使用高內容模型時,您會看到更大的頁面區塊與更少的頁面。

錯誤修復

  • API 金鑰持久性:修復了短暫啟用再停用 LAN 模式後 OpenRouter API 金鑰會被「遺忘」的問題

版本 0.8.67 (2025年1月7日)

新功能

Kokoro TTS - 本地神經文字轉語音

  • 高品質語音:Kokoro 是一個本地神經 TTS 模型,在多種語音中提供自然聽感的語音
  • 無需 API 金鑰:使用 WebGPU/WASM 完全在裝置上執行 — 無需雲端服務或 API 金鑰
  • 多種語音:從美式、英式與其他口音選項中選擇,並提供男/女聲變體
  • 長文字支援:透過串流合成正確處理長文字 — 不再於 30 秒處中斷
  • 乾淨語音:在朗讀前自動剝離 Markdown 格式(粗體、斜體等)

改進

語音設定

  • 統一語音區塊:TTS 與 STT 設定在更簡潔的版面中整合
  • 語音預覽:在使用前測試選定的語音

版本 0.8.66 (2025年1月7日)

改進

設定面板搜尋

  • 篩選搜尋:設定頂部新增搜尋框,可按關鍵字快速篩選區塊
  • 即時結果:輸入即可篩選 — 符合的區塊會立即出現
  • 鍵盤友善:開啟設定時自動聚焦搜尋框

MCP 伺服器可靠性

  • 啟動驗證:MCP 伺服器現在會在返回成功前驗證是否正在執行
  • 更好的錯誤訊息:當 MCP 伺服器在啟動期間崩潰時,會顯示實際錯誤而非通用失敗訊息
  • 修正範例:修正範例套件名稱以使用 @modelcontextprotocol/server-* (而非 @anthropic/mcp-server-*)

macOS 應用程式驗證

  • 自我驗證權杖:修復在 WebSocket 狀態同步前新增 MCP 伺服器時的 401 錯誤
  • 更快的驗證:HTTP 端點不再需要等待 WebSocket 連線

版本 0.8.65 (2025 年 1 月 6 日)

新功能

ElevenLabs 語音整合 (BYOK)

  • 雲端 TTS:使用 ElevenLabs 的高品質文字轉語音——從多種語音和模型中選擇
  • 雲端 STT:具有即時串流(約 150 毫秒延遲)和 90 多種語言支援的 Scribe 轉錄
  • 語音選擇:直接在設定中瀏覽並從 ElevenLabs 語音庫中選擇
  • 模型選項:在 Flash v2.5(極速約 75 毫秒)、Turbo v2.5 或 Multilingual v2(最佳品質)之間選擇
  • 攜帶您自己的金鑰:使用您的 ElevenLabs API 金鑰——Caiioo 不收取額外費用

多語言 Whisper 模型

  • Whisper Tiny Multilingual:支援 99 種語言的新本地 STT 選項(約 39MB 下載)
  • 與純英文版體積相同:與 Whisper Tiny English 相同的 39MB 緊湊體積
  • 語言檢測:自動檢測所說的語言

Google 文件增強型讀寫

  • 預設使用 Markdown:寫入時文本現在預設格式化為 Markdown。使用 useMarkdown: false 進行保留現有格式的純文本插入。
  • 豐富格式:將 Markdown 標題、粗體、斜體、刪除線和連結轉換為原生的 Google 文件樣式
  • 列表與表格:支援帶有嵌套的有序/無序列表和 Markdown 表格
  • 建議追蹤:待處理的建議以語義標籤顯示:<ins>新增文本</ins> 表示插入,<del>移除文本</del> 表示刪除。相鄰標籤表示替換。
  • 行內註釋:註釋與作者署名一起顯示在行內:<comment author=\"姓名\" on=\"引用文本\">內容</comment>,並帶有嵌套的 <reply> 標籤用於對話串

改進

Gemini 擴展思考

  • 改進的思考簽名:更好地處理跨串流區塊的 Gemini thought_signature,改進了多輪工具使用中的擴展思考連續性

版本 0.8.64 (2025年1月5日)

新功能

Google Sheets 單元格元數據

  • 讀取超連結與註解:使用 includeMetadata: true 來檢索單元格中的超連結、註解及數據驗證規則
  • 新增超連結:新增 update_cell_metadata 動作,以加入帶有自訂顯示文字的可點擊超連結
  • 新增註解:以程式化方式為單元格附加註解/評論
  • 數據驗證:在單元格上建立下拉式選單、數字範圍、文字驗證及自訂公式規則

Safari 平鋪 (macOS)

  • 智慧視窗定位:從側邊欄開啟連結時,Safari 視窗會自動定位在側邊欄旁邊,以便於並排瀏覽
  • 螢幕空間最佳化:平鋪邏輯會根據可用螢幕空間計算最佳的 Safari 放置位置
  • 模式變更時重新平鋪:當側邊欄變更模式時,Safari 視窗會自動重新定位

macOS 側邊欄中的複製/貼上

  • 完整複製/貼上支援:複製與貼上功能現在可在 macOS 側邊欄應用程式中穩定運作
  • 系統鍵盤快速鍵:標準的 ⌘C/⌘V 快速鍵可如預期般運作

改進

macOS 伺服器可靠性

  • 訊號處理:改進了對管道訊號的處理,以防止應用程式意外終止
  • 重啟可靠性:伺服器停止與重啟操作現在更加可靠,並具備適當的清理機制
  • 連線穩定性:透過重試邏輯與指數退避演算法,更好地處理 OAuth 權杖重新整理

Safari 擴充功能

  • 穩定的瀏覽器 ID:Safari 擴充功能現在會產生穩定的瀏覽器 ID,以防止重新連線時出現重複項目
  • 更乾淨的重新連線:伺服器端瀏覽器註冊使用客戶端提供的穩定 ID,以實現更乾淨的重新連線處理

模型選擇器

  • 捲動至已選項目:開啟模型下拉式選單時,現在會自動捲動至目前選取的模型

macOS 應用程式中的分頁參照

  • 適用於側邊欄:分頁參照與上下文現在可在原生 macOS 側邊欄中運作,而不僅限於 Chrome 擴充功能

版本 0.8.63 (2025 年 12 月 31 日)

新功能

語音輸出 (文字轉語音)

  • 朗讀:AI 回應現在可以使用 Microsoft Edge TTS 朗讀
  • 自動播放選項:在設定中啟用新 AI 回應的自動朗讀
  • 速度控制:將播放速度從 0.5x 調整到 2x
  • 暫停/恢復:透過每條訊息上的暫停和恢復按鈕控制播放

本地語音轉文字 (Whisper)

  • Whisper 升級:選擇加入本地 Whisper 轉錄以獲得更準確的語音輸入
  • 模型下載:下載 Whisper Tiny 模型(約 40MB)以供離線使用
  • 隱私:音訊在本地處理,絕不發送到外部伺服器
  • 備案:如果 Whisper 不可用,則回退到 Web Speech API

統一議程工具

  • 單一工具:新的 agenda 工具整合了日曆和提醒事項操作
  • 多提供商:適用於 Google 日曆、Apple 日曆、Apple 提醒事項和 Caiioo 提醒事項
  • 代理更簡便:所有排程需求共用一個工具介面

改進

設定面板

  • 持久的折疊狀態:各部分的開啟/關閉狀態現在會在對話之間被記住
  • 語音設定:用於配置 TTS 和 STT 偏好的新部分

版本 0.8.62 (2025年12月31日)

新功能

DOCX 清單支援

  • 編號清單:帶有編號清單的 Word 文件現在能以正確格式渲染
  • 項目符號清單:項目符號清單被保留並準確顯示
  • 巢狀清單:多層級清單縮排在 HTML 預覽中得以維持

試算表 CSV 匯出

  • 匯出為 CSV:XLSX 檔案現在可匯出為 CSV 以便於資料擷取
  • 格式選擇:下載試算表附件時,可在 XLSX 或 CSV 間選擇

版本 0.8.61 (2025 年 12 月 30 日)

新功能

工具核准工作流程

  • 互動式核准:特定工具現在在執行前需要使用者核准——您將會看到一個視窗,要求您核准或拒絕該操作
  • 狀態追蹤:工具執行現在會在時間軸中顯示「等待核准」與「已拒絕」狀態
  • 預設安全:敏感操作在繼續執行前會等待明確的使用者同意

目前位置變數

  • {{currentLocation}}:新增變數,用於將您目前的地理位置資訊加入提示詞 (prompts) 中
  • 地理位置權限:首次使用時需要瀏覽器地理位置權限
  • 情境感知:非常適合基於位置的查詢,例如「我附近的餐廳」或旅遊規劃

批次執行緒管理

  • 多重選取模式:切換選取模式以一次選取多個執行緒
  • 批次刪除:透過單一操作刪除選取的執行緒
  • 批次封存/匯出:同時封存或匯出多個執行緒

Slate 中的影像檢視器

  • 專用檢視器:影像現在會在 Slate 內以全螢幕檢視器開啟
  • 縮放控制:可對大型影像進行放大/縮小與平移
  • 下載選項:用於將影像儲存至本機的快速下載按鈕

改進項目

推理顯示

  • 更好的聚合:模型思考/推理區塊現在已正確合併,不會重複
  • 更簡潔的顯示:來自擴展思考模型的推理內容顯示更加穩定

Ollama 整合

  • 串流推理:來自本機 Ollama 模型的推理/思考內容可即時串流顯示
  • 更好的模型處理:改進了與 Mistral 模型的相容性以及嚴格的訊息排序要求

附件管理

  • 孤立檔案清理:設定中新增對話框,用於管理未連結至任何執行緒的孤立附件
  • 指派至執行緒:將孤立附件移動至現有的執行緒
  • 批次刪除:清理孤立檔案以釋放儲存空間

Slate 預設值

  • 預設為 Markdown:建立新的 Slate 而未指定類型時,現在預設格式為 markdown (.md)

版本 0.8.6 (2025年12月19日)

新功能

瀏覽器自動化等待動作

  • 離散等待類型:瀏覽器自動化中全新的 wait 動作,具備 4 種專門的等待模式:
    • timeout - 簡單延遲(預設 1000ms,最大 30000ms),用於基本計時
    • selector - 等待元素出現或消失(適用於轉輪/載入器)
    • network_idle - 等待 fetch/XHR 請求穩定(僅限擴充功能)
    • animation - 等待 CSS 動畫與轉場完成
  • 智慧元素可見性:選擇器等待會檢查 display、visibility、opacity 與 offsetParent 以實現準確的可見性偵測

改進

瀏覽器自動化架構

  • 統一指令碼執行:全新的 executeInPage 抽象確保在 Chrome 擴充功能與轉發/伺服器環境間行為一致
  • MAIN 世界執行:為需要攔截頁面級 JavaScript (fetch, XHR) 的操作提供正確的 MAIN 世界指令碼執行
  • 優雅降級:僅限擴充功能的功能現在會在轉發模式下使用時,提供包含替代方案的有助錯誤訊息

錯誤修復

OAuth 權杖重新整理

  • Chrome 擴充功能權杖重新整理:修復了 Chrome 快取的 OAuth 權杖未正確重新整理的過時權杖問題。權杖現在會經過驗證,且過時權杖會在重試前清除。
  • PKCE 授權流程:OAuth 彈出視窗現在使用帶有 PKCE 的授權碼流程而非隱含流程,實現正確的重新整理權杖支援,無需用戶端密鑰。
  • 直接權杖重新整理:帶有重新整理權杖的連線現在可直接使用 Google 的權杖端點重新整理,無需後端伺服器。
  • 權杖驗證:新增權杖驗證步驟,以儘早捕捉已撤銷/無效的權杖並觸發自動重新驗證。

版本 0.8.5 (2025年12月19日)

新功能

Apple 行事曆整合

  • 原生行事曆存取:全新的 Apple 行事曆工具透過 EventKit 提供對 macOS 行事曆的高速原生存取
  • 統一議程:合併顯示來自所有已連結帳戶(Google Calendar + Apple 行事曆)的提醒事項與行事曆活動
  • 多帳戶支援:可同時從多個 Google Calendar 帳戶與 Apple 行事曆提取活動

已學習頁面

  • 智慧頁面學習:透過擷取網站結構,讓 Caiioo 了解特定網站
  • URL 模式比對:已學習的模式會自動套用於同網站下的類似頁面
  • DOM 快照儲存:擷取的頁面結構有助於 AI 更好地理解複雜的網頁應用程式並與之互動

RTF 文件支援

  • 富文本編輯:直接在 Slate 中上傳並編輯 RTF (Rich Text Format) 文件
  • 雙向轉換:在保留格式的同時,於 RTF 與 HTML 之間進行轉換
  • 匯出選項:將編輯後的文件下載為 RTF,以便在 Pages、Word 或其他文書處理軟體中使用

改進項目

桌面應用程式安全性

  • 中繼驗證:擴充功能與桌面伺服器之間採用安全的 HMAC-SHA256 驗證
  • 個別用戶權杖:驗證權杖現在與用戶身份綁定,以確保多用戶環境下的安全性
  • 受保護的端點:所有敏感的 API 端點現在皆需要驗證

效能

  • Swift 輔助程式:用於 Apple 提醒事項、行事曆與備忘錄的原生 Swift 二進位檔,提供比 AppleScript 快 10 倍的存取速度
  • 直接呼叫:在桌面環境執行時,Apple 工具會繞過 HTTP 中繼以降低延遲
  • 共享公用程式:整合的中繼 API 用戶端消除了程式碼重複

錯誤修復

  • 行事曆活動去重:出現在多個行事曆中的活動現在會在統一視圖中正確去重
  • 提示詞快取:修復了在權杖估算過程中快取控制標記被移除的問題

版本 0.8.45 (2025年12月18日)

新功能

  • 影像去重:當您在對話中多次上傳同一張影像時,AI 現在會將其識別為重複,並參考原始影像而非再次處理。這節省了內容權杖,並有助於 AI 理解您指的是同一張影像。

改進

  • 文件去重:改進跨來源文件比對 — 無論文件內容來自使用者上傳、Gmail 附件還是網頁擷取,現在都能被識別為同一文件。

錯誤修復

  • PDF 驗證錯誤:修復了擷取受保護 PDF 時驗證錯誤 (401, 403) 被遮蔽為通用擷取失敗的問題。實際的驗證錯誤現在會正確顯示並提供有用的指引。

版本 0.8.44 (2025年12月18日)

錯誤修復

  • 重新載入/重新生成按鈕:修復了點擊助理訊息上的重新載入時,會顯示舊回應而非正在生成的新回應的問題。UI 現在會在串流期間正確切換至新分支。

改進

  • 內容視窗管理:所有分頁與內容計算現在一致使用更保守的權杖估算 (3 字元/權杖),減少大型網頁導致內容溢位錯誤的機率。

版本 0.8.43 (2025年12月17日)

改進

時間軸與推理顯示

  • 完成時自動摺疊:推理區塊與處理時間軸現在會在生成完成時自動摺疊,保持對話簡潔且易於存取
  • 可見的中間思考:代理程式在工具呼叫間的「大聲思考」現在會顯示在時間軸中,讓您更深入了解代理程式的決策過程
  • 工具動作標籤:工具呼叫現在會在標籤中顯示特定動作(例如「Web Browse → click」而非僅「Web Browse」)

工具結果

  • 螢幕截圖顯示修復:螢幕截圖與影像不再於工具結果中自動展開 — 僅渲染的文字內容(如搜尋結果)會自動展開

錯誤修復

  • Ollama CORS:修復了從 Chrome 擴充功能使用 Ollama 時的連線問題 — CORS 標頭現在會自動處理

版本 0.8.41 (2025年12月15日)

改進

  • 類型安全:伺服器存儲適配器現在對對話串、技能、設定檔、MCP 伺服器和授權資訊使用正確的 TypeScript 類型,而不是 any
  • 構建系統:備份目錄現在通過 caiioo_BACKUP_DIR 環境變數選擇加入(不再是硬編碼)

版本 0.8.4 (2025年12月15日)

新功能

DNG/RAW 影像支援

  • 相機 RAW 檔案:直接從您的相機或照片庫上傳 DNG (Digital Negative) 檔案
  • 自動預覽擷取:從 RAW 檔案中擷取嵌入的 JPEG 預覽以進行快速處理
  • 保留原始品質:保留原始 RAW 資料,同時 AI 使用高品質預覽進行工作

改進影像處理

  • 伺服器端壓縮:超過本地壓縮限制的大型影像現在由桌面伺服器處理
  • 更好的錯誤回饋:影像處理失敗時顯示視覺錯誤指示(紅框、警示圖示)
  • 優雅後備:當螢幕外文件不可用時,壓縮會自動切換至伺服器

改進

  • 共用代理程式架構:擴充功能與桌面伺服器間共用統一的代理程式執行器,以確保行為一致
  • 協定處理器整合:儲存與訊息處理現在使用共用的協定處理器

版本 0.8.3 (2025年12月13日)

新功能

原生行動應用程式

  • Android 應用程式:原生 Kotlin 應用程式 (android-app/),具備 WebView + 原生橋接通道 (CalendarContract, SAF/相片選取器, AlarmManager, OkHttp 串流)
  • 共享 UI:行動應用程式使用與網頁擴充功能相同的 React UI,以提供一致的體驗
  • iOS + Android:原生 Swift (iOS) 與原生 Kotlin (Android) 具備相匹配的橋接 API

改進項目

  • 身份同步:改進了擴充功能與桌面伺服器之間的授權與個人資料數據同步
  • 附件管理:優化了區域網路 (LAN)/中繼模式下的附件處理
  • 擴充功能客戶端追蹤:桌面伺服器現在會記錄已連接擴充功能客戶端的時間戳記

移除項目

  • Swift 中繼應用程式:macOS 中繼功能現在完全由原生應用程式伺服器處理(於 0.8.2 引入)

版本 0.8.2 (2025年12月12日)

新功能

跨平台桌面伺服器

  • Caiioo Server:全新的 Electron 桌面應用程式取代了僅限 macOS 的 Swift 中繼程式
  • Windows 支援:提供原生 Windows 安裝程式 (NSIS) 與可攜式執行檔
  • Linux 支援:提供適用於 Linux 發行版的 AppImage 與 .deb 套件
  • 選單列整合:具備狀態指示燈與快速控制功能的系統匣/選單列應用程式

平台特定指令碼執行

  • 統一指令碼 API:全新的 /api/script 端點可自動偵測平台並使用適當的指令碼引擎
  • Windows 上的 PowerShell:在 Windows 上執行 PowerShell 指令碼以進行系統自動化
  • Linux 上的 Bash:在 Linux 系統上執行 Shell 指令碼 (bash/sh/zsh)
  • macOS 上的 AppleScript:保留現有的 AppleScript/JXA 支援

跨平台輔助程式

  • 桌面通知:在所有平台上使用原生 API 顯示通知
  • 剪貼簿存取:跨平台讀取與寫入剪貼簿內容
  • 活動視窗偵測:獲取前景應用程式/視窗標題
  • 系統資訊:擷取作業系統、CPU 與記憶體資訊

改進項目

  • 自動化建置流程:版本、圖示與授權資訊在建置期間會從主專案同步
  • 更精簡的發行版本:移除冗餘的行動裝置應用程式程式碼庫,為統一建置做準備

版本 0.8.1 (2025年12月11日)

新功能

靈活的登入選項

  • 多種驗證方式:使用 Google OAuth、電子郵件/密碼或授權金鑰登入 - 選擇最適合您的方式
  • 帳號連結:將您的 Google 帳號連結至現有的電子郵件/密碼帳號,以跨方式無縫存取

MCP 伺服器自訂 OAuth

  • 自備 OAuth 憑證:對於需要預先註冊 OAuth 客戶端的 MCP 伺服器,您現在可以提供自己的客戶端 ID 與密鑰
  • 動態權杖重新整理:OAuth 權杖會自動重新整理,確保與 MCP 伺服器的連線不中斷

改進

  • 文件處理指示器:處理 PDF、Word 文件與 Excel 試算表時顯示清晰的視覺指示器
  • 依層級導覽設定:設定面板現在會根據您的訂閱層級智慧顯示相關選項
  • 更好的 OAuth 錯誤處理:改進了 MCP 伺服器 OAuth 探索失敗時的錯誤訊息

Version 0.8.0 (2025年12月10日)

新功能

MCP Server 瀏覽與管理

  • 瀏覽 MCP Servers:直接在 Settings 中從 MCP Registry 和 npm 搜尋並安裝 MCP servers。
  • 本地 MCP Servers:透過 relay app 在您的機器上本地執行 MCP servers,以增強隱私與控制。
  • 憑證解析:MCP servers 現在可以從 Credentials Vault 提取憑證,以進行安全身分驗證。
  • 健康監測:對已連接的 MCP servers 進行自動健康檢查,並提供狀態指示燈。

設定檔管理

  • 多重設定檔:建立並在多個使用者設定檔之間切換。
  • 設定檔切換器:在 composer 中提供易於存取的下拉選單以切換設定檔。
  • 刪除設定檔:移除您不再需要的設定檔。

Google 帳戶選擇

  • 帳戶選擇對話框:連接 Google 服務時,可選擇您的 Chrome 設定檔帳戶或新增不同的 Google 帳戶。
  • Web OAuth 流程:針對未登入 Chrome 的帳戶,提供透過網頁瀏覽器進行驗證的選項。

增強型瀏覽器代理 (Browser Agent)

  • 返回操作:代理現在可以在瀏覽器歷史記錄中向後導覽。
  • ARIA Snapshot:擷取無障礙樹狀結構快照,以更少的 tokens 進行更高效的頁面分析。

行動應用程式

  • iOS App:原生 iOS 用戶端,用於在您的區域網路中存取 Caiioo。
  • Android App:原生 Android 用戶端,具備伺服器發現與 WebView 快取功能。

多裝置同步

  • 裝置識別:每個連接的裝置/擴充功能都以其專屬身分進行追蹤。
  • 狀態同步:在多個連接的擴充功能之間進行即時狀態同步。
  • Web 用戶端驗證:為連接到 relay 的 web 用戶端提供安全驗證。

改進項目

  • LLM 提供者金鑰管理:直接在 Credentials Vault 中管理各個 LLM 提供者的 API 金鑰。
  • MCP 工具圖片:回傳圖片的 MCP 工具現在會直接在對話中內嵌顯示。
  • PDF 文字偵測:改進 PDF 擷取中對亂碼/空格文字的偵測,並提供信心度評估。
  • 圖片 CORS 繞過:圖片現在透過 offscreen document 獲取,以繞過 CORS 限制。

錯誤修復

  • 生成狀態追蹤:改進最終狀態擷取,確保能準確偵測生成完成。

版本 0.7.8 (2025年12月7日)

新功能

Excel 試算表支援

  • XLSX 匯入:直接將 Excel 試算表 (.xlsx) 上傳至您的對話中
  • 資料提取:試算表內容會被解析並提供給 AI 進行分析
  • 雙向編輯:在 Slate 中編輯試算表並匯回 XLSX 格式

「最新動態」對話框

  • 更新通知:更新 Caiioo 後,會自動顯示「最新動態」對話框,列出新版本的版本說明
  • 版本特定說明:透過格式化的功能列表與改進項目,精確查看更新內容
  • 無干擾設計:對話框在每次更新後僅出現一次,且不會在首次安裝時顯示

版本 0.7.6 (2025年12月3日)

新功能

支援追蹤修訂的 Word 文件

  • DOCX 匯入:直接將 Word 文件 (.docx) 上傳至您的對話中
  • 追蹤修訂可見:懸停時可查看插入 (綠色) 與刪除 (紅色刪除線) 的內容,並顯示作者與日期
  • 註解支援:註解以黃色標示,懸停時顯示註解內容與作者
  • Slate 編輯:在 Slate 中檢視與編輯 DOCX 內容,並保留完整的追蹤修訂樣式
  • 深色模式支援:所有追蹤修訂與註解樣式在淺色與深色主題下均可正常運作

版本 0.7.4 (2025年12月2日)

新功能

FLUX 影像產生器

  • AI 影像生成:透過 OpenRouter 使用 FLUX AI 模型,根據文字描述產生影像
  • 影像編輯:提供附件 ID 與編輯指令,即可編輯對話中現有的影像
  • 多重參考支援:使用 flux.2-flex 模型結合最多 10 張影像的元素
  • 多種模型:可選擇 flux.2-pro (快速,預設) 或 flux.2-flex (最高品質)
  • 自動儲存:產生的影像會儲存至您的對話並內嵌顯示
  • 成本追蹤:影像生成成本會分開追蹤並計入對話總額

版本 0.7.3 (2025年12月1日)

新功能

增強型模型選擇器

  • 統一模型選擇器:在撰寫器與設定中提供一致的模型選擇體驗
  • 隱私指示器:盾牌圖示顯示具備零資料保留 (ZDR) 的模型 - 您的提示詞不會用於訓練
  • 視覺支援:眼睛圖示表示可分析影像的模型
  • 推薦模型:星號圖示標示推薦選項 (Claude Haiku 4.5, Claude Sonnet 4.5)
  • 成本透明度:直接在模型列表中查看每百萬 token 的價格 - 輕鬆識別 FREE 模型
  • 圖示說明:設定中的快速參考說明每個指示器的含義

版本 0.7.2 (2025年12月1日)

新功能

PDF 文件擷取

  • 直接上傳 PDF:將 PDF 文件附加至您的訊息 - 透過 Mistral OCR 自動處理
  • 高品質文字擷取:表格、圖表、方程式與格式皆以 Markdown 格式保留
  • 代理文件擷取:代理程式可使用新的 ingest_document 動作,處理瀏覽時遇到的 PDF 網址
  • 永久儲存:擷取的內容會儲存以供日後參考,無需重複支付處理成本

錯誤修復

  • 大型影像附件:超過 5MB 的影像現在會在傳送至 LLM API 前自動壓縮,修復了與 Google/Gemini 等供應商連線時出現的「影像超過 5 MB 上限」錯誤

版本 0.7.0 (2025年12月1日)

新功能

多執行緒支援

  • 同時執行多個代理程式:您現在可以同時執行最多 3 個執行緒
  • 視覺化執行指示器:當執行緒正在產生內容時,側邊欄的執行緒標題旁會出現動畫點
  • 背景處理:代理程式在背景工作時不會搶佔焦點 - 您可以自由瀏覽網頁
  • 執行緒隔離:每個執行緒獨立追蹤其分頁與狀態

代理程式非干擾機制

  • 保持控制:當代理程式開啟分頁或導覽頁面時,若您已切換至其他分頁,它不會搶佔您的焦點
  • 智慧分頁感知:代理程式僅處理其建立或初始化的分頁,不會在執行中途跟隨您到新分頁

Apple 整合 (macOS)

  • Apple 備忘錄:跨資料夾讀取、建立、搜尋與整理備忘錄 - AI 可協助直接起草與編輯備忘錄
  • Apple 提醒事項:管理待辦事項與提醒 - 在 AI 協助下建立、完成與整理任務

版本 0.6.5 (2025年11月30日)

新功能

AI 後續建議

  • 智慧提示詞:助理回應後,會出現 AI 產生的後續建議,協助延續對話
  • 情境感知:建議會根據對話情境與您接下來可能想執行的動作進行調整

改進

LAN 中繼設定

  • 顯示網路位址:連線至中繼伺服器時,設定頁面現在會顯示實際 IP 位址與 .local 主機名稱,方便行動裝置連線
  • 簡化說明:伺服器執行後會自動顯示連線資訊 - 無需檢查終端機

版本 0.6.4 (2025年11月29日)

錯誤修復

Slate 修訂系統

  • 單字級接受/拒絕:現在可以可靠地接受或拒絕個別單字變更,而不會破壞後續變更
  • 穩定變更追蹤:修復了接受變更會導致其他待處理變更無法點擊的問題
  • 預覽中的 Markdown 渲染:變更預覽現在會渲染 Markdown 格式 (粗體、斜體等),而非顯示原始星號
  • 無限迴圈修復:修復了接受純文字新增時瀏覽器凍結的問題
  • 完整差異顯示:變更預覽現在顯示所有刪除與新增的單字,而不僅僅是最小差異

版本 0.6.3 (2025年11月26日)

新功能

  • 基礎使用者預設體驗:新使用者現在預設為基礎使用者而非管理員
  • 授權金鑰升級:在設定中新增顯眼的「升級至 Pro」按鈕,以使用授權金鑰解鎖管理員功能
  • 簡化入門流程:更簡潔的首次使用者體驗,專注於核心功能

版本 0.6.2 (2025年11月26日)

錯誤修復

  • 生成逾時恢復:修復了 Slate 長時間作業期間 UI 無限顯示「生成中」的靜默失敗問題
    • 後端現在會追蹤生成期間的活動,若 2 分鐘無進度則逾時
    • 串流區塊、工具執行與代理程式決策皆會重置逾時時間
    • 服務工作執行緒在生成中途重新啟動時自動恢復 (孤立狀態偵測)
    • 發生逾時時會向使用者顯示錯誤訊息,而非靜默凍結

版本 0.6.1 (2025年11月26日)

新功能

對話串匯入/匯出

  • 匯出選定的對話串:切換選擇模式以挑選特定對話串進行匯出
  • 匯出所有對話串:一鍵匯出所有包含附件的對話
  • 從檔案匯入:從匯出的 JSON 檔案匯入對話串
  • 選擇性匯入:從檔案中選擇要匯入的對話串
  • 重複偵測:自動偵測已存在的對話串,並提供跳過或覆蓋的選項
  • 附件支援:匯出內容包含所有圖片、PDF 和檔案
  • 封存對話串支援:作用中與已封存的對話串皆可匯出/匯入

改進的 Prompt Caching

  • 提高 Claude 模型長對話的快取命中率
  • 動態快取策略會根據對話長度進行調整

Google Workspace 整合

  • Google Drive:搜尋、建立、複製、移動、分享檔案與資料夾
  • Gmail:讀取郵件、管理標籤、建立草稿(安全優先:僅限草稿,不自動傳送)
  • Google Calendar:列出日曆、查詢活動、建立/更新/刪除活動、尋找空檔時間
  • 內嵌授權:直接從聊天介面授權 Google 存取權限,無需前往 Settings

網頁瀏覽改進

  • 新增 click_coordinates 動作,可透過螢幕位置點擊元素
  • 預設在全分頁中開啟 URL(防止分頁被覆蓋)
  • 分頁會根據每個對話串自動分組
  • 改進 CSS 選擇器偵測,實現更可靠的元素點擊

模型選擇

  • 模型選擇器移至編輯區,方便快速切換
  • 模型在切換模式時會保持全域一致
  • 具備視覺能力(Vision)的模型標有眼睛圖示

串流 UI

  • 工具參數在串流傳輸時即時顯示
  • 逐步顯示推理/思考(reasoning/thinking)區塊
  • 回應期間顯示「正在生成...」狀態指示器

Token 使用量與成本追蹤

  • 顯示輸入、輸出、推理及快取(cached)Token
  • 顯示每則訊息的成本以及對話串的累計成本

UI 改進

  • 所有使用者皆可使用模式選擇器:非管理員使用者現在可以在 Settings 中切換模式
  • 可摺疊的設定區塊:Settings 面板區塊可以摺疊/展開,以便導覽
    • AI & Model Configuration (LLM Provider, API Key, Model, Temperature, Max Iterations)
    • Personalization (Personal Instructions, Profile Variables)
    • Agent Mode Configuration (Mode Selector, Variables, Instructions, Branding, Tools, MCP Servers)
    • Appearance settings
    • Backup & Restore
    • Documentation
  • 模式專屬主題顏色:每個內建模式現在都有預設色系
    • Shopping Agent:綠色
    • Travel Agent:藍色
    • Helper Agent:粉紅色
    • Caiioo (General):紫色
  • 色彩循環模式 (Chromatic Mode):啟用色彩旋轉,使色譜逐漸循環切換
  • 主題覆蓋管理
    • 當主題被自定義時會顯示視覺指示(切換模式時不會遺失)
    • 「儲存為模式預設值」按鈕(管理員)可將主題持久化為該模式的新預設值
    • 「重設為模式預設值」可恢復原始模式主題顏色
  • 全新的 Caiioo 品牌識別與圖示
  • 模式選擇器移至編輯區
  • 新建對話按鈕顯示模式選擇下拉選單
  • 編輯區頂部欄位新增對話串列表切換開關
  • 受控瀏覽器分頁新增暈影邊框效果
  • 受控分頁上新增懸浮停止按鈕
  • 下拉選單在靠近螢幕邊緣時會正確定位

錯誤修復

  • 模型選擇器在設定更改後立即更新
  • 新使用者引導流程現在能正確啟動 Helper Agent
  • Settings 面板不再因格式錯誤的自定義變數而當機
  • 當對話串標題更改時,分頁群組名稱會同步更新
  • Slate 接受/拒絕小工具位置已修正
  • 擴展思考功能支援更多模型(Haiku 4.5, Gemini 等)
  • 修復了「最多 4 個 cache_control 區塊」的錯誤

版本 0.3.4 (2025年11月24日)

新功能

選取文字上下文

  • 在網頁上選取文字時會出現「加入提示詞」按鈕
  • 選取的文字會以標籤形式顯示在編輯器中,並附帶頁面上下文
  • 擷取 DOM 位置以實現精確的代理互動

Google Calendar 整合

  • 完整的行事曆管理(列出、建立、更新、刪除活動)
  • 跨所有行事曆的智慧空檔搜尋
  • 自然語言時間解析(如「明天」、「下週」)

錯誤修復

Slate 模式

  • 接受/拒絕按鈕不再被編輯器內容遮擋
  • 字詞級別的差異高亮(而非整行)
  • 多個 propose_change 呼叫現在會正確累積
  • 視圖切換不再意外「彈回」

品牌重塑

  • 名稱由「ContextFlow」更名為「Caiioo」

版本 0.3.0 (2025年11月22日)

新功能

行動裝置與區域網路存取

  • 區域網路伺服器:從區域網路內的任何裝置存取 Caiioo
  • 對話側邊欄:在瀏覽器分頁中開啟對話,以獲得更大的螢幕空間
  • 行動端匯出:將對話匯出為獨立的 HTML 檔案以便離線查看

錯誤修復

  • 修復了關鍵的訊息分支邏輯錯誤
  • 修復了已封存執行緒的操作問題

版本 0.2.0 (2025年11月21日)

新功能

擴充思考支援

  • Claude 模型現已支援擴充思考/推理區塊
  • 可摺疊的推理 UI,方便查看模型的思考過程
  • 推理細節已快取,支援多輪對話的連續性

新的 LLM 提供者

  • Ollama 整合:透過 Ollama 執行本機 LLM
  • 在設定面板中選擇提供者

圖片格式支援

  • HEIC/HEIF 支援:Apple 圖片格式會自動轉換以確保相容性

UI 改進

  • 工具選單在關閉時自動儲存
  • 更好的設定面板組織

錯誤修復

  • 改進了變數自動完成的定位

版本 0.1.x (先前版本)

核心功能

  • 多模型 AI 對話 (OpenRouter, Anthropic, OpenAI, Ollama)
  • 瀏覽器自動化與網頁抓取
  • 用於程式碼與文件編輯的 Slate
  • MCP 伺服器整合
  • 螢幕截圖與視覺功能
  • 語音輸入
  • 對話串管理與分支
  • 設定檔與模式系統