この文書は元の英語版を機械翻訳したものです。翻訳版と英語版の間に相違がある場合は、英語版が優先されるものとします。 英語版の原文を読む
バージョン 0.9.720 (2026年5月1日)
ブランド
- 共通: PebbleFlow は Caiioo になりました: 製品名が Caiioo に変更されました。使い慣れたアプリ、その中身はそのままです。サイドパネル、設定、ウェブサイト、macOS ホストアプリのメニュー、Safari ホストアプリの各所で新しい名称が表示されます。既存のデータ、アカウント、サインイン状態、同期設定に変更はありません。表示名のみが移行します。マーケティングサイトは当面 pebbleflow.ai で運営され、前方互換性を持って新ブランドを表示します。正規の caiioo.ai へのルーティングは、今後のリリースで順次行われます。
新機能
- 共通: 新規ユーザーのシンプルモードをデフォルトでオンに: 初回インストール時の設定がシンプルモードになりました。メッセージごとのトークン数やコストの詳細、ロスレス圧縮のドロップダウン、タブコンテキストのインジケーターを非表示にする、より落ち着いたコンポーザー画面を提供します。モデルの選択は主要なアクションであるため、モデルピッカーは引き続き表示されます。既存のユーザーは、現在のシンプルモードの設定が維持されます。コンポーザーに追加された新しい目アイコンのトグルにより、ワンタップで詳細情報の表示・非表示を切り替えられます。
- 共通: アカウント削除: ウェブサイトのアカウントページ(Apple のアカウント削除要件に基づき、iOS アプリからもリンクされています)から Caiioo アカウントを削除できるようになりました。削除を実行すると、プロフィール、サインイン資格情報、AI クレジット残高、およびプロビジョニングされた OpenRouter キーの暗号化コピーが削除されます。法律で義務付けられている、アカウント ID を含まない最小限のコンプライアンス監査ログのみが保持されます。新しいプライバシーポリシーのセクションに、削除されるものと保持されるものが明記されています。
- iOS: ネイティブ・オンデバイス・テキスト読み上げ (Kokoro 82M): Kokoro 音声合成が、0.9.719 の e5-embeddings アーキテクチャと同様に、WKWebView 内ではなく OnnxRuntime を介して iOS ホストプロセスで実行されるようになりました。モデルは WebKit のプロセスごとの制限をサイドパネル UI と奪い合うことなく、ホストプロセスの増量されたメモリ割り当て予算を使用できるため、iPhone 13/14 において高負荷時にオンデバイス TTS が WebView をクラッシュさせることがなくなりました。
改善点
- 共通: 画像生成ツールが低速なストリーミングモデルに対応: 画像生成ツールが OpenRouter の画像モデルに対してストリーミングをオプトインするようになり、
gpt-5.4-image-2のような低速なモデル(エンドツーエンドで約167秒)で発生していた「Network error: Unable to connect to OpenRouter」が修正されました。以前のバッファリング経路では、実際の JSON が到着する前に約 1.8 MB のキープアライブパディングを待機してしまい、接続レイヤーのタイムアウトが先に発生していました。 - 共通: フリーティアのモデル選択が動的に実モデルを選択: 以前の
openrouter/freeメタルーターは、下流のモデルがツールやビジョンをサポートしているかを認識せずに OpenRouter 内部でルーティングしていました。そのため、Android ユーザーが画像とツール呼び出しを同時に送信すると「No endpoints found that support tool use」というエラーが発生していました。Caiioo は自らルーティングを行うようになり、オンボーディング、設定、アップグレードモーダルの「無料モデルを使用する」CTA のすべてにおいて、ツール(および利用可能な場合は画像入力)をサポートする実際の一時的な無料モデルを選択し、レート制限や機能エラーが発生した場合には自動的にスワップします。openrouter/freeを使用している既存ユーザーは、次回の起動時に順次移行されます。 - 共通: 長いメッセージでも Personal Intuition が適切なコンテキストを特定: 以前の検索クエリはメッセージの最後の 500 文字のみを切り出し、単一のベクトルとして埋め込んでいました。長い文章を貼り付けてから質問する場合や、複数のトピックにわたるターンの場合、実際の質問の前に切り捨てられるか、トピックが平坦化された重心にぼやけてしまい、スコアが悪化していました。Caiioo は重要なクエリを抽出するようになりました。文頭をそのまま保持し、続く最大 3000 文字から抽出された重複のない内容保持トークンの集合を付加することで、プロンプトが長くても検索のトピックが外れないようにしました。
- 共通: 設定 → 「最小限の設定」トグルのタイトル反転を修正: トグルのラベルが「最小限の設定」(オン)と「詳細設定」(オフ)で交互に切り替わっていたため、オフの状態ではチェックボックスをオンにすると詳細設定に移動するように見えてしまい、実際の動作と逆になっていました。タイトルは固定され、説明文の冒頭に「オン — 」/「オフ — 」を付加することで、現在の状態を明確にしました。
- 共通: 音声モデルのダウンロードダイアログが不定の進捗に対応: ダウンロード中のモデル情報カードが狭いサイドパネルでオーバーフローすることがあったため、レイアウトを固定しました。サーバーが Content-Length を返さない場合、進捗ブロックは 0% でフリーズするバーの代わりに、不定状態を示すスピナーを表示します。
- 共通: シンプルモードで統計情報を完全に隠さずコンパクトに表示: 以前のシンプルモードではスレッド統計のサマリーをすべて非表示にしていました。現在は、コンテキストウィンドウのリング、コンパクトな総トークン数(例: 「1k」)、コスト、残りクレジットを表示するスリムなストリップを表示します。コンポーザーの目アイコンをタップすれば、詳細表示に展開できます。
- 共通: サブエージェントのコストを正しく合算: スレッドごとのコスト集計において、サブエージェントの Perplexity / ウェブ検索費用、ヘルパーコスト、画像/動画/音楽生成コスト、PDF OCR コスト、音声コストが漏れていました。すべてのカテゴリが親の
sub_agent_cost行に合算されるようになりました。 - 共通: 設定 → ツールセレクターがデフォルトオフのツールのオーバーライドに対応: デフォルトで無効に設定されているツールに対して「常に使用」または「自動」を選択しても、無視される問題がありました。動的なツール設定の選択がデフォルト設定を優先するようになりました。
- 共通: ローカルサイドカーの表記を「デスクトップアプリ」に変更: ローカル stdio MCP サーバーやデスクトップ専用ツールを支えるサイドカー「PebbleFlow Relay」へのユーザー向け参照をすべて、ユーザーが実際にインストールする名称である「デスクトップアプリ」に統一しました。
- 共通: プライバシーに関する文言を整理: 法的ポリシー、ストアの掲載情報、ウェブサイトのプライバシーページ、アプリ内ガイドにおいて、冗長な「テレメトリ」という表現を削除しました。「アナリティクスなし」という表現で既にカバーされており、アプリが収集するデータの内容に事実上の変更はありません。
- 共通: プロバイダーアカウントビューのラベルにソースを表示: プロバイダーアカウントパネルにおいて、各残高がどのキー(BYOK キーか Caiioo プロビジョニングキーか)に基づいているかを表示するようにしました。これにより、クレジットと残り残高を一目で誤認することがなくなります。
バグ修正
- 共通: ブランド移行後の Apple Sign-In: OAuth Services ID が古い
com.sixcailloux.PebbleFlow.webを指していたため、新規サインインで Apple Sign-In が失敗していました。com.sixcailloux.Caiioo.webに切り替え、iOS、macOS、およびウェブのアカウントページで「Apple でサインイン」が再び機能するようになりました。 - 共通: OAuth が必要な MCP サーバーの「サインイン」ボタン: リモートの OAuth 必須 MCP サーバー(Notion など)をインストールする際、OAuth が必要なために初期接続が失敗してもサーバー情報はストレージに書き込まれますが、クライアントは登録されません。その後の「サインイン」ボタンが更新リクエストを送信すると、OAuth ダイアログを開く代わりに「MCP server
not found」という生のエラーを返していました。クライアントが登録されていない場合、更新処理は新規の addServer呼び出しにフォールバックするようになり、OAuth/DCR の形状が表面化してサインインダイアログが正しく開くようになりました。 - 共通: ネイティブアプリからのバグ報告に正しいアプリバージョンを記録: iOS、macOS、Android の各シェルが起動時にインストール済みのアプリバージョンを WebView に注入するようになりました。これにより、送信されたバグ報告において、フィールドが空白になったり同梱のサイドパネルバージョンが表示されたりすることなく、どのビルドからの報告かが特定できるようになりました。
- Android: リブランド後の起動クラッシュ: PebbleFlow から Caiioo への名称変更を急ぐあまり、Kotlin 側の Application クラスと JNI シンボル名を変更した一方で、対応するネイティブ側のエクスポート名を変更していなかったため、起動時にシンボルを解決できずクラッシュしていました。名称変更を元に戻し、アプリが正常に起動するようになりました。
- 共通: Google Workspace の再認証ループ: 保存された OAuth 接続に
refresh_tokenが含まれていなかったため、ユーザーが約1時間ごとに Google Workspace の再認証を求められる状態になっていました。6つの関連する修正により、すべての承認時にリフレッシュトークンを確実に取得し、クラウド同期を通じて保持するようにしました。これにより、Google 接続は同意画面を経由することなく、1時間のアクセストークン TTL を超えて維持されます。 - 共通: OpenRouter の「User not found」からの復旧: プロビジョニングされたサブキーの基盤となるユーザーレコードが消失しているがキーエンティティ自体は存在する場合、OpenRouter は HTTP 401 「User not found」を返します。以前の Caiioo では、ログアウトして再ログインするまで機能しない状態になっていました。プロバイダーが新しいプロビジョニングキーをスワップインしてリクエストを一度リトライすることで、自己修復するようになりました。
- 共通: Google Docs
insert_componentの誤解を招くエラー: 以前に挿入されたテーブルの後にコンポーネントを挿入すると、挿入されたテーブルがcomponentNameにバインドされなかったため「Document not found」と表示されていました。テーブル挿入フェーズで名前付き範囲を取得するようになり、位置リゾルバーがデフォルト以外のtabIdを尊重するようになりました。また、アプリレベルのエラーが 404 として誤分類されるのを修正しました。 - 共通: 新しくリリースされた OpenRouter モデルで ZDR ルーティングが消失する問題: モデルが Caiioo のインテリジェンスデータベースにまだ登録されていない場合、合成フォールバックレコードがそのモデルを ZDR 非対応としてマークしていました(実際には ZDR 専用プロバイダーがサポートしている場合でも)。ZDR ルーティングは、通常のパスと同じプロバイダーリストのフォールバックを使用するようになりました。
- 共通: API
/v1/runsが初回呼び出し時に添付ファイルを無視する問題: API エンドポイントが新しいスレッドに対してエージェントを開始した際、空スレッドのブランチがテキストのみをプッシュしていたため、ユーザーメッセージの添付ファイルリストが失われていました。添付ファイルが正しく渡されるようになりました。 - 共通: モデル変更直後にネイティブアプリが古い設定を読み込む問題: メモリ負荷の高い Android において、モデルピッカーを切り替えてすぐにメッセージを送信すると、500ミリ秒のデバウンスフラッシュが実行される前にエージェントがディスクから以前のモデルを読み込んでしまうことがありました。送信パスにおいて、エージェントを生成する前に強制的に状態をフラッシュするようにしました。
- 共通: テスター報告バグのトリアージ (PF-260429 / PF-260430): 5つの修正を行いました。管理キー(フリーティア)ユーザーが自身のキーを入力せずに PDF OCR を通じてドキュメントを取り込めるようにしました。macOS において Node サイドカーのタイムゾーンをホストに固定し、サンドボックス下で日付が正しく解決されるようにしました。iOS/macOS/Tauri シェルにおいてスケジュールされたタスクが永続化されるようにしました(WebView ストレージのスタブが書き込みを暗黙的に破棄していました)。設定ツールにおいて、単発および手動スケジュールを主要なオプションとして表示するようにしました。ツールの呼び出し箇所において、エージェントランナーと同様に OpenRouter 401 自己修復から復旧するようにしました。
- 共通: アップグレードモーダルでのサブスクリプションとクレジット/BYOK の混同を解消: 「クレジットを追加」を選択しても実際にはサブスクリプションポータルが開いており、ラベルが不正確でした。モーダルはティアサブスクリプションのみに焦点を当てるようになりました。また、iOS では Apple の規約 §3.1.1 に基づき、クレジット購入に関するインターフェースを非表示にしました。
- Web: アカウント削除セクションをアカウントページの最下部に移動: 破壊的な操作である「アカウント削除」ブロックが、ID カードとサブスクリプション/請求 UI の間に表示されていました。これを FAQ の後のページ最下部に移動しました。iOS から削除専用ビューへのディープリンク動作に変更はありません。
- iOS: 「プランを管理」が Apple のサブスクリプションシートを開くように修正: 以前の iOS 版「プランを管理」は、無料、トライアル、Stripe、およびソース不明のユーザーに対してウェブのアカウントページを表示していましたが、そこでは WKWebView 内の Google OAuth が失敗していました。iOS で「プランを管理」をタップすると、常に Apple の StoreKit
showManageSubscriptionsシートが開くようになりました。 - iOS: アカウント削除ウェブビューを削除専用ページに集約: iOS のアカウント削除ボタンからウェブサイトを開いた際、請求関連のすべてのインターフェース(サブスクリプション、プラン、クレジット、Stripe ポータル、FAQ)を非表示にし、削除セクションのみを表示するようにしました。これにより §3.1.1 を遵守します。
- iOS: ITMS-90208 フレームワークバージョンの検証修正: onnxruntime フレームワークの Info.plist をアーカイブ時にパッチし、ホストアプリのデプロイターゲットと一致させるようにしました。これにより、App Store Connect で「framework does not support the minimum OS version specified in the Info.plist」としてビルドが拒否されることがなくなります。
- Android: 外部リンクを Custom Tab で開き Google OAuth を機能させる: 「pebbleflow.ai/account を開く」などのリンクをタップした際、以前は Android の WebView 内で開いていましたが、Google は
disallowed_useragent(Error 403) として OAuth をブロックしていました。外部リンクはネイティブブリッジを経由して、Google が信頼する Chrome Custom Tab で開くようになりました。 - Android: メッセージ下のコピーボタンが機能するように修正: コピーアイコンは
navigator.clipboard.writeTextを直接使用していましたが、Android の WebView では非同期境界を越えてユーザーアクティベーションが期限切れになると、暗黙的に動作しなくなります。コピー処理はネイティブのクリップボードブリッジを経由するように変更されました。
バージョン 0.9.719 (2026年4月25日)
セキュリティ
- 共通: protobufjs CVE-2026-41242 パッチ適用 (CVSS 9.8):
Root.fromJSONにおける重大な任意コード実行の脆弱性を修正するため、protobufjs >= 7.5.5(8.0.1 に解決)を固定しました。Caiioo はprotobufjsを直接インポートしておらず、onnxruntime-webの推移的依存関係です。また、ユーザー提供のスキーマではなくバンドルされたモデルのみを読み込むため、実用上のリスクは低いものでした。しかし、修正が容易であるためパッチを適用しました。 - 共通: @xmldom/xmldom — 4件の高深刻度 CVE パッチ適用:
@xmldom/xmldom >= 0.9.10を固定しました。XML パースは、DOCX/XLSX の変更履歴(redline)パイプラインおよび各種拡張機能のコードパスで使用されています。 - Server: undici — 3件の高深刻度 CVE パッチ適用:
cloud/relayにおいてundici >= 7.24.0を固定しました。これはリレーサーバーの HTTP クライアントのみに影響します。 - Desktop: rustls-webpki + quinn-proto — 2件の高深刻度 CVE パッチ適用: これらの Tauri Rust 依存関係を更新しました。Tauri シェルを経由する Windows および Linux のデスクトップビルドに影響します。
新機能
- 共通: 動画生成 (Pro): OpenRouter 経由で Google Veo 3.1、OpenAI Sora 2 Pro、ByteDance Seedance を使用して、短尺動画の生成やアニメーション化が可能になりました。ツールがモデルごとに有効な再生時間と解像度を選択し、ジョブが完了するまでポーリングを行い、結果をスレッドの添付ファイルとして保存します。
- 共通: 音楽生成 (Pro): OpenRouter 経由で Google の Lyria 3 Pro Preview を使用して、楽曲やインストゥルメンタルクリップを生成できます。出力はオーディオ添付ファイルとして保存され、インラインで再生可能です。
- 共通: 動的な動画モデルカタログ: 動画生成ツールは、実行時に OpenRouter の動画対応モデルの最新リストを取得します。これにより、Caiioo のアップデートなしで新しいプロバイダーやモデルが表示されます。バンドルされたスナップショットにより、オフライン時でも動作が維持されます。
- 共通: 動的な音楽モデルカタログ: 音楽生成も同様に、OpenRouter が新しい音楽モデルを公開するとツールがそれを取得します(オフラインフォールバック付き)。
- 共通: Pro プランでのカスタム OAuth: 「自分の認証情報の持ち込み(BYOK)」機能(Google Workspace ウィザード、Microsoft 365 ウィザード、および汎用の「カスタムプロバイダーの追加」フロー)が、設定 → カスタム OAuth からすべての Pro、Platform、Teams、Enterprise ユーザーに表示されるようになりました。以前は、このタブと追加ボタンはテスター専用フラグで隠されていたため、有料ユーザーは BYOA 設定にアクセスできませんでした。
- 共通: 物理学 + 構造解析 (Pro): 物理シミュレーションツール(放物運動、衝突、運動/位置エネルギー、運動量、力、力積、目標速度)および構造解析ツール(梁の荷重、柱の座屈、材料特性)が、他のクリエイティブ・ユーティリティツールと共に Pro プランで利用可能になりました。
- 共通: Seeing-Eye Dog — テキスト専用 LLM 向けビジョンフォールバック: DeepSeek V4 Pro、Kimi K2.6、MiMo V2.5 Pro、およびローカルの Ollama モデルなどのテキスト専用モデルで、設定された安価なビジョンモデル(デフォルト:Gemini 3.1 Flash Lite)を経由させることで画像添付ファイルを処理できるようになりました。自動キャプション生成はメッセージ構築時に実行され、添付ファイルごとにキャッシュされるため、以降のターンで再支払いが発生しません。専用の
vision({action: "inspect"})ツールにより、モデルはターゲットを絞った追跡アクセスが可能です。設定 → ツール → ビジョンフォールバックモデルからヘルパーを選択できます。 - 共通: XLSX セルレベルの変更履歴: スプレッドシートのアーティファクトで、DOCX と同様の変更履歴(redlining)UX がサポートされました。
propose_change(editMode: 'xlsx_cell')による AI の提案は、cellRef+sheetNameで固定されたセル単位の変更履歴を生成します。変更履歴モードでのユーザーによる入力編集はセルレベルの差分を作成し、保留中の変更があるセルはインラインで<del>旧</del><ins>新</ins>とレンダリングされます。既存のツールバーの「次へ/前へ/承認/却下」はセルの変更に対しても動作します。AI とユーザーの同時編集はセルごとにマージされ、同一セルの競合はユーザーの編集が優先されます。 - 共通: 動画および音楽生成のコスト追跡: 生成された動画(OpenRouter
/api/v1/videos経由)および音楽(chat-completions経由)のコストが、画像生成と同様にスレッドの合計に加算されるようになりました。サイドパネルのコストドロップダウンに、新しいvideo_gen_costとmusic_gen_costの内訳行が表示されます。
改善点
- 共通: GPT-5 シリーズの安定性: OpenAI の gpt-5、gpt-5.1、gpt-5.4、gpt-5.4-pro、および gpt-5.3-codex において、ツールを多用するエージェント形式の会話で応答が空になる問題が解消されました。関数ツールスキーマの相互作用により OpenAI のバックエンドがストリームを途中で終了させていたため、Caiioo はこれらのモデルが要求する形式でツールをシリアライズするように変更しました。
- 共通: GPT-5.4+ における長い会話の挙動改善: gpt-5.4、gpt-5.4-pro、および gpt-5.3-codex とのマルチターン会話において、長いツール呼び出しシーケンスで早期終了しなくなりました。OpenAI が中間的な解説と最終回答を区別するために使用するフェーズマーカーが、ターンをまたいで保持されるようになりました。
- 共通: GPT-5.x の推論プロセスを思考パネルに表示: gpt-5、gpt-5.1、gpt-5.4、gpt-5.4-pro、および gpt-5.3-codex が、Gemini と同様に推論の要約をチャット内の思考パネルにストリーミング表示するようになりました。以前は、OpenRouter が推論テキストをストリーミングしていたにもかかわらず、これらのモデルでは思考パネルが空のままでした。
- 共通: 一時的なアップストリーム障害からの透過的な回復: OpenRouter がリクエストを送信したアップストリームが、コンテンツのストリーミング開始前に一時的な 5xx エラーを返した場合、Caiioo は空の返信を表示するのではなく、別のアップストリームで静かに再試行します。
- 共通: モデルストリーム失敗時のエラーの明確化: プロバイダー側のクラッシュ、コンテンツフィルターによる拒否、その他ストリーム途中の失敗が発生した際、説明なしに会話が「停止」するのではなく、具体的なエラーメッセージが表示されるようになりました。
- 共通: 生成された動画と音楽のインライン表示: 生成された動画と音楽が、生成された画像と同様に会話内に表示されるようになりました。折りたたまれたツールセクション内ではなく、最終回答の上にビデオまたはオーディオプレーヤーが表示され、どのモデルが生成したかを示す小さなバッジが付きます。
- 共通: 動画および音楽ツールのデフォルトモデル選択: 設定 → ツールに、既存の画像生成モデル選択と同様の、動画および音楽生成用のデフォルトモデルドロップダウンが追加されました。エージェントはデフォルトで選択されたモデルを使用しますが、リクエストごとに別のモデル名を指定して上書きすることも可能です。
- 共通: Personal Intuition のインデックスステータス表示: パーソナライゼーション設定パネルに、「インデックス済み: N スレッド · M チャンク · K トークン · 最終インデックス X分前」というライブ表示が追加され、メモリインデクサーが動作していることを確認できるようになりました。また、最後のバックフィル要約が完了後も消えずに表示され続けるようになりました。
- iOS: ネイティブのデバイス上エンベディング (高速化、省メモリ): Multilingual-e5-small の推論が、WKWebView 内ではなく Apple の
onnxruntime-objcを介して iOS ホストプロセスで実行されるようになりました。これにより、モデルロードの約 7 秒後に WebView が強制終了される(ログイン後のクラッシュ)原因となっていたプロセスごとのメモリ制限問題が解決されました。ツールカタログの初回エンコード後、以降のツール選択呼び出しはテキストごとのインメモリキャッシュにヒットし、約 5 秒ではなく約 10 ミリ秒で完了します。また、共有パイプラインのリファクタリングにより、Personal Intuition とデバイス上のツール選択がそれぞれ約 115 MB のモデルコピーを個別にロードすることがなくなりました。 - 共通: Personal Intuition とデバイス上ツール選択で e5 パイプラインを共有: 以前は両機能が個別に multilingual-e5-small ローダーをインスタンス化していました(レンダラー内で各 ~115 MB、計 ~230 MB)。現在は単一の共有パイプラインに委譲され、同時ロードがデデュープ(重複排除)されることで、コールドスタートのコストが半減しました。
バグ修正
- 共通: ブラウザセッションのクッキーが API コールに漏洩しないよう修正: ブラウザタブで openrouter.ai を訪問していた場合、拡張機能が意図せず OpenRouter のブラウザセッション(Clerk / Stripe / 分析用クッキー)をすべての API コールに付加していました。API コールは厳密に Bearer 認証のみを使用するように修正されました。
- 共通: GPT-5.4 の応答が二重に表示される問題を修正: gpt-5.4、gpt-5.4-pro、および gpt-5.3-codex の応答で、同じテキストが連続して表示されるバグを修正しました。すでにレンダリングされたトークンストリームと共に、最終回答のペイロードが蓄積されていました。
- 共通: リロード後にモデル選択リストが更新されるよう修正: バージョンアップ時にモデルリストが無効化され、短いインメモリ TTL が適用されるようになりました。これにより、新しくリリースされた OpenRouter モデルが古いキャッシュに隠されることなく、リロード後に表示されます。存続期間の長いサービスワーカーが古いカタログを保持し続けることはなくなりました。
- 共通: 生成メディアの短縮リンクでプレーヤーが開くよう修正: オーディオ/画像/動画の生成後にモデルが
[Listen](audio-…)のような短縮リンクを書き込んだ際、クリックすると壊れた外部 URL として失敗するのではなく、スレートプレーヤーが開くようになりました。 - 共通: Markdown の画像埋め込みとして記述された生成メディアの修正: モデルが動画やオーディオの添付ファイルを
[Video 1](video-…)ではなくと記述した場合、プレーヤーが開かずに壊れた<img>としてレンダリングされていました。先頭の!が削除され、リンクからスレートビューアーが開くようになりました。 - Extension: サイドパネルの「位置情報の権限が拒否されました」という行き止まりの修正: ユーザーが何をクリックしたかに関わらず、サイドパネルの位置情報リクエストがすべて「位置情報の権限が拒否されました。ブラウザの設定で位置情報へのアクセスを許可してください」を返すデグレードを修正しました。オフスクリーンドキュメントを経由しようとした際、オフスクリーンコンテキストは権限プロンプトを表示できず、マニフェストで
geolocationが宣言されていないため、即座にPERMISSION_DENIEDが発生していました。サイドパネルは、以前動作していた「コンテンツスクリプト、次に IP 位置情報」という元のチェーンを使用するように戻されました。 - 共通: Personal Intuition のフルリビルド後に古いインデックス数が残る問題を修正: フルリビルドのバックフィルでスレッドごとのインデックス更新がスキップされていたため、設定 → パーソナライゼーションにリビルド前の過大な合計が表示されていました。また、フルリビルドでスキャンされたが以前はインデックスされていなかったスレッドが、検索から見えなくなる問題も修正されました。
- iOS: ログイン後の WKWebView クラッシュループの修正: ログイン後のクラッシュに対して 3 つの修正を統合しました。(1) ネイティブ e5 エンベディングが 8 個ずつのバッチで実行され、実行の合間に ORT メモリ領域を縮小するように設定されました。これにより、ピーク時のワーキングセットが約 3 GB に急増して iOS のプロセスごとのメモリ制限に抵触することなく、約 100 MB 未満に維持されます。(2) デバイス上のリトリーバーが起動時ではなく
requestIdleCallback中にウォームアップされるようになり、ライセンス同期、ID 復元、UI レンダリング、クラウド同期の初期化と競合しなくなりました。(3) デバイス上のリトリーバーが ID やティア(階層)の変更時に再プロビジョニングされるようになり、初回登録時にティアが未定義だったために新規インストールで静かにクラウドヘルパーにフォールバックする問題が解消されました。 - iOS: 誤った「パス・トラバーサル・ブロック」による 403 エラーの修正:
NSString.standardizingPathがディスク上に存在するファイルに対してのみ/var→/private/varを解決するため、LocalFileSchemeHandlerがすべての 404 をパス・トラバーサル試行と誤認していた問題を修正しました。存在しないリソースへの正当なパス(iOS バンドルから除外された*.wasmや、chrome-extension API パスapi/active-tab-contextなど)が 404 ではなく 403 を返し、transformers.js の wasm プリフェッチフォールバックを妨げていました。Android ハンドラーに合わせた文字列ベースの../ NUL チェックに置き換えられました。 - 共通: PDF 内の埋め込み画像がテキスト専用モデルを停止させる問題を修正: 埋め込み画像を含む PDF をテキスト専用の OpenRouter モデル(DeepSeek V4 Pro、Kimi K2.6 など)に送信すると、「画像入力をサポートするエンドポイントが見つかりません」というエラーが発生していました。これは新しい Seeing-Eye Dog ルーティングで解消されるはずの警告でした。PDF 配信パスが、画像ブロック配信ですでに適用されていたモデルごとの
supportsVisionフラグを尊重するようになり、テキスト専用モデルはテキストのみの PDF を受信し、必要に応じてエージェントがビジョンサブエージェントを起動できるようになりました。 - 共通: 広告ブロックレベルの切り替えが反映されない問題を修正: 広告ブロックレベル(オフ / 標準 / 強力)を切り替えても、サービスワーカーが再起動するまで保存された値が変更されるだけで、実行中の DNR ルールや静的ルールセットが有効なままでした。そのため、オフに切り替えた後も ads.google.com などのサイトがブロックされ続けていました。ストレージリスナーが、実際に設定が書き込まれる
globalSharedSettingsバケットを監視するように修正され、レガシーなadBlockerEnabledフラグも同じバケットを経由するようになりました。 - Extension: サイズ超過の画像が静かに破棄される問題を修正: 画像添付ファイルが API の制限を超えた際、拡張機能のサービスワーカーに圧縮の実装が登録されていなかった(サーバー側の sharp ベースのもののみだった)ため、
pushImageBlock内の防御策が例外をキャッチして画像を完全に破棄していました。サービスワーカーがcreateImageBitmapを介して元の寸法を調査し、既存のオフスクリーンドキュメント経由でエンコードを行うようになったため、拡張機能コンテキストの呼び出し元は破棄されたプレースホルダーではなく、圧縮された画像を受け取れるようになりました。 - 共通: 生成された画像やスクリーンショットがプロバイダーに拒否される問題を修正: Anthropic は base64 画像を 5 MB に制限しており、他のプロバイダーも同様の制限があります。FLUX / Gemini / Seedream からの生成画像や大きなスクリーンショットがフルサイズで渡され、エージェントのターン全体を中断させる 4xx エラーが発生していました。3 層の防御策を導入しました:画像生成ツールが保存前に出力を圧縮する、新しい
pushImageBlockヘルパーがすべてのimage_url出力を「圧縮または破棄」フローに通す、そしてスクリーンショットの再構築とライブスクリーンショットの挿入も同じヘルパーを経由するようにしました。すべてのプロバイダーで動作する保守的な 4 MB の制限を適用しました。
Version 0.9.718 (2026年4月22日)
新機能
- Common: Personal Intuition — 連想型クロススレッドメモリ: Caiiooは、現在の会話だけでなく、すべての会話を通じて以前に話した内容を静かに記憶します。チャット中に、関連する記憶が呼び起こされます。エージェントはその記憶を直接使用することもあれば、回答のニュアンスに反映させることもあります。それは、香りが場所を思い出させるような感覚です。この機能は「Personalization → Personal Intuition」から設定でき、デフォルトはオフです。既存のスレッドをインデックス化するための「Full-rebuild」および「Incremental backfill」が含まれており、プライベートな会話がクロススレッドストアに含まれることはありません。
- Common: Personal Intuitionのバックアップと復元: 「Backup & Restore → Personal Intuition」から、メモリコーパス全体のスナップショットをJSONファイルに保存し、問題が発生した場合や別のデバイスに移動する場合に後で復元できます。プライベートな会話は含まれません。
- Common: すべてのティアでInstant Tool Chooserをデフォルト化: セマンティックツールチューザーが、無料版を含むすべてのティアのすべてのデバイスでローカルに実行されるようになりました。各ターンに最適なツールを約10ミリ秒で、完全にデバイス上で選択します。Settings → ToolsのピッカーUIでは、「Instant Tool Chooser」と「Quick Tasks LLM」(モデルピッカーで稲妻アイコンを付けたモデルを使用)の選択が明確化されました。
- iOS / Android: ネイティブアプリでのInstant Tool Chooser: ブラウザ拡張機能やデスクトップ版だけでなく、iOSおよびAndroidアプリのWebView内でも、同じデバイス上ツールチューザーがプロビジョニングされるようになりました。
改善点
- Common: SlateサンドボックスでのHTTPSスクリプトCDNの許可: HTML slateアーティファクトで、Chart.jsやD3などの一般的なライブラリを信頼できるHTTPS CDN(jsdelivr、unpkgなど)からロードできるようになりました。データ取得は引き続き同一オリジン(same-origin)に制限されているため、添付ファイルデータをslateにパイプするには
bind_dataを使用してください。 - Common: Personal Intuitionの進捗表示の明確化: バックフィル実行中、設定パネルにスレッドごとの進捗状況(例:「47/75 threads · 2,134 chunks」)が表示されるようになり、完了まで無反応になることがなくなりました。
- Common: メモリインデックス作成後のツール選択の高速化: 大規模なメモリコーパスのインデックス作成時に、デバイス上のリトリーバーにあるツールカタログキャッシュが破棄されなくなりました。これにより、次のツール呼び出し時に再エンコードのコストが発生せず、ウォーム状態が維持されます。
バグ修正
- Common: 並列実行中のサブエージェントで誤ったティアアップグレードエラーが発生する問題: 2つのサブエージェントが並列で実行されている際、互いのアクティブスレッドコンテキストを上書きしてしまい、Pro限定のアクション(update_slateなど)が誤ったサブエージェントに対して拒否される競合状態を修正しました。ティアの適用は、ディスパッチ呼び出しの特定のスレッドにスコープされるようになりました。
- Common: SlateのCSVデータバインディングで
forEachが機能しない問題: CSVバインドされたデータが、反復不能なオブジェクトとしてサンドボックスに到達する問題を修正しました。サンドボックス内のJavaScriptでdata.forEach(...)が期待通りに動作するようになりました。
バージョン 0.9.717 (2026年4月17日)
新機能
- Common: 全アプリ共通の Pro ティア: Pro は月額9ドルの単一サブスクリプションとなり、個別のアプリ枠ではなく、Chrome、デスクトップ、モバイルのすべての Caiioo アプリが利用可能になりました。Platform(月額14ドル)は「Pro + インフラストラクチャ」(ローカルサーバー、API アクセスプレビュー、Messaging)として再定義されました。
- Common: Pro Mobile ティア: モバイル専用の Pro プランが月額2.99ドルで利用可能になり、App Store および Play Store で直接販売されます。アプリ内課金そのものが権利付与となるため、個別のライセンスは不要です。
- Common: ヒューマン・イン・ザ・ループのための Ask-User ツール: エージェントが実行途中で一時停止し、4つの選択肢(承認、メモ付きで承認、拒否、メモ付きで拒否)を持つダイアログを表示できるようになりました。入力したメモはプレーンな英語のガイダンスとしてモデルにフィードバックされ、提案されたプランを上書きします。新しいサイクルは発生せず、エージェントはその場で処理を続行します。
- Common: アプリ内ガイド検索: Document メニューからユーザーガイドを直接検索できるようになりました。検索結果は caiioo.ai/guide へディープリンクされ、既存のリダイレクトフローが維持されます。
- iOS: 月払い/年払いのペイウォール切り替え: iOS の購読シートで、購入前に月払いと年払いの請求サイクルを切り替えられるようになりました。
- Desktop: Windows および Linux での自動アップデート: Tauri デスクトップアプリにアップデーターが搭載されました。これにより、Windows および Linux ビルドにおいて、手動の再インストールを必要とせず、その場でアップデートを受信できるようになります。
- Web: ガイドとブログを横断するタブ付き検索: マーケティングサイトのガイドおよびブログのレイアウトに、タブでスコープを切り替えられる検索バーを追加しました。タイトルの一致が本文の一致より上位にランク付けされ、アクティブなタブは結果がある方へ自動的に切り替わります。
- Web: Linux 専用インストールページ: インストールページで Linux ユーザーを
/install/linuxへルーティングし、AppImage、.deb、.rpmの選択肢とディストリビューションごとのコマンドを表示するようにしました。 - Web: 安定したダウンロードルート:
/download/macos、/download/linux、/download/windowsが、エッジワーカーに支えられた安定した URL になりました。リリースごとにウェブサイトを再構築することなく、常に最新のリリースを解決します。
改善点
- Common: アプリ内サポートチケット: サポートリクエストの主要な経路をアプリ内のチケットフローに変更しました。問題が発生した際には、適切な場所を案内するより明確なクレジットエラーメッセージが表示されます。
- Common: よりスマートな Google OAuth 再認証: Google ツールにおいて、実際に Google から付与されたスコープを検証するようになりました。403 エラーでスコープ不足が示された場合、サイレントに失敗するのではなく、ジャストインタイムで再認証プロンプトを表示します。
- Common: Google 書き込みアクション用のフル Drive スコープ: Google Drive に対する書き込みアクションでフル Drive スコープを要求するようになりました。これにより、自分が作成していないドキュメントの編集時に権限エラーが発生しなくなります。
- Common: 画像生成モデルの説明文: 画像生成ツールにおいて、利用可能な各モデルの説明が表示されるようになり、タスクに適したモデルを選びやすくなりました。
- Common: Slate Artifact メッセージの正確化: ツールが Slate Artifact を作成または更新した際、モデルが「エディタに表示されています」と主張しなくなりました。文言は実際の動作を反映したものに修正されました。
- Common: タブからの動的なツール選択の改善: タブコンテキストのヒントがツール ID を出力するようになりました。これにより、動的ツールセレクターが、利用可能なツールに応じたコンテキストベースの選択ルールを適用できるようになります。
- Common: スレッドに紐付いた音声コスト: ストリーミング TTS (ElevenLabs, Resemble) および STT (ElevenLabs Scribe) の使用料が、既存のワンショット合成パスと同様に、その会話の音声コストとして集計されるようになりました。
- Extension: ローカルエージェントを強調するログインサブタイトル: ログイン画面のコピーを微調整しました。
バグ修正
- Desktop: Linux のファイルピッカーを復旧: Tauri デスクトップアプリの Linux 版でファイルピッカーが機能しなかった問題を修正しました。
- Desktop: バージョン報告の誤り: Tauri デスクトップアプリの UI およびテレメトリで、誤ったバージョン文字列が報告されていた問題を修正しました。
- Desktop: Linux オーディオのノイズ抑制とエラーの明確化: Linux での PipeWire ログのノイズを抑制し、OpenRouter のエラーを隠さずに表示するようにしました。また、API トグルの読み取りパスを復旧し、誤ったパリティバナーを修正しました。
- Common: Gmail 本文抽出時のリンク消失: Gmail 抽出の優先順位を反転させ、まずリンクを保持する markdown を試行し、markdown 出力が空の場合のみプレーンテキストにフォールバックするようにしました。一般的なケースでメール内のリンクが失われることはなくなります。
- Common: Public API 設定が保存されない問題: 一部の環境で Public API のトグルとアクセスキーの保存に失敗していた問題を修正しました。また、これらの設定がクラウドに同期されず、厳密にローカルに保持されることを保証しました。
- Common: アーカイブと名前変更のラグ: 削除、アーカイブ、アーカイブ解除、名前変更において UI を楽観的に更新するようにしました。サーバーのレスポンスを待つことなく、リストに変更が即座に反映されます。
- Common: アーカイブ削除が同期されない問題: アーカイブの削除がプロトコルパスをバイパスしてストレージに直接適用されていた問題を修正しました。他のスレッドアクションと同様に、クライアント間で伝播するようになりました。
- Common: Agenda での誤った「スコープ不足」表示: Google Calendar のスコープを付与した直後に、リマインダー/Agenda ウィジェットが古いツールコンテキストプロファイルを読み取っていた問題を修正しました。これにより、ツールは正常に動作しているのにスコープ不足のフラグが立つ現象が解消されました。UI は最新のプロファイルを読み取るようになり、更新時には、接続されている Google アカウントのうち追加スコープが必要なものに対して、順次同意フローが自動実行されます。
- Common: Google ツールコールが "Unknown name exclusiveMinimum" で拒否される問題: パラメータスキーマに数値の
exclusiveMinimum/exclusiveMaximum境界を使用しているツールコールを Gemini が拒否していた問題を修正しました。これらは Google の制限された OpenAPI サブセットに送信される前に削除されます。 - Common: DCR のないリモート MCP サーバーの接続失敗: Dynamic Client Registration をサポートしていないリモート MCP サーバー(Slack など)の追加に関する問題を修正しました。クライアントは RFC 9728 の保護リソースメタデータを尊重し、
authorization_serversがリソースホストと異なる場合は AS ホストに従い、存在しない/registerエンドポイントの捏造を停止します。 - Server: Tester ティアのユーザーが制限付きエンドポイントで拒否される問題: 組織、ハブ、管理、プロビジョニング済みキーのエンドポイントにおいて、ライセンスによる有効なティアが認証トークン内の古いティアより高い場合にユーザーが拒否されていた問題を修正しました。制限付きエンドポイントは、
/api/auth/meと一貫した方法で有効なティアを評価するようになりました。 - Extension: ID 同期のピンポンループ: 拡張機能とリレーサーバー間での ID 競合により
IDENTITY_SYNCが無限ループする問題を修正しました。拡張機能は、同じ競合するリモートに対して一度だけ確認応答(ack)を行い、解決には片側でサインアウトする必要がある旨を警告し、切断・一致・リモート採用時にリセットされます。 - Common: Gemini Flash TTS が選択・設定できない問題: Gemini Flash TTS (音声) がエンドツーエンドで使用できなかった問題を修正しました。設定を閉じると選択が元に戻ったり、API キーフィールドに入力できなかったりする現象が解消されました。このプロバイダーは第一級の TTS オプションとなり、選択の保持、API キーと音声選択の正常な保存が可能になりました。また、SSE ストリーミングエンドポイントを使用することで、発話全体の生成が終わる前にオーディオ再生を開始できるようになりました。
- iOS: 新規スレッド UI が切り替わらない問題: iOS アプリで、新しく作成されたスレッドにアクティブなビューが切り替わらない問題、およびコンポーザーをクラッシュさせる可能性があった
modelNameの ReferenceError を修正しました。 - iOS: オプションのストレージフックによる起動時のクラッシュ: 起動時に
storage.primeSettingsCacheが利用できない場合に iOS でクラッシュしていた問題を修正し、呼び出しをガードしました。 - Common: 価格体系刷新後のティア監査の不一致: ティア監査によって判明した価格と機能の 6 つの不一致を修正しました。これにより、権利ゲート、アップグレードプロンプト、機能フラグが拡張機能、ウェブサイト、モバイルアプリ間で一致するようになりました。
iOS App Store コンプライアンス
- iOS: オンボーディングでの外部サインアップ CTA の非表示: オンボーディングにおいて、アカウント作成や有料アップグレードのためにユーザーをデバイス外へ誘導するコール・トゥ・アクション(CTA)を表示しないようにしました。
- iOS: クレジット購入 UI の非表示: Apple の規約 §3.1.1 に基づき、iOS 上ではクレジット購入画面を非表示にしました。サブスクリプションは StoreKit を通じて行われます。
- iOS: サポートおよびクレジットエラーの文言更新: 外部での購入に関する Apple のガイドラインに準拠するため、iOS 上の /support ページおよびクレジットエラーメッセージの文言を更新しました。
バージョン 0.9.716 (2026年4月12日)
新機能
- Common: Gemini 3.1 Flash TTS: Google の Gemini 3.1 Flash TTS を活用した新しい音声出力オプション。30種類のプリセット音声、70以上の言語に対応し、
[whispers](ささやき)や[sighs](ため息)といったインライン・オーディオタグによる表現力豊かな合成が可能です。自身の Gemini API キーを使用でき、aistudio.google.com で無料で取得可能です。音声には SynthID のウォーターマークが付与されます。 - Common: 会話合計における音声コスト: テキスト読み上げ(TTS)および音声文字起こし(STT)の API 使用料(Gemini、ElevenLabs、Resemble)が、チャット、画像生成、ヘルパー、OCR のコストと共にスレッドごとのコストサマリーに合算されるようになりました。表示される数値が実際の総コストとなります。
- Common: SQL データベースツール: SQLite データベースを会話に添付し、SQL でクエリを実行できるようになりました。結果は Slate アーティファクト内でライブダッシュボードとしてレンダリング可能です。
- Common: カレンダーの招待と Google Meet: カレンダーイベントの作成時に、出席者へ招待メールを送信し、Google Meet のビデオリンクを自動的に追加できるようになりました。
- Common: ツールごとのプロバイダー・ルーティング: 設定により、個別のツール(画像生成、検索、PDF OCR など)を特定のプロバイダーにルーティングできるようになりました。すべてのツールをデフォルトモデルで実行する必要はありません。
- Common: 会話の共有: 会話を Markdown またはプレーンテキストとして共有できるようになりました。
- Common: 14日間のプラットフォーム試用: 拡張機能の UI またはウェブサイトのアカウントページから、14日間の Platform ティアのトライアルを開始できます。Pro サブスクライバーも対象です。
- Common: モデルピッカーの ZDR クイックフィルター: モデル選択ドロップダウンに、ゼロデータ保持(ZDR)モデルを素早くフィルタリングするための新しいボタンを追加しました。
- Common: 設定の簡素化: 設定画面がデフォルトで合理化された「シンプル」ビューで開くようになり、必須項目のみが表示されます。いつでも「アドバンス」モードに切り替えて全項目を確認できます。
- Common: 無料の Google Gemini アクセス: 自身の Google AI Studio キーを持ち込むことで、Gemini 2.5 Flash を無料で使用できます。Google の無料枠がすべてのユーザーに開放され、有料プランは不要になりました。
- Common: Baseten セルフホストモデル: 自身の Baseten デプロイメントを接続し、セルフホストモデルを Caiioo 内で直接使用できるようになりました。
- iOS: WhisperKit デバイス内音声文字起こし: ディクテーションが WhisperKit を介して完全にデバイス上で実行されるようになりました。音声データがデバイス外に送信されることはありません。
- Android: デバイス内 Whisper STT: マイク権限のフローを伴い、Android 上で whisper.cpp による音声文字起こしが完全にデバイス内で実行されます。
- Android: GPU 加速 Moonshine STT: GPU 対応の Android デバイスでは、Moonshine を使用して1秒未満の推論でディクテーションを実行できます。現在は英語のみ対応しており、多言語の場合は whisper.cpp がフォールバックとして機能します。
- Web: アカウントおよびハブページでの Sign in with Apple: ウェブサイトのアカウントページおよびハブページで Apple でサインインが利用可能になりました。
改善点
- Common: PDF エクスポートの向上: Slate からの PDF エクスポートが、プリントダイアログを開くのではなく、真の PDF ファイルを生成するようになりました。これにより、常にクリーンなドキュメントが得られます。
- Common: Google Slides の全文取得: ページを指定せずにスライドのテキストをリクエストした場合、プレゼンテーション内のすべてのスライドからテキストを返すようになりました。
- Common: よりスマートなウェブ検索: 最近の Google のレイアウト変更に対応し、タイトル、スニペット、リンクをより確実に取得できるよう、Google 検索結果の抽出構造を改善しました。
- Common: 全プラットフォームでの Kokoro テキスト読み上げ: Kokoro 音声オプションが iOS、macOS、Android でも表示されるようになりました(以前はネイティブアプリでは非表示でした)。
- Common: クレジット残高表示の明確化: プリペイドおよび BYOK(自身のキー使用)設定のアカウント残高において、紛らわしい「制限(Limit)」という表現を廃止し、実際の残高を表示するようにしました。
- Common: 高精度な PDF から Word への変換: PDF→DOCX エクスポートに Slate の専用ドキュメントビューを使用するようになり、元の PDF のレイアウトと構造をより忠実に再現した Word ファイルを生成します。
- Web: アカウントおよび認証ページのクリーン化: サインインフローをよりスムーズにするため、アカウントページと認証ページでは Google Analytics とクッキー同意バナーを抑制しました。
バグ修正
- Common: 設定検索がナビゲートしない問題の修正: 設定の検索ドロップダウンおよびディープリンクが、いくつかのセクション(API Access、Private Sync、Backup & Restore、Voice など)へジャンプできない問題を修正しました。対象のカテゴリーが折りたたまれたままになり、スクロールされない状態でした。
- Common: サブエージェントにおける OAuth プロンプトの修正: サブエージェントからトリガーされた際に OAuth 認証やティアアップグレードのプロンプトが暗黙的に破棄され、実行途中で接続フローが切断される問題を修正しました。
- Common: オンボーディング後の Ollama モデル保存の修正: オンボーディング中に選択した Ollama モデルが、その後に保持されない問題を修正しました。
- Common: レート制限中に UI チャンクの読み込みに失敗する問題の修正: 静的な UI アセットが API リクエストと共にレート制限の対象となり、リフレッシュするまで画面が空白になったりパネルが表示されなかったりする問題を修正しました。
- Common: Composer で前処理された添付ファイルのメタデータ消失の修正: モデルに送信される前に Composer 内で前処理されたドキュメントの添付ファイルメタデータが、サーバー側で破棄される問題を修正しました。
- Common: 空き時間の計算で出席イベントが「予定あり」となる問題の修正: アジェンダの空き時間計算において、単に出席しただけのイベントが「予定あり」としてマークされる問題を修正しました。自身のカレンダーにあるイベントのみがカウントされるようになります。
- Common: Google 検索結果の破損の修正: Google が検索ページのレイアウトを変更したことにより、ウェブ検索が空の結果を返す問題を修正しました。
- Desktop: Windows/Linux のログインが他プラットフォームと同期しない問題の修正: Tauri デスクトップ版のログインフローが Chrome/macOS/iOS と乖離していた問題を修正しました。これには、誤ったティア検出や、サインアウト後に再ログインできない問題が含まれます。
- Desktop: Public API がデスクトップ UI をブロックする問題の修正: Public API 設定が有効な場合に、デスクトップアプリ自体の UI が API 認証によってブロックされる問題を修正しました。
- Common: Google Docs の OAuth エラーが隠蔽される問題の修正: 認証が切れた際に Google Docs の操作が明確なエラーを表示せずに失敗する問題を修正しました。
- Common: 設定パネルのクラッシュの修正: プロビジョニングされた API キーを復元する際に設定パネルがクラッシュする問題を修正しました。
- Common: Google Drive 同期によるドキュメントの重複の修正: 同期を実行するたびに Google Docs が上書き更新されず、重複して作成される問題を修正しました。
- Common: Google Drive 同期時のインラインコード消失の修正: Google Docs へのドキュメント同期時に、インラインコードのフォーマットが失われる問題を修正しました。
- Common: Gemini の Thinking 抽出の修正: Gemini モデルのレスポンスから思考/推論(thinking/reasoning)コンテンツが正しく取得されない問題を修正しました。
- Common: プロフィール切り替え時の古いデータの修正: プロフィールを切り替えた際に、手動でリフレッシュするまで前のプロフィールの会話が表示されることがある問題を修正しました。
- Common: タスクスケジューラの "Method Not Found" エラーの修正: 特定の設定において、スケジュールされたタスクが60秒ごとにエラーをスローする問題を修正しました。
- Common: Google Docs へのテキスト挿入時の改行の修正: テキスト挿入時に実際の改行ではなく、リテラルの
が表示される問題を修正しました。 - Common: ツールにおける Google アカウントヒントの修正: Google ツールが API コール時に誤った Google アカウントを使用することがある問題を修正しました。
- Common: 設定およびスレッドのインポート/エクスポートの修正: 設定およびスレッドのエクスポートデータが正しく再インポートできない問題を修正しました。
- Common: サブエージェントのトークン使用量: サブエージェントのトークン使用量が親の会話にカウントされない問題を修正しました。
- Common: リトライ中のメッセージングブリッジの返信: アシスタントがレスポンスをリトライしている間にメッセージングブリッジの返信が失敗する問題を修正しました。
- Common: Slate のレッドライン位置の修正: Markdown が存在する場合に、レッドライン(削除線)の位置が誤った場所に配置される問題を修正しました。
- Common: スリープ/復帰後のブラウザ接続の維持: コンピュータがスリープしたり長時間アイドル状態になった後に「ブラウザが接続されていません」というエラーが出る問題を修正しました。
- Common: Service Worker スリープ後のスケジュールタスクの維持: 長時間のアイドル期間の後に定期的なタスクが停止する問題を修正しました。
- macOS: Safari での Google 検索の失敗: macOS の Safari 拡張機能で Google 検索が機能しない問題を修正しました。
- iOS: モバイルアプリへのアクセス: iOS アプリが誤って有料プランを要求する問題を修正しました。モバイルアプリはすべてのユーザーが利用可能です。
Version 0.9.715 (2026年4月3日)
新機能
- Common: Hub配信システム: ファーストパーティのツール定義、モード設定、および MCP カタログが、バンドル内へのハードコードではなくクラウドハブから配信されるようになりました。コミュニティ公開に向けた準備として、ローカルキャッシュとオフラインフォールバック機能を備えています。
- Common: ブラウザツール用シングルタブモード: モードごとの新しいブラウザタブポリシーにより、会話内のすべてのナビゲーションで単一のタブを再利用できるようになりました。WhatsAppのようなメッセージのやり取りが多いワークフローにおいて、タブが蓄積するのを防ぎます。
- Common: API統合バイナリアップロード: api_integration ツールが、リクエストボディを常にJSON文字列化するのではなく、バイナリファイルのアップロードおよび署名付きURL(presigned URLs)を介した直接的なローカルファイルのアップロードをサポートしました。
- Common: ツールによる認証情報管理: 以前は設定UIからのみ可能だった API 認証情報の保存、一覧表示、削除が、api_integration ツールを通じてプログラムから実行可能になりました。
- macOS: オーディオ入力デバイスの選択: 音声入力に使用するマイクを選択できるようになりました。利用可能なすべてのオーディオデバイスをリスト表示し、選択内容を保持します。
- Android: 低メモリ時の OAuth リカバリ: Android の OAuth フローにおいて、システムがメモリ確保のためにアプリを終了させた場合でも、アクティビティの再生成に対応し、認証セッションをシームレスに復元できるようになりました。
- Common: 3層モバイルCSSアーキテクチャ: プラットフォーム、レイアウト、コンポーネントの各レイヤーで構成される新しいモバイルレスポンシブCSSシステムを導入し、スマートフォン、タブレット、デスクトップの各ビューポートで一貫したUIを実現しました。
改善点
- Extension: タブによるインクリメンタル OAuth: インクリメンタルなスコープ要求がポップアップではなくフルブラウザタブで開くようになり、対話的な同意が必要なアカウントでハングアップする問題が修正されました。
- Common: MCP ツールスキーマの品質: すべての MCP ツールが、完全なスキーマ、適切な説明、および一貫したパラメータ定義を検証する品質リントテストに合格するようになりました。
- Extension: 停止時のブラウザタブ自動クローズ: 実行が停止された際にアシスタントが開いたブラウザタブを閉じるようになり、macOS では OAuth 用の Safari ウィンドウも閉じるようになりました。
- Android: ツールチェーンのアップグレード: Android ビルドを AGP 9.1、Kotlin 2.2.10、Gradle 9.3.1 にアップグレードしました。
バグ修正
- Common: Google Docs のテーブル位置指定: Google Docs において、ターゲットテキストの前にテーブルが存在する場合に、変更が誤った位置に適用される問題を修正しました。
- Common: ページコンテンツのフッター削除: ページコンテンツの抽出時に、キャプチャされたページからフッター要素が誤って削除される問題を修正しました。
- Common: ウェブブラウジングのページネーション: 明示的な maxLength が指定されていない場合に、2ページ目以降のページネーションが機能しなくなる問題を修正しました。
- Common: コンテンツスクリプトのフォールバック: コンテンツスクリプトが利用できない場合に executeScript にフォールバックすることで、ページコンテンツの抽出がサイレントに失敗する問題を修正しました。
- Common: URL取り込みドキュメントの PDF レンダリング: URL 経由で取り込まれたドキュメントにおいて、PDF のネイティブレンダリングが失敗する問題を修正しました。
- Common: Gemini ツールコール解析: Gemini モデルにおいて、LLM ツールコールの引数内のダブルクォートで囲まれたキーが原因で解析に失敗する問題を修正しました。
- Common: Amazon Nova 互換性: テキストフィールドが空であるために Amazon Nova によって tool_call メッセージが拒否される問題を修正しました。
- Common: エージェントの実行が終了しない問題: サービスワーカーのコンテキストにおいて、エージェントの実行が endRun を確実に呼び出さず、ブラウザのタブや状態がクリーンアップされない問題を修正しました。
- macOS: 音声オーディオの再開: macOS アプリのスリープやドックへの最小化の後に、音声オーディオが再開されない問題を修正しました。
- macOS: スクリーンショットが表示されない問題: コンテキスト検出の誤りにより、macOS のスクリーンショットがアシスタントのUIに表示されない問題を修正しました。
- macOS: 位置情報が機能しない問題: CoreLocation ブリッジの追加と IP フォールバックの修正により、Safari およびネイティブ macOS アプリで位置情報が機能しない問題を修正しました。
- macOS: 位置情報のエンタイトルメント不足: 不足していた位置情報のエンタイトルメントを追加し、ネイティブ位置情報のタイムアウト時間を延長しました。
- iOS: ファイルピッカーの不具合: runOpenPanel デリゲートを追加することで、iOS の WKWebView でファイルピッカーが開かない問題を修正しました。
- Extension: OAuth スコープの過剰付与: 意図しないスコープの肥大化を防ぐため、ウェブポップアップおよびログイン後の OAuth パスから include_granted_scopes を削除しました。
- Extension: OAuth 同意画面のスキップ: インクリメンタルなスコープ要求時に、OAuth スコープの昇格が同意画面をスキップしてしまう問題を修正しました。
- Desktop: Windows でコンソールウィンドウが表示される問題: Windows で Tauri サイドカーを起動する際にコンソールウィンドウが表示される問題を修正しました。
- Desktop: Windows ビルドの不具合: Windows の Tauri ビルドにおいて、node バイナリのパス解決を修正し、node_modules をフラット化しました。
- Server: ウェブフックの重複処理: 複数のクライアントが接続されている場合に、ウェブフックが複数回処理される問題を修正しました。
- Server: クレジット購入時のプロモーションコード: Stripe チェックアウトでのクレジット購入において、プロモーションコードを無効化しました。
Version 0.9.714 (2026年3月29日)
新機能
- Common: オンボーディングの刷新: 新しいオンボーディング画面に6つの明確なAIアクセスパスが表示されるようになり、新規ユーザーがAIプロバイダーへの接続オプションをより簡単に理解できるようになりました。
- Common: MarkdownからPDF作成: ゼロから作成した新しいドキュメントをPDFとしてエポスポートできるようになりました。Markdownコンテンツを書式設定されたPDF出力に変換します。
- Common: 統合されたGoogle OAuth: Googleアカウントの接続に、すべてのスコープを持つ単一の検証済みOAuthアプリを使用するようになりました。従来のマルチアプリ設定を置き換え、プロンプトの少ないシンプルな接続フローを実現しました。
- Common: Slateへの保存メタパラメータ: ツールが
_save_to_slateパラメータを介して直接slateドキュメントに出力できるようになりました。コピー&ペーストすることなく構造化された結果をキャプチャできます。 - Common: Slateアンカーリンク: slateへの参照を含むチャットメッセージに、ドキュメント内の関連セクションまでスクロールするクリック可能なアンカーリンクが含まれるようになりました。
- Common: Sandboxデータブリッジ: HTMLアーティファクトのサンドボックスが、postMessageブリッジを介してslateデータに動的にアクセスできるようになりました。これにより、ライブダッシュボードやインタラクティブな視覚化が可能になります。
- Common: ティアバッジ: 設定、ツール、オートメーション機能に、どのアクセスレベルが必要かを示すティアバッジが表示されるようになりました。拡張アクセスユーザーが制限範囲を視認できるようになります。
- macOS: ネイティブ音声文字起こし (WhisperKit): WhisperKitとCoreMLによるデバイス上での音声認識を搭載。ブラウザベースのSTTを、より高速でプライベートなネイティブ実装に置き換えました。
- macOS: Sparkle自動アップデート: Sparkleを介したmacOSアプリおよびSafari拡張機能の製品レベルの自動アップデートを実装。appcastフィードとデルタアップデートに対応しました。
- macOS: ネイティブタブコンテキスト: AppleScriptベースのタブコンテキスト抽出により、macOSアプリが最前面のブラウザタブを認識できるようになりました。
- macOS: 音声ホットキーのストリーミング: 音声ホットキーでの録音中に、WhisperKitモデルの自動読み込みを伴うリアルタイムのストリーミングオーバーレイが表示されるようになりました。
- Safari: ネイティブメッセージング: Safari拡張機能がHTTPポーリングではなく、ネイティブメッセージングを介してmacOSアプリと通信するようになり、レスポンスと信頼性が向上しました。
- iOS/Android: ネイティブ保存ダイアログ: JSONエクスポートにおいて、不具合のあったblobダウンロードに代わり、ネイティブの保存ダイアログ(macOSではNSSavePanel、AndroidではSAF)を使用するようになりました。
- Web: Teamsランディングページ: 見込み客向けにチームおよびエンタープライズ向けのメッセージを掲載した新しい /teams ページを公開しました。
- Web: ブログセクション: Caiiooウェブサイトに新しいブログセクションを追加しました。
- Web: フリートライアルのアクティベーション: アカウントページで、オンボーディングフローと連携したフリートライアルのアクティベーションをサポートしました。
- Common: 共有ドライブのサポート: Google PickerおよびすべてのDrive API呼び出しが共有ドライブをサポートし、チームで共有されているドキュメントへのアクセスが可能になりました。
改善点
- Common: 適応型グリーティング: 適応型グリーティングがカスタムウェルカムメッセージを無視するのではなく、それを踏まえた内容を生成するようになり、ユーザーのパーソナライズされたトーンを維持します。
- Common: OAuthコールバックのクリーンアップ: OAuthコールバックタブが、開いたままにならずにカウントダウンタイマーで自動的に閉じるようになりました。
- Common: OAuthガイダンス: ツールがアカウント接続を必要とする際、エラーメッセージにどのアカウントを接続すべきかの具体的なガイダンスが含まれるようになりました。
- Common: Drive同期の強制書き換え: Drive同期ワークフローで、すべてのファイルを再同期するための強制書き換えオプションをサポートしました。
- macOS: 統合デバッグログビューアー: デバッグログビューで、サーバー、Swift、UIのログを単一の時系列ストリームに集約しました。
- macOS: バケット化された設定ストレージ: サーバーストレージアダプターを、堅牢な移行、永続的なマーカー、マルチプロファイルのアトミック性、およびfirst-writer-wins(最初の書き込み優先)の競合解決を備えたバケット化アーキテクチャにリファクタリングしました。
- macOS: 公証済みSafari拡張機能: Safari拡張機能がDeveloper IDで署名され、公証互換のエンタイトルメントが付与されました。これにより、配布ビルドでの「未署名の拡張機能を許可」要件が不要になりました。
- iOS: Appleリマインダーをデフォルトに: iOSおよびmacOSでAppleリマインダーをデフォルトとし、同期ビューで自動的に取得するようになりました。
- Common: OAuthスコープの昇格: 増分スコープのリクエスト時に22個すべてのスコープを表示しなくなりました。新しくリクエストされたスコープのみが表示され、アカウント選択プロンプトがよりクリーンになりました。
- Common: Googleアカウントの自動リトライ: ドキュメントが404を返した場合、エラーを表示する前に他の接続済みGoogleアカウントを自動的に試行します。
- Common: 設定のディープリンクナビゲーション: すべての設定セクションが検索およびディープリンクナビゲーションに正しく登録されました。
バグ修正
- Common: ツールの誤ルーティング: モデルがレスポンスでコロン区切りの
tool:action形式を使用した場合に、ツールが誤ってルーティングされる問題を修正しました。 - Common: 表セルの書式設定: 表セル内の書式とリンクを維持し、セル間で漏れていた継承されたリスト番号をクリアしました。
- Common: Slateハイライトスクロール: バックグラウンドタブ、プレビューモード、およびネイティブビューにおいて、信頼性の高いProseMirrorベースのポジショニングを使用して、TipTapエディタのハイライトスクロールを修正しました。
- Common: コードブロックのテキスト検索: slateドキュメント内のコードブロックで構造的なブロックマッピングが失敗した場合の、テキスト検索へのフォールバックを修正しました。
- macOS: モード切り替え時の設定消失: macOS/iOSでモードを切り替える際に、グローバル設定(APIキー、接続)がクリアされないように修正しました。明示的な許可リストによって、どの設定をリセットするかを制御します。
- macOS: ストレージパージの整合性: ストレージのフルパージが、chrome.storage.local.clear() の動作に合わせてすべての状態フィールドを一貫してクリアするようになりました。プロファイルの削除と保持のクリーンアップも正しくバケットを経由します。
- macOS: 設定の並行性: applyModeDefaults での設定読み取りが最初にロックを取得するようになり、レースコンディションを防止しました。ストレージ統計は、古いフラットキャッシュではなくバケットから読み取ります。
- macOS: 移行の堅牢性: ストレージ移行が失敗時にリトライし、永続的な完了マーカーを使用し、移行前の古いデータを自動的にクリーンアップするようになりました。
- macOS: MCPサーバーのゾンビプロセス: macOSアプリの終了時に、MCPサーバーの子プロセスが正しく終了されるようになりました。
- macOS: アジェンダ内のカレンダー/リマインダー: Appleカレンダーのイベントとリマインダーがアジェンダモーダルに表示されない問題を修正しました。
- macOS: Google OAuthフロー: OAuthをリレーサーバーのウェブフロー経由でルーティングすることで、macOSのWKWebViewでGoogleログインが失敗する問題を修正しました。
- macOS: サインアウト時のナビゲーション: macOSでサインアウト時にログイン画面に戻らない問題を修正しました。
- macOS: リモートアクセス認証: set-remote-access エンドポイントでの誤った認証要件を削除し、401エラーを修正しました。
- Server: WhatsApp返信の配信: WhatsAppへの返信がWhatsAppに投稿されず、PFチャットスレッド内に留まってしまう問題を修正しました。
- Server: WhatsAppリレーバックのタイムアウト: WhatsAppのリレーバックタイムアウトを120秒から10分に延長し、生成エラー時の解決を修正しました。
- Server: プライベート同期の再認証: プライベート同期の再認証フロー、サーバー側のOAuthガード、およびmacOSでのサインアウト時のクリーンアップを修正しました。
- Server: ローカルフォルダ同期の認証: ローカル/ネットワークフォルダの同期操作における401認証エラーを修正しました。
- Server: Googleセッションの再認証: Googleセッションの期限切れ時に、行き止まりのエラーを表示するのではなく、ロック解除ダイアログが再認証をトリガーするようにしました。
- Safari: 拡張機能の署名: Developer ID署名ビルドにおいて、
get-task-allowなしのリリース用エンタイトルメントを使用することで、Safari拡張機能が未署名として表示される問題を修正しました。 - Common: OAuthアカウントの不一致: 異なるアカウントで既存の接続を上書きするのではなく、新しい接続を正しく作成するようにし、OAuthによる接続の不一致を修正しました。
- Common: OAuthスコープの膨張: 不一致な接続が元のアカウントのスコープを継承し、意図しないスコープの過剰付与が発生していた問題を修正しました。
- Common: スレッドリストの消失: STATE_UPDATE のタイムアウト/リトライが誤ったフィールド名を使用し、スレッドリストが消去される可能性があった問題を修正しました。
- Common: ティアバッジの正確性: 無料ティアの機能に誤って「Tester」と表示されるティアバッジを修正しました。
- Common: 設定パネルのオーバーフロー: 設定パネルのカード行におけるflexオーバーフローによるレイアウトの問題を修正しました。
- Server: プライベート同期のAPIキー紛失: デバイス間で同期する際にプライベート同期がAPIキーを失う問題を修正しました。
- Server: メッセージングブリッジ: メッセージングブリッジにおけるアーカイブされたチャット、停止ボタン、およびモード選択を修正しました。
- macOS: カスタムモード設定の消失: 保存パスが機能していなかったため、macOS/iOSでカスタムモード設定が暗黙的に失われていた問題を修正しました。
- macOS: OpenRouterヘッダーのブロック: macOS/iOSでリレーCORSがOpenRouterのアトリビューションヘッダーをブロックしていた問題を修正しました。
- macOS: タブコンテキストの切り替え: ブラウザタブを切り替えた際にタブコンテキストが更新されない問題を修正しました。
Version 0.9.713 (2026年3月28日)
新機能
- Common: Sub-Agents: 永続的な名前付きエージェント、会話履歴、並列実行(委員会パターン)、順次および割り込みモード、中断カスケード、および時系列ステータス追跡を備えた専用UIレンダリングを含む、完全な Sub-Agents システムを導入しました。
- Common: MCP ツール承認: 登録された MCP ツールがツール承認システムに表示されるようになり、エージェントが呼び出すことができる MCP ツールをユーザーが可視化し、制御できるようになりました。
- macOS: Sidepanel プッシュモード: Sidepanel がオーバーレイに加えてプッシュモードをサポートしました。デフォルト幅は425pxで、ドッキングされた幅はセッションをまたいで保持されます。
- Server: WhatsApp リッチメッセージ: WhatsApp 接続において、テキストとメディアに加えて、位置情報の共有、連絡先、リアクション、ステッカーメッセージをサポートしました。
- Server: API キーの保存時暗号化: Relay D1 ストレージに保存される API キーが保存時に暗号化されるようになりました。サーバー側の OAuth キーは、ローカルに保存された後に削除されます。
改善点
- Common: モデルエイリアスの表示: Sub-Agent のツール呼び出し引数に、識別を容易にするための注釈付きモデルエイリアスが表示されるようになりました。
- Common: BYOA 接続の優先順位: スコープが拡張された OAuth リクエストにおいて、Basic 接続よりも BYOA 代替接続が優先されるようになり、不要な再認証プロンプトが減少しました。
- Common: 思考シグネチャの保持: OpenAI Responses API と Gemini のマルチターンツール呼び出しフローの両方で、思考/推論シグネチャが正しく保持されるようになりました。
- macOS: デバッグログの伝播: デバッグログの切り替えが Node.js サーバーサブプロセスに伝播されるようになりました。
- Common: ベンガル語のサポート: プラットフォームとウェブサイトがベンガル語をサポートしました。また、ウェブサイト上の商標免責事項とメディア投稿を更新しました。
バグ修正
- Common: Safari/WKWebView ストリーミング: kokoro-js 用に ReadableStream の非同期イテレーションをポリフィルし、Safari および WKWebView における TTS ストリーミングの失敗を修正しました。
- Common: カスタムモード作成: 古い React クロージャによって、初回試行時にカスタムモードの作成が失敗する問題を修正しました。
- macOS: エージェントストレージ変更の消失: 永続化ブリッジの欠落により、macOS 上でエージェントサブプロセスのストレージ変更(モード作成、設定、スキル)が警告なく失われていた問題を修正しました。
- macOS: クリップボードへのコピー: macOS の WKWebView でクリップボードへのコピーが警告なく失敗する問題を修正しました。
- macOS: WKWebView における WASM/WebGPU: macOS ネイティブアプリにおいて、TTS/STT およびローカル ONNX パスに WASM バックエンドを強制しました。これは、localhost の WKWebView では CDN のクロスオリジンインポートおよび WebGPU JSEP モジュールのインポートが失敗するためです。
- macOS: トランスポートリクエストの衝突: macOS でツール承認を妨げていた requestId の衝突を修正し、MCP の表示名を改善しました。
- macOS: WhatsApp 自動返信: macOS Relay サーバー上での WhatsApp 自動返信のエンドツーエンドの配線(スレッドの可視性を含む)を修正しました。
- iOS: 音声入力の停止: stopRecording のクリーンアップがバイパスされた際に、音声入力が録音状態のまま固まる問題を修正しました。
- Safari: ブラウザコマンドのタイムアウト: サービスワーカーのサスペンド後に WebExtension API がハングすることによって発生していた、Safari ブラウザコマンドのタイムアウトを修正しました。
- Safari: ハートビートの期限切れチェック: 誤った切断を防ぐため、Safari の HTTP ポーリングブラウザにおけるハートビートの期限切れチェックをスキップするようにしました。
- Server: Private Relay の安定性: Durable Object の休止、アイドルタイムアウト (1006)、再接続の遅延、古いソケットの処理、およびゾンビ readyState の問題を修正しました。serverState と ctx.state 間のスプリットブレインを解消しました。
- Server: Webhook ブロードキャスト: ゾンビ readyState を回避するため、DO の休止解除後に Webhook がすべてのサーバーソケットにブロードキャストされるようになりました。
- Server: MV3 メッセージングのレースコンディション: Webhook 到着時の遅延初期化メッセージングブリッジのレースコンディションを修正し、MV3 サービスワーカーのクラッシュを防止しました。
- Server: Webhook 検証 CORS: ブラウザでの CORS 拒否を避けるため、Webhook 検証テストをサーバー経由でルーティングするようにしました。
- Extension: ログアウト時のクリーンアップ: サインアウト時に、localhost コンテキストを検出して macOS 上のローカル Relay サーバーセッションを正しくクリアするようになりました。
- Common: セキュリティ — スレッドの分離: 状態のブロードキャストにおいて現在のプロファイルでスレッドをフィルタリングするようになり、プロファイル間でのデータ漏洩を防止しました。
バージョン 0.9.712 (2026年3月26日)
新機能
- 共通: WhatsApp 接続診断: WhatsApp の「接続テスト」において、API トークンに加えて Webhook の購読ステータスと App Secret の有効性を確認するようになりました。これにより、Meta 側で発生するサイレントな配信エラーを検知できます。
- macOS: ネイティブ OAuth フロー: macOS アプリで OAuth に ASWebAuthenticationSession を使用するようになりました。ブラウザのリダイレクトに代わり、リフレッシュトークンが不足している古い接続の自動アップグレードにも対応します。
改善点
- 共通: DOCX 検索/置換の堅牢性: DOCX ドキュメント内での検索および置換において、二重スペース、改行なしスペース、スマートクォート、数値エンティティ、およびケース(大文字・小文字)の不一致を処理できるようになりました。完全一致に失敗した場合のケースインセンシティブなフォールバック機能や、複数の箇所が置換された際の警告表示が含まれます。
- 共通: DOCX リスト番号: DOCX エクスポート時に、リテラルな箇条書き文字ではなく適切な Word リスト番号(w:numPr)を生成するようになりました。これにより、Word が番号付きリストや箇条書きリストを正しく認識します。
- 共通: エージェント起動パフォーマンス: ゴースト MCP サーバー、HTTP レディネス・タイムアウト、および冗長なモデル取得によって発生していた 30〜50秒のエージェント起動遅延を解消しました。モデルキャッシュがエージェントのサブプロセスに渡されるようになりました。
- Server: セキュリティの強化: URL ハンドラーにおけるコマンド注入の修正、タイミングセーフなトークン比較、リレーサーバーへの Content-Security-Policy ヘッダーの追加、セッションエンドポイントへのレート制限、既知のオリジンへの CORS 制限、および並列 E2E ブロードキャスト暗号化を実装しました。
- Server: Webhook 署名検証: Webhook ペイロードで base64 エンコードされた生のボディを使用するようにし、JSON のラウンドトリップによる破損で HMAC 署名が無効になる問題を防止しました。
- Server: OAuth トークンの永続化: サーバーの状態オブジェクト間での不整合を修正し、アプリの再起動後に OAuth 接続(Google Drive など)が失われる問題を解決しました。
- macOS: パフォーマンスと安定性: メニュー駆動型のトレイポーリング(従来の無条件な 3秒タイマーから変更)、デバウンス処理されたウィンドウ状態の保存、ノンブロッキング・ロギング、エクスポネンシャル・バックオフ(指数関数的後退)による WKWebView クラッシュからの回復、およびスクリプトメッセージハンドラーのメモリリーク修正を行いました。
- macOS: ログの集約: リレーサーバーの出力とアプリのライフサイクルイベントが、10MB の自動ローテーション機能付きで
~/Library/Logs/caiioo/に記録されるようになりました。これにより、出力がサイレントに破棄される問題が解消されました。
バグ修正
- 共通: ファイルピッカーの指示:
pick_filesツールが、サイレントに失敗する無効な UI アクションシグナルの代わりに、ユーザーへの明確な指示を返すようになりました。 - Server: アクティブタブ・ポーリングのスパム: リレーモードでのアクティブタブ・ポーリングにおいて、ブラウザ拡張機能が接続されていない場合にタイムアウトエラーが無限に発生する問題を修正しました。連続して失敗した場合には、エクスポネンシャル・バックオフ(30秒から5分)を適用します。
- Server: ネイティブアプリ用 CORS: 127.0.0.1 のオリジンが CORS ホワイトリストによってブロックされ、macOS ネイティブアプリの WKWebView からの Google OAuth が切断される問題を修正しました。
- Server: 孤立したエージェントプロセス: サーバーのシャットダウン時や未捕捉の例外発生時に、エージェントのサブプロセスが適切にクリーンアップされるようになりました。
- macOS: Browser Orchestrator ログスパム: 拡張機能の接続におけるブラウザプロトコルメッセージの「Unhandled message type(未処理のメッセージタイプ)」警告を修正しました。
Version 0.9.711 (2026年3月24日)
新機能
- Common: 設定の自動保存: 設定フィールドの編集内容がリアルタイムで保存されるようになりました。テキストフィールドには500msのデバウンスを適用し、トグルやセレクトボックスは即座に保存されます。これにより、クラッシュや画面遷移によるデータ消失を防止します。
改善点
- Common: DOCX 番号付けの保持: 番号付きの DOCX セクション(例:「3.2.3 → 見出し」のような形式の法的文書)におけるタブ文字が、編集のラウンドトリップ後も削除されずに保持されるようになりました。
- Common: よりスマートなツール選択: 動的ツールセレクターが、厳密なトリガーワードの一致だけでなく、ウェブでの確認が必要な事実に関するクエリ(営業時間、価格、住所など)を処理できるようになりました。
- Common: エージェントの言語変更: エージェントによって開始された言語変更が、手動で設定を切り替えることなく即座に適用されるようになりました。
- Common: マルチアカウント OAuth フォールバック: メインの Google アカウントに必要なスコープが不足している場合、再認証を促す前に接続済みのサブアカウントを確認するようになりました。サブアカウントのトークン期限切れ時に発生していた未捕捉のエラーを修正しました。
- Server: モード設定のバリデーション: 設定保存時にサーバー側でティア権限を検証するようになり、無料ティアのユーザーがプロティアの設定を保存し続けることを防止します。
- Common: セキュリティの強化: 推論プレビュー出力への DOMPurify によるサニタイズの適用、CORS の許可オリジンの制限、HTTPS 優先の IP ジオロケーションルックアップ、および web_accessible_resources の制限強化を行いました。
バグ修正
- Common: Google 検索結果の URL: ブラウザでの Google 検索が、実際の URL を含む構造化されたリンクを返すようになりました。以前は AgentMarkdown が Google の複雑なネスト構造の HTML からリンクの href を消失させていたため、エージェントが URL を抽出するのに5回のツール呼び出しを必要としていましたが、現在は DOM から直接リンクを抽出し、最初の検索結果に含めるよう改善されました。
- Common: Private Sync の無限ループ: マニフェストのバックアップファイルの書き込みが継続的に再同期をトリガーしていた同期ループを修正しました。空の設定オブジェクトがデバイス間で正しく伝播されるようになりました。
- Common: メッセージングブリッジの更新: インバウンドメッセージ、エージェントの返信、およびリレーバックのレスポンスが、エージェントの応答終了を待たずに即座に UI にブロードキャストされるようになりました。
- Extension: Private Relay の再接続: MV3 サービスワーカーの再起動後にリレーが切断されたままになる問題を、保存された有効化状態にフォールバックすることで修正しました。また、enable() 実行中の自己置換の競合状態および ID 変更時の再接続を修正しました。
- Extension: Private Relay の競合状態: 有効化/無効化の競合を強化し、メッセージングブリッジのコールバックに未処理の拒否(unhandled rejection)ガードを追加しました。また、設定パネルのアンマウント時におけるタイマーリークを修正しました。
Version 0.9.710 (2026年3月22日)
新機能
- Common: Zero-Day Risk (ZDR) 強制適用: OpenRouter とのライブ ZDR データ同期および強制適用トグルを実装。プロバイダー数の内訳を表示し、Zero-Day Risk フラグが立てられたモデルをブロックできるようになりました。
- Common: Tool Call Healing: 推論ブロック内で XML 形式のツールコールを出力する精度の低いモデルを自動検出し、修正(Healing)する機能を搭載。フロンティアモデル以外のモデルにおける信頼性が向上しました。
- Common: Unified Token Lifecycle: 統合された TokenLifecycleManager により、すべてのプラットフォーム(拡張機能、Server、macOS、iOS)で対称的な OAuth トークンリフレッシュを実現。期限切れ前のプロアクティブなリフレッシュに対応しました。
- iOS: Composer アイコンのスケーリング: iOS において Composer のアクションアイコンを1.18倍に拡大し、タップターゲットを改善。プラットフォーム固有のスタイリングのために専用の
native-iosbody クラスを追加しました。
改善点
- Common: Slate 提案された変更: Slate エディタにおいて、提案された変更間のナビゲーション、ホバーによる承認/却下、およびカウンターの更新が正しく動作するようになりました。
- Common: Slate セレクタードロップダウン: Slate タイプセレクターがポータル化されたポップオーバーではなくインラインドロップダウンを使用するようになり、z-index と配置の問題が修正されました。
- Common: Propose Change 全置換:
propose_changeにおいて、小さなドキュメント(500文字以下)の場合、部分的な編集ではなくドキュメント全体の置換が可能になりました。 - Common: 音声送信時の文字起こし待機: 録音中に送信/Enterを押した場合、文字起こしが完了するまで待機してから送信されるようになり、空のメッセージや不完全なメッセージの送信を防止します。
- Common: Private Sync セットアップフロー: Private Sync のセットアップ中、OAuth 完了後にパスフレーズダイアログが自動表示されるようになり、オンボーディングフローが簡素化されました。
- Common: BYOA レジストリのリフレッシュ: Private Sync が新しい認証情報をダウンロードした後に BYOA プロバイダーレジストリが再初期化されるようになり、インポートされた接続が即座に利用可能になりました。
- Common: 用語の一貫性: ユーザーガイド内の「Cloud Sync」を「Private Sync」に名称変更。デグレード防止のための用語ガードテストを追加しました。
- Server: Private Relay の安定性: 互換性日付の更新、Durable Object のクラッシュハンドリングの改善、および MV3 の再接続ロジックの強化により、長時間の接続の信頼性が向上しました。
- Server: Private Sync 設定の除外: デバイス間でのリレー設定の競合を防ぐため、Private Relay の設定が Cloud Sync のペイロードに含まれないようになりました。
バグ修正
- Common: SVG 画像の処理: SVG 形式をサポートしていないモデルで HTTP 400 エラーが発生するのを防ぐため、SVG ファイルを
image_urlとしてプロバイダーに送信しないように修正しました。 - Common: Private Sync の競合状態: Private Sync の初期化中に発生していた競合状態によるメッセージリレーの失敗を修正。同期ループと隔離(quarantine)ロジックを強化しました。
- Common: Private Sync データ削除: Private Sync を無効化した後、クラウドデータの削除と監査が正しく動作するようになりました。
- Common: モデルマッチングの汚染: 自動調整システムにおいて、プロバイダーファミリーを跨いでモデルが誤ってマッピングされる可能性があるクロスファミリー・モデルマッチングの問題を修正しました。
- Common: Dynamic Tool Selector: ツール選択の失敗を引き起こす可能性のあるエージェントのような推論を防止するため、動的ツールセレクターのプロンプトを強化しました。
- Common: バリデーションエラーメッセージ: 必須フィールドのバリデーションにおいて、汎用的なエラーではなく、焦点を絞ったエラーメッセージを返すようにしました。
- Extension: Private Relay WebSocket の切断: MV3 サービスワーカーのサスペンドにより、約60秒後に WebSocket 接続が切断される問題を修正。キープアライブと再接続ロジックを改善しました。
- Extension: Google OAuth インクリメンタルスコープ: 拡張機能のコンテキストにおいて、
launchWebAuthFlowを使用した OAuth スコープの拡張がサイレントに失敗する問題を修正しました。 - Extension: Relay トグル設定のリロード: リレーの切り替え時に不要な設定のリロードを抑制し、UI のちらつきや診断ノイズを防止しました。
- Server: Durable Object の休止: Durable Object の休止(hibernation)後に WebSocket のクローズ処理が接続を古い状態のままにする問題を修正しました。
- Server: メッセージング認証情報の永続化: メッセージング認証情報が、次の保存サイクルを待たずに変更時に即座に永続化されるようになりました。
- iOS: 古い WebSocket コールバック: iOS での再接続後に古いコールバックが実行されないよう、クローズ時に WebSocket ハンドラーをクリアするようにしました。
- Desktop: NSIS インストーラーのアップロード: Windows 用 NSIS インストーラーが API 経由でドラフトリリースに正しくアップロードされるようになりました。
バージョン 0.9.709 (2026年3月21日)
新機能
- 共通: Slack メッセージングアダプター: メッセージングブリッジ用の新しい Slack Events API アダプター。ボット署名検証、メディアダウンロードのサポート、および設定 UI 構成を備えています。
- 共通: Slate ファイルのラウンドトリップ: ファイルシステムハンドルの永続化とハッシュベースのダーティトラッキングにより、Slate 内でローカルファイルを直接開き、保存できるようになりました。Slate セレクターダイアログの新しい「ファイルを読み込む」ボタンは、ドキュメントをプリプロセスし、適切なエディターで開きます。
- 共通: Slate ファイルメニューの再構成: ファイルタイプメニューを「ドキュメント」、「レンダリング可能」(HTML/Vega/Mermaid)、「コードとデータ」のカテゴリに再編成し、名前変更時の自動検出機能を追加しました。
- 共通: リモートブラウザアプリ: リモートブラウザクライアントがプライベートリレー経由でサイドパネルのアセットを取得できるようになり、拡張機能をインストールせずにブラウザベースのアクセスが可能になりました。
- 共通: プライベートリレーにおけるデバイス ID: リレー職人が人間が判読可能なデバイス名を表示するようになりました。別のデバイスによって接続が解除された場合、UI にどのデバイスが自分を置き換えたかが表示されます。
- 共通: Composer マイクチップの再設計: マイクボタンを、明確な録音状態インジケーターを備えた可視性の高いチップ/ピル型に再設計しました。モバイル向けに最小 44px のタッチターゲットを確保し、入力エリア上に音声オーバーレイをレンダリングします。
- 共通: ユーザーガイドのリンク: 「ドキュメントと法的情報」設定セクションからユーザーガイドへリンクされるようになりました。
- iOS: BYOA セットアップゲート: モバイルでの 8 ステップのブラウザフローは困難であるため、モバイルの BYOA ウィザードにデスクトップで Private Apps をセットアップするよう促すメッセージを表示するようにしました。
- サーバー: ログインチャレンジ: ログイン時のメールベースの 6 桁 MFA 検証を導入し、同意の追跡とセッションの取り消し機能を追加しました。
改善点
- 共通: プライベート同期の設定優先化: 会話の前に設定が同期されるようになり、バックグラウンドで一括スレッド同期が継続されている間も、トークンと構成が即座に利用可能になります。
- 共通: WebSocket リクエストの相関: WebSocket およびプライベートリレーのトランスポートが、即座に解決されるのではなく、サーバーの応答を適切に待機するようになりました。これにより、macOS サイドパネルおよびリレークライアントにおける 40 以上の UI 操作(Drive 監査、Ollama テスト、MCP 操作など)が修正されました。
- サーバー: Webhook 署名検証: よりクリーンなアーキテクチャにするため、Webhook 署名検証をルートレベルのアプリシークレットに移動しました。
バグ修正
- 共通: WhatsApp 応答の配信: エージェントの応答が WhatsApp に送信されずにサイレントに消失していた問題を修正しました。メッセージングのリレーバックパスにおいて、配信失敗時に診断詳細をログに記録するようにし、将来の問題を即座に診断可能にしました。
- 共通: モデル間での思考ブロックの署名: 思考モードを持つ Claude 以外のモデルから Claude に切り替えた際の「思考ブロック内の無効な署名」エラーを修正しました。推論フォーマットの検出が、Anthropic フォーマットとして誤認されるのではなく、デフォルトで 'unknown' になるようになりました。
- 共通: 新規ドキュメントの Slate 編集機能: 新しい DOCX、PDF、RTF、および XLSX の Slate が、静的 HTML としてレンダリングされるのではなく、正しくエディターで開くようになりました。
- 共通: Slate エクスポートのフォールバック: 元のバイナリデータがない新しいドキュメントが正常にエクスポートされるようになりました。XLSX は CSV に、RTF は HTML 変換に、PDF はブラウザ印刷にフォールバックします。
- 共通: サンドボックスプレビューのレンダリング: postMessage ターゲットのサンドボックスオリジンの不一致によって発生していた、HTML および Vega プレビューの空白問題を修正しました。
- 共通: 変更履歴の列オフセット: 変更履歴内の削除が HTML からテキストへのオフセットを正しくマッピングするようになり、TipTap 内での変更箇所のずれを修正しました。
- 共通: プライベート同期の認証リカバリ: 同期中に OAuth トークンが期限切れまたは取り消された場合、手動での再接続を必要とせず、自動的に再認証をトリガーするようになりました。
- 共通: 音声ストリーミングのドラフトインジケーター: 音声文字起こしのオーバーレイに「プレビュー」ステータスを表示し、録音が停止するまでテキストが暫定的なものであることを示すために不透明度を下げました。
- 共通: ネイティブプラットフォーム上の MCP ツール: ローカル MCP サーバーツールが macOS、Windows、および Linux で正しく登録されるようになりました。以前はハンドラーが MCP プロセスを開始していましたが、ツールの取得や登録が行われていませんでした。
- 共通: Slate コンテキストチップの更新: Drive または GitHub から読み込んだ後に Slate タブのタイトルが変更された際、アクティブタブのコンテキストチップがストレージからリフレッシュされるようになりました。ダークモードでのタイトル入力テキストが判読不能になる問題を修正しました。
- Extension: Chrome スタブポリフィル:
window.chromeは存在するが拡張機能 API がない localhost の Chrome ブラウザタブにおいて、スキップされるのではなく、適切なスタブが注入されるようになりました。 - Extension: リレークライアントバンドルのクラッシュ: ビルド時の環境変数を定義することで、リレークライアントの IIFE バンドルにおける
import.meta.envによるクラッシュを修正しました。 - Extension: リモートアプリのログイン: リモートブラウザアプリのログイン画面を整理し、Google OAuth を主要な方法とし、メール/パスワードを折りたたみ式のセカンダリオプションにしました。
Version 0.9.708 (2026年3月19日)
改善点
- Common: 生成インジケーターの連携: メッセージごとのタイピングドットがスレッドレベルのフォールバックインジケーターと同期するようになり、生成中にドットが重複して表示される問題が解消されました。ドットは推論(reasoning)およびツール実行フェーズ中も表示され続け、最終的な回答のストリーミングが開始された時点で非表示になります。
- Common: ストリーミングカーソル: ストリーミングテキストの末尾に点滅するカーソルが表示されるようになり、レスポンスが生成中であることを視覚的に明確に示します。
- Common: 推論プレビューのフォーマット: 折りたたまれた推論ブロック内で、生のマークダウン構文ではなく、インラインの太字や斜体のフォーマットがレンダリングされるようになりました。
- Common: Slate ドキュメント一覧:
list_slatesにおいて、軽量なスレッドクエリ経由で読み込まれた DOCX、PDF、XLSX ファイルのコンテンツサイズが正しく表示されるようになりました。また、一覧には DOCX および XLSX ドキュメントを編集するためのワークフローガイダンスが含まれます。 - Common: Private Sync 設定セクション: 整理を容易にするため、Private Sync の設定が一般設定から分離され、専用のセクションに配置されました。
- Extension: 接続設定の再構成: Private Relay セクションが、Private Relay(リモートアクセスの切り替え、常に表示)と Caiioo Bridge(ローカル MCP サーバーおよびシステムツール)の2つの明確なサブセクションに再編されました。リモートアクセスの切り替えに Bridge の起動が不要になりました。
- Desktop: Tauri 統合バイナリ: Windows/Linux デスクトップアプリが、コンパイル時のバリアントから単一のバイナリに統合されました。サイドパネルの表示可否は、実行時にサブスクリプションティアによって決定されます。
バグ修正
- Extension: Bridge なしの Private Relay: Private Relay が Caiioo Bridge アプリなしで独立して接続できるようになりました。以前は認証が Bridge 接続によってのみ初期化されていたため、拡張機能のみのユーザー(Linux/Windows を含む)がメッセージング Webhook を受信したり、リモートアクセスを使用したりできない状態でした。
- Extension: Google OAuth ルーティング: Chrome で
getAuthTokenが利用できない場合にスキップし、BYOA 認証情報にフォールバックすることで、OAuth ポップアップの失敗を修正しました。COOP ポップアップの耐性向上により、制限のあるサイトでウィンドウが空白になるのを防ぎます。 - Common: ElevenLabs ストリーミング STT: ElevenLabs のストリーミングで接続中断が発生した際に、音声文字起こしが脱落または失敗する問題を修正しました。ネイティブアプリの音声入力は、適切にフォールバックするようになりました。
- iOS: WKWebView 内の外部リンク: Safari で開くべきリンクが、アプリの WebView 内で読み込まれるのではなく、正しく外部で開くようになりました。
- Common: 広告ブロッカーの孤立ルール: サービスワーカーの再起動後に動的な DNR 広告ブロックルールが残存する問題を修正しました。
disableAllBlockingは、ブロッカーインスタンスが null の場合でも、孤立したルールを直接照会して削除するようになりました。 - Common: プロフィール切り替え時のライセンス同期: プロフィールを切り替える際にサーバーからライセンスを同期するようになり、ティア制限のあるツールが再起動なしで即座に更新されるようになりました。
- Common: プロビジョニング前のトークンリフレッシュ: API キーのプロビジョニング前に期限切れの OAuth トークンがリフレッシュされるようになり、サイレントエラーを防止します。新規サーバーが既存の ID 接続を継承できるようになりました。
- Web: iOS Safari のモバイルメニュー: マーケティングサイトのハンバーガーメニューが iOS Safari で透明になる問題を修正しました。
- Common: React-18 バッチ処理の競合: React-18 の状態バッチ処理によってメッセージごとのタイピングドットが表示されない場合に備え、フォールバックとしてスレッドレベルの生成インジケーターを追加しました。
バージョン 0.9.707 (2026年3月17日)
改善点
BYOA 再設定の事前入力: 既存の Google または Microsoft プライベートアプリを再設定する際、クライアントシークレットとテナント ID が事前入力されるようになり、再入力の手間が省けるようになりました。
モデルリストのソート: 各プロバイダーグループ内のモデルがリリース日順(新しい順)にソートされるようになり、各プラットフォーム間で一貫した順序が保証されます。
バグ修正
プライベート同期の認証復旧: プライベート同期の初期化中に発生した OAuth トークンの失敗(セッション切れ、トークンの取り消し、Chrome プロファイルトークン)が、サイレントにエラー状態になるのではなく、UI 上に正しく表示されるようになりました。
Slate 変更履歴の信頼性: 変更履歴に関する 10 件の重要な修正を行いました。リビジョンマージの競合状態、すべての更新パスにおける差分ベースの永続化、DOCX エクスポート時の書式保持、TipTap マッチングのための HTML タグ除去、すべて承認/拒否の順序、エンティティのエスケープおよびタグの正規表現マッチングの収束に関する修正が含まれます。
Slate データの整合性: 貼り付けられた画像が期限切れのローカルキャッシュに書き込まれる問題、クラウドソースのメタデータが保持されない問題、およびリレー/モバイルモードでのライブ AI アップデート用 BroadcastChannel フォールバックを修正しました。
Slate セキュリティ: 画像ビューアにおける XSS インジェクションを修正し、ワイルドカードによる postMessage オリジンをスコープ指定された拡張機能 URL に置き換えました。
バージョン 0.9.706 (2026年3月16日)
新機能
- プロバイダーエラーバナー: AIプロバイダーがエラー(402 支払いが必要、APIキーの不足、レート制限など)を返した際、一般的な失敗メッセージではなく、明確な指示を含むアクション可能なバナーが表示されるようになりました。
改善点
DOCX クロススパン編集:
propose_changeツールが、複数のフォーマットラン(例:一部が太字のテキスト)にまたがる検索/置換操作を正しく処理できるようになりました。エージェントが文脈に応じた編集を行えるよう、意図が引き継がれます。PDF 保存のパフォーマンス: ネイティブ PDF 保存が大幅に高速化されました。冗長な解析の排除、インポートモジュールのキャッシュ、不要なオペレータークリーニングのスキップにより実現しました。
メッセージングのモード名: メッセージング設定のモードセレクターに、内部 ID ではなくモードのブランド名が表示されるようになりました。
バグ修正
Google OAuth トークンの更新: Calendar、Gmail、Drive へのアクセスを妨げる可能性があった、Google OAuth トークン更新時の「Unauthorized」エラーを修正しました。
プロビジョニング済みキーのエラーメッセージ: プロビジョニング済み API キーを使用しているユーザーに、誤解を招く「資金を追加してください」というエラーが表示されなくなりました。メッセージは実際の原因と次のステップを説明する内容に修正されました。
スレッドの同時実行競合: 生成中にスレッドを切り替えると、GENERATION_COMPLETE/ERROR イベントが誤ったスレッドに適用される可能性がある競合状態を修正しました。
リビジョン履歴の復元ボタン: Slate のリビジョン履歴において、現在のコンテンツが選択したリビジョンと異なる場合に、復元ボタンが正しく表示されるようになりました。
二重の OAuth ポップアップ: 新しい Chrome 拡張機能ユーザーが初めてサインインする際、OAuth ポップアップが 2 回表示される問題を修正しました。
バージョン 0.9.705 (2026年3月15日)
新機能
- 設定カテゴリのグループ化: 19の設定セクションを、段階的開示のために5つの折りたたみ可能なカテゴリに整理しました。「エージェントモード」セクションには、影響を受けるセクション(ツール設定、モデル設定、外観)へのナビゲーションリンクを含む横断的なインジケーターが表示されます。「APIプロバイダー」セクションは、モデル機能に関する警告とともにデフォルトで開きます。
バグ修正
- アジェンダ同期の重複カレンダー: 同一のメールアドレスに対してログイン(ID)接続とプライベート接続の両方が存在する場合でも、Google Calendarアカウントが同期タブに二重に表示されないようになりました。レンダリング前に接続の重複が排除されます。
- i18n設定カテゴリ: 設定カテゴリのラベルが、サポートされているすべての言語で翻訳されるようになりました。
Version 0.9.704 (2026年3月14日)
新機能
- Microsoft 365 統合基盤: Microsoft スコープルーティング、Graph API クライアント、および BYOA サポートを備えたアカウントサービスを実装。Microsoft プロバイダー向けのスコープ階層定義とツールスコープ・レジストリ拡張を追加。Microsoft を relay-proxied プロバイダーとして追加。
- Rich Inline Rendering (RIR): チャットメッセージ内にリッチコンテンツをインラインでレンダリングするための新しいコーデックアーキテクチャ。HTML、Markdown、DOCX コーデックと拡張可能なコーデックインターフェースを搭載。
- PDF 構造ツリーとレイアウト解析: セマンティックなドキュメント理解のためのタグ付き PDF 構造ツリーパーサー。タグなし PDF に対しては、フォールバックのレイアウト解析としてヒューリスティックな段落グルーピングを提供。画像の置換・挿入およびコンテンツのオーバーフロー検知機能を実装。
- メッセージングモード選択: メッセージングブリッジの設定にデフォルトモードセレクターを追加。インバウンドメッセージを処理する際、エージェントが適切なパーソナリティで応答できるようになりました。
改善点
- プロバイダーのレート制限リトライ: すべての LLM プロバイダーにおいて、429(レート制限)および 529(過負荷)レスポンス時に即座にエラーとせず、エクスポネンシャルバックオフによる自動リトライを実行するように変更。ジッターを伴う最大 3 回のリトライ。
- Google OAuth スコープのスーパーセット照合: 書き込みスコープが読み取りスコープの要件を満たすように変更(例:
driveがdrive.readonlyをカバー)。より広範なスコープが既に許可されている場合に、不要な再認証が発生するのを防止。 - BYOA フルスコープ初期認証: Private Connection が必要な場合、初期認証フローで(基本用と拡張用の 2 回に分けるのではなく)必要なすべてのスコープを事前にリクエストするように変更。
- Google 404 から拡張アクセスへの昇格: BYOA 接続で Google Workspace ファイルに対して 404 エラーが発生した場合、行き止まりのエラーメッセージではなく、拡張アクセスプロンプトに昇格させるように変更。
- メッセージング認証情報のプライベート同期: メッセージングブリッジの認証情報がデバイス固有ではなく、E2E 暗号化されたプライベート同期を介してデバイス間で同期されるように変更。同期マニフェストを v10 に更新。
- OAuth 待機タイムアウトの延長: BYOA および拡張アクセス OAuth フローのタイムアウトを 5 分(以前は 2 分)に延長し、ユーザーが Google Cloud Console の手順を完了するのに十分な時間を確保。
- Sparkle フレームワークの署名: macOS 配布用ビルドにおいて、Sparkle フレームワークのネストされたバイナリをインサイドアウト順で適切に署名するようにし、公証(notarization)の失敗を修正。
- Tauri Node バイナリのバンドル: Windows/Linux のサイドカー実行用に、Tauri 設定で Node.js バイナリをリソースとしてバンドル。
- メッセージング設定の検索: 設定検索バーから "whatsapp"、"telegram"、"webhook" などのキーワードでメッセージングブリッジセクションを検索可能に。
- 設定の Relay 転送: 設定の保存内容を WebSocket ブリッジ経由で relay サーバーに転送するようにし、メッセージング認証情報やその他の設定変更がサーバーの状態ファイルに反映されることを保証。
バグ修正
- Slate における通貨と数式の競合: Markdown テーブル内の
$9/moのようなドル表記が、LaTeX インライン数式のデリミタとして誤認されないよう修正。数式の正規表現がエスケープされた通貨記号を考慮するように変更。 - 会話ページの ToastProvider: ポップアウトされた会話タブに
ToastProviderが不足しており、トースト通知に依存する機能がサイレントに失敗していた問題を修正。プロバイダーツリーをサイドパネルと一致するように修正。
Version 0.9.703 (2026年3月14日)
新機能
- Google Picker 統合: ポップアップとiframeのハイブリッドによるフル機能の Google Drive ファイルピッカーを実装。マルチビューフィルタ(Docs、Sheets、Slides、PDFs)およびコンポーザー内でのドライブ参照チップに対応しました。Google Picker を通じて選択されたファイルには、自動的に
drive.fileアクセス権限が付与されます。 - Google Sheets ネイティブ同期: セルレベルでの完全な双方向編集が可能な状態で、Slate 内で Google Sheets を開けるようになりました。Sheets コーデックがスプレッドシートのグリッドデータと TipTap HTML テーブルを相互変換し、Drive の
modifiedTimeを使用して競合を検知します。読み取り、セルのバッチ更新、および構造変更(シートの追加/削除、セルの結合)をサポートします。 - Google Slides 読み取り専用ビュー: Google Slides プレゼンテーションを Slate 内でレンダリングし、スライドのサムネイルと検索可能な抽出テキストコンテンツを表示します。
- Gmail バッチ取得と Markdown 変換: Gmail ツールにおいて、メッセージメタデータを1つずつではなくバッチ(一度に最大100件)で取得するよう変更しました。5分間のラベル名キャッシュと、LLM が処理しやすいクリーンなデータにするための本文の自動 HTML-to-markdown 変換機能を備えています。
- セレクションオーバーレイ: 任意のウェブページでテキストを選択すると「プロンプトに追加」ボタンが表示され、選択した内容を素早く会話に追加できるようになりました。
- Relay オーバーレイマネージャー: エージェントのオーバーレイコマンドがブラウザ拡張機能を経由してルーティングされるようになり、アクティブなウェブページ上でのエージェント駆動型 UI オーバーレイが可能になりました。
- インライン・クイックタスク・モデルピッカー: クイックタスクのモデル選択が、別のメニューではなくモデルピッカーのドロップダウン内に直接埋め込まれました。
- Google Drive からの Slate DOCX エクスポート: Slate で読み込まれた Google Docs が(
readFileContentAsBinary経由で)DOCX としてエクスポートされるようになりました。これにより、プレーンな markdown として開くのではなく、変更履歴の記録が可能な TipTap ビジュアルエディタの全機能が有効になります。 - Private Connection セットアップウィザード: 現在の Google Cloud Console のフローに合わせた、専用の「テストユーザーの追加」ステップを含む改良版 BYOA ウィザードを導入しました。同意画面のサブステップは、Google 実際の4ステップのアコーディオン形式に従います。ユーザーの ID が既知の場合、メールの指示内容がパーソナライズされます。
- Private Connection プロモーションバナー: エージェントが拡張された Google スコープ(Gmail、Calendar など)を必要とし、かつ Private Connection が存在しない場合、セットアップウィザードへのワンクリックパスを含むアニメーションバナーが表示されます。ユーザーがセットアップを完了する間、エージェントは一時停止状態を維持し、接続が保存されると自動的に再開します。
- エクスポート忠実度警告: ドキュメントを別の形式(例:PDF から DOCX)にエクスポートする前に、フォーマットが失われる可能性について、重要度別(情報、警告、致命的)に分類された忠実度ダイアログで警告を表示します。
- PDF アノテーション抽出: ドキュメントの処理および再構成中に、PDF のテキストアノテーションとマークアップが抽出・保持されるようになりました。
- Reminders カレンダー同期: Reminders モーダルが、拡張アクセス制御を伴うカレンダー同期をサポートしました。
改善点
- Google Docs 同期忠実度: 適切なタグマッチング(自己完結型タグやネストの不一致への対応)によるフォーマットスパン抽出の改善と、同時編集時の競合検知を強化しました。
- Private Sync アカウント不一致検知: 同期設定のアカウントドロップダウンにおいて、設定された同期用メールアドレスが接続済みの Google アカウントのいずれとも一致しない場合に検知し、「未接続」インジケーターと切り替えオプションを表示するようになりました。
- Teams/Enterprise 有効ティア: ライセンス認証にチーム/エンタープライズの委譲による
effectiveTierを使用するようになり、ユーザーのティアがチームプランから継承されている場合に正しく機能アクセスを保証します。 - 「Private App」を「Private Connection」に名称変更: ユーザー向けの表記をすべて「Private App」から「Private Connection」に変更しました。OAuth 統合を「アプリ」と結びつけにくい非開発者にとって、より明確な表現になります。
- Google OAuth スコープの調整 (
drive.file): 非 BYOA ユーザーに対し、昇格されたすべての Google Drive スコープ(drive、drive.readonly、documents.readonly、spreadsheets.readonly、presentations.readonly)を、より限定的なdrive.fileスコープに置き換えました。これは Google の検証済みアプリの要件に準拠するものです。BYOA ユーザーは引き続きフルスコープを保持します。 - スコープセレクターでの Gmail 権限の可視化: Gmail の読み取り、作成、修正スコープが、BYOA 限定で隠されるのではなく、すべてのユーザーの Google 権限エディタ内の「高度に機密性の高い権限」の下に表示されるようになりました。これらのスコープは同意画面で承認され、Gmail ツールが必要とした際に JIT(ジャストインタイム)で要求されます。
- Google Picker 同意のリカバリ: Google アカウント設定などで外部から Google 権限が取り消された場合、アプリが古いスコープを自動検知して無効化し、再認証と再試行を行うようになりました。これにより、403エラーでサイレントに失敗することがなくなります。
- エージェントの Google Drive ガイダンス: ツールのエラーメッセージや結果が空の場合のヒントにおいて、利用不可能なツールアクションを提案するのではなく、コンポーザーの + ボタンをクリックして Google Drive を選択するようユーザーに促す指示をエージェントに与えるようにしました。
- Slate Drive Picker の簡略化: Slate の「Google Drive から読み込む」において、サイドパネル形式の「Drive で作業する」か「会話に追加する」かを選択する画面をスキップし、直接ファイルを読み込むようにしました。
- 公式 Google Drive ロゴ: ドライブチップと添付メニューにおいて、汎用の緑色の三角形ではなく、公式の Google Drive ロゴを使用するようにしました。
- 統合モデルピッカー: ヘルパーモデルの選択がデフォルトモデルにフォールバックされるようになり、単一の統合されたモデルドロップダウンにまとめられました。
- DOCX 非テキスト要素のパススルー: DOCX の再構成において、テキスト編集フローに含まれない非テキスト要素(画像、チャート、埋め込みオブジェクト)を保持するようにしました。
- PDF マルチセグメント行編集: PDF WYSIWYG エディタが、複数のテキストセグメントにまたがる行を処理できるようになりました。
- 認証レート制限の緩和: BYOA セットアップ中の迅速な OAuth トークン交換に対応するため、認証エンドポイントのレート制限を 10回/分 から 30回/分 に引き上げました。
- OAuth トークンエンドポイントの再分類: OAuth トークン交換を認証レート制限バケットから一般バケットに移動し、マルチスコープ認可フロー中のスロットリングを防止しました。
バグ修正
- iOS モーダルスタッキング: 別のモーダル(ブラウザオーバーレイなど)が表示されている間にファイルピッカーや Slate オーバーレイを提示した際に発生していたクラッシュを修正しました。ピッカーとオーバーレイは常に最前面のビューコントローラーに提示されます。
- Slate 行範囲バリデーション:
get_slate_contentにおいて、startLineがドキュメントの長さを超えている場合に、黙って空のコンテンツを返すのではなく、明確なエラーを返すようにしました。 - サーバーパス・トラバーサル: ストレージキーに対してディレクトリ・エスケープのバリデーションを行うようにし、同期ストレージエンドポイントへのパス・トラバーサル攻撃を防止しました。
- 広告ブロッカーの正規表現制限: DNR コンバーターにおいて、正規表現ルールを Chrome の1000ルール制限内に収め、RE2 のメモリ制限を超える大きな有界量指定子を削除するようにしました。これにより拡張機能のインストール失敗を防止します。
- 拡張アクセス時の OAuth タイムアウト: エージェントが拡張された Google スコープ(Gmail、Calendar)を必要とする際に発生していた120秒のタイムアウトを修正しました。保留中の OAuth 待機時間は BYOA セットアップのために5分に延長され、設定で接続を完了すると一時停止中のエージェントが自動的に再開されます。
- チャット UI のフリーズ: チャットインターフェースをフリーズさせる可能性があった、非同期インターバルの重複とサイレントなブロードキャストエラーを修正しました。
- クラウド同期ダウンロードバッチ: クラウド同期ダウンロードバッチハンドラーにおける TypeScript の null チェックエラーを修正しました。
- Service Worker の動的インポート: Chrome MV3 Service Worker との互換性のため、動的インポートを静的インポートに変換しました。
- BYOA 限定スコープの強制:
convert_to_google_docおよびconvert_to_google_sheetアクションにおいて、広範なエディタ書き込みスコープではなく、正しくdrive.fileのみを要求するように修正しました。 - ドライブチップの形式: 適切な BYOA 限定スコープ制御を備えた、ドライブ参照チップ用の3セグメント形式を実装しました。
- Google Picker CORS: ポップアップスコープフローにおけるクロスオリジンの問題を解決するため、Picker をプライベートリレー上でホストするようにしました。
バージョン 0.9.701 (2025年3月6日)
改善点
- Ollama コンテキストウィンドウ・インジケーター: ローカルモデルを含まない OpenRouter のモデルリストに依存するのではなく、
/api/showエンドポイントにnum_ctxを照会することで、Ollama モデルのコンテキストウィンドウ使用率サークルをレンダリングするようにしました。 - Ollama ツール呼び出し: Ollama の動的ツール選択を修正しました。
tool_choiceを API に渡し(Ollama v0.5.1 以降でサポート)、ツールがアクティブな時は JSON の破損を防ぐために思考モードを無効にし、プライマリモデルがツール呼び出しをサポートしていない場合は軽量な非ストリーミングのヘルパーモデルにフォールバックします。 - OpenRouter 推論キャッシュ: ストリーミングプロバイダーによって推論テキストが途中でクリアされる問題を修正しました。キャッシュのライフサイクルは、Anthropic や Google プロバイダーと同様に、イテレーションの境界で
agent-runnerが管理するようになりました。 - PDF WYSIWYG の信頼性: グローバルなテキスト配置において、PDF.js が複数の TextItem にわたって演算子を分割するケースを処理できるようにしました。エクスポートエラーを防ぐため、一致しないスパン(注釈/ヘッダーテキスト)でのブロック編集を無効にしました。CMap 2バイトデコードにより、1バイト ASCII フォントを使用した Word 生成 PDF が破損しなくなりました。演算子の一致境界チェックにより、空のテキストアイテムでのインデックス範囲外エラーを防止します。
- デスクトッププラットフォーム検出: 動的ツールセレクターは、デスクトップ検出に
caiiooRemindersではなくlocalFolderSync機能を、macOS 検出に Calendar/Reminders ではなくappleScript/appleNotesを使用するようにしました(Calendar/Reminders は EventKit を介して Apple デバイス間で共通であるため)。
Version 0.9.700 (March 5, 2025)
New Features
- File Manager: ネストされたフォルダ、ユーザータグ、スター付け、専用の File Manager UI を備えた完全なファイル管理システム。添付ファイルをフォルダ階層で整理し、タイプ別(スクリーンショット、AI 画像、写真)のフィルタリング、検索、ソート、グリッドまたはリストモードでの表示が可能です。スレッドの自動タグ付けにより、ファイルと会話がリンクされます。manifest v9 による Private sync をサポート。
- Local Folder Sync: ローカルファイルシステムのフォルダと File Manager 間の双方向同期。Mutation 駆動の再同期により、削除、一括削除、移動が 2 秒のデバウンス(重複排除)を経て自動的にディスクへ反映されます。サブフォルダの移動検知により、Caiioo 内で整理を行うとディスク上のファイルも再配置されます。同期ツリー内のサブフォルダに移動すると、自動再同期がトリガーされます。
- Cross-Filetype Tracked Changes: DOCX、PDF、Markdown にわたる統合された承諾/拒否ワークフロー。DOCX の編集は、Markdown やコード Slate で使用されているものと同じ diff エンジンを使用して変更履歴として記録されるようになりました。PDF の変更履歴はビジュアルエディタと統合されています。
resolve_tracked_changesアクションにより、エージェントがプログラムで修正を承諾または拒否できるようになりました。 - PDF WYSIWYG Editing: レンダリングされた PDF ページ上で、ドキュメントに合わせたスタイリングで直接テキスト編集が可能。テキストレイヤーは
textItemIndexを介して編集内容をソースのコンテンツストリームオペレーターにリンクし、エクスポート時に正確な再構築を行います。変更検知用の plainText ベースラインを含みます。 - DOCX Rendering Fidelity: 段落の配置、ハイパーリンク、フォントの色/サイズ、行間、インデント、テーブルセルの網掛けを再現するリッチな DOCX プレビュー。コードビューでは、トークン効率の良い LLM 消費のために Markdown 変換を表示します。
- Universal Messaging (内部テストのみ): WhatsApp、Telegram、Slack を通じて、ローカルファーストのプライバシーを維持したままメッセージの送受信が可能。エージェントはメッセージの作成と送信、会話のリスト表示、スレッドへの返信を行うことができ、すべてユーザー自身のデバイスを経由してルーティングされます。
- Google Meet Integration:
list_meetings(日付範囲指定による最近の会議の検索)とget_meeting(トランスクリプトの取得)を備えたマルチアクション会議リコールツール。資格情報ウォレットのサポートを含む、完全な OAuth/JIT/スコープ承認パイプラインを通じてスレッド化されています。 - Gmail Send Email: Gmail API を介した直接のメール送信。高リスクツール承認によって保護されています。アクションごとのリスクレベルオーバーライドにより、下書きアクションは中リスクのまま、
send_emailには明示的な確認を要求することが可能です。 - Microsoft BYOA: Microsoft 365 の Bring Your Own App サポート。Microsoft OAuth 接続用に Azure AD アプリ登録を登録できます。テナント ID サポートと 3 ステップの Azure Portal セットアップウィザードを備えた、マルチプロバイダー BYOA レジストリ(Google + Microsoft)。
- Poe Provider: Poe の新しい LLM プロバイダー統合。モデル一覧、プロバイダーごとにグループ化されたモデルセレクター、ビジョン/ツール/推論機能の検出、および価格表示を備えています。
- What's New Dialog: API 配信のコンテンツパイプラインにより、リリースノートとユーザーガイドページを提供。非同期の What's New ダイアログが、アップデート時にバージョンのハイライトを表示します。
- Private Sync Account Selector: プライマリ ID にデフォルト設定するのではなく、Private sync に使用する Google アカウントを選択できるようになりました。
- Native TipTap Diff Marks: AI 修正プレビュー用の個別の marked.js レンダリングオーバーレイを、ネイティブの ProseMirror マーク(DiffAdded/DiffRemoved)に置き換えました。修正は一貫したタイポグラフィでインラインの変更履歴としてレンダリングされ、チャンク単位での承諾/拒否ターゲット指定が可能です。
- Mermaid Diagrams: Slate の TipTap プレビューモード内のコードブロックで、Mermaid ダイアグラムのライブレンダリングをサポート。
- Fuzzy Section Search in Help Tool: ヘルプツールが、ドキュメントページ内の特定のセクションを検索する際の曖昧一致(Fuzzy matching)をサポートしました。
Improvements
- File Manager UX Polish: フォルダ同期アイコンのインジケーター、削除確認ダイアログ、Shift + クリックによる範囲選択、幅が狭い時にツールバーを折り返す処理、リロードをまたぐタグの永続化の修正。
- Responsive Composer Layout: 3 ゾーンのフレックスレイアウトにより、幅が狭い時に「新規スレッド」ボタンが画面外に押し出されるのを防止。モードおよびモデルセレクターは、段階的なテキスト非表示ブレークポイントを使用。汎用のデフォルトアイコンをカスタムエージェントおよび AI チップアイコンに置き換え。
- Settings UX: セクションの順序をフローに合わせて再構成(Personalization → Credentials → Tool Approvals → Agent Modes → Tool Configuration → Skills Library → Tool Servers → Document Processing → Voice)。
- Revision State Integrity: アクティブな AI 修正中に大きなコンテンツブロックを削除した際の破損を修正。sourceContent の不変性、チャンク再配置しきい値を 0.7 に引き上げ、古いチャンクの自動拒否、およびバージョン履歴の整合性チェックを導入。
- Agent Loop Reliability: 古い実行が新しい実行のコントローラーを削除してしまう abort controller のレースコンディションを修正。キャンセル信号がキューに入れられたツールに伝播するようになりました。孤立した実行状態は、空白のメッセージを残すのではなくエラーをブロードキャストします。
- Interjection Handling: サーバーと UI で
getActiveBranchMessagesのトラバーサルを統一し、一貫して Interjection(差し込み)をスキップするようにしました。ストリーミングの parentId がユーザーメッセージではなく Interjection を指していた場合に、フォローアップ後にレスポンスが消える問題を修正。 - macOS Native Stability: プロセスエポックトラッキングによる再起動のレースコンディション、再接続時の URLSession リーク、およびパイプハンドラーと停止間の LineBuffer データ競合を修正。
- Google Sheets Fix:
create_tableが最初の行を空白にするのではなく、列ヘッダー名を書き込むようになりました。 - Middleware Cleanup: apple-routes、mcp-routes、attachment-routes にわたる 10 個のインライン認証チェックから
requireAuthミドルウェアを抽出。 - Image Type Filtering: File Manager で、スクリーンショット、AI 生成画像、ユーザー写真を個別のフィルターオプションと独自のアイコンで区別。
- Mode/Model Picker Parity: モードピッカーとモデルピッカーの間でフォントの太さとアイコンのストロークを統一。
- Beta Tier Gating: 資格情報ウォレットが、ベータ機能をティアチェックの背後に制限。
- CIDFont Re-Encoding: PDF の再構築において、ToUnicode CMap テーブルを使用した CIDFont エンコーディングと、マップにない文字の identity フォールバックをサポート。
- PDF Export Renamed: 明確化のため、PDF ワークフロー全体で「Download」を「Export」に名称変更。
Bug Fixes
- PDF Text Disappearing: フォーカスが外れた際に PDF ビューのテキストが消える問題、および WYSIWYG 編集からエクスポートした際にコンテンツが文字化けする問題を修正。
- PDF Tracked Changes Routing: PDF の変更履歴が統合 diff エンジンを経由して PDF 固有のオペレーターデータを破損させるのを防止。
- PDF Export Integrity: PDF のダウンロードがサイレントに Markdown エクスポートへフォールバックするのではなく、診断情報と共に明示的に失敗するように修正。
- Markdown Table Line Breaks: Markdown テーブル内の
<br>タグが、リテラルテキストではなく実際の改行としてレンダリングされるように修正。 - DOCX Tracked Deletions Preserved: ビジュアルビューとコードビューを切り替える際に、DOCX の削除履歴が削除される問題を修正。
- Tracked Changes on Stored Markdown: ストレージから読み込まれた Markdown Slate で
propose_changeを行った際に、変更箇所(redlines)が表示されない問題を修正。 - Reject Reverts Content: Markdown およびコード Slate において、
resolve_tracked_changesで拒否(reject)した際にコンテンツが正しく復元されるように修正。 - Slate Save Loop: 変更履歴がアクティブな時にトリガーされる無限保存ループを修正。
- Messaging Stability: ルーティング、返信スレッド、プロファイル処理、キューの回復力、Webhook 署名、送信者のサニタイズ、およびペイロード制限を修正。
バージョン 0.9.662 (2025年2月27日)
新機能
- Bring Your Own App (BYOA): Caiioo 内蔵のアプリの代わりに、独自の Google OAuth 認証情報を使用できるようになりました。マルチアプリ対応により、チームで単一の OAuth クライアントを共有しながら、個別の API キーを保持できます。BYOA 接続は期限切れのトークンを自動検出し、再認証を促します。
- Wikilink ナビゲーション: Slate ドキュメント間で、Obsidian スタイルの二重ブラケットによる Wikilink が使用可能になり、相互接続されたナレッジベースを構築できます。Wikilink をクリックすると、Slate 間を即座に移動できます。
- Skills メニュー: Tab キーによるスキル挿入、動的な高さのドロップダウン、変数チップを使用したインライン編集、およびコンポーザーから完全な CRUD 操作が可能な共有 SkillForm コンポーネントを実装しました。
- DOCX ダウンロード: Slate の Markdown およびテキストドキュメントを、変更履歴を保持したまま DOCX ファイルとしてダウンロードできるようになりました。
- テーブルの自動入力:
insert_componentが構造化データからテーブルセルを自動入力するようになり、空のプレースホルダーテーブルが作成されるのを防ぎます。 - Gemini 3.1 Flash: 既存の Gemini、FLUX、Seedream モデルに加え、画像生成モデルのオプションとして追加されました。
- 全アカウントでの Google Drive 保存: プライマリアカウントだけでなく、接続されているすべての Google アカウントで Google Drive への保存が可能になりました。
- 統合 Diff エンジン: Slate の変更追跡 Diff システム(フェーズ 0–7)を完全に書き換えました。TOCTOU 安全性、キャッシング、変更ごとの承認/拒否ウィジェット、およびモバイルでのタップによる切り替えサポートが含まれます。
改善点
- 適応型 Private Sync: 同期ポーリングレートがアクティビティに基づいて動的に調整されます。ダウンロード専用ロックの最適化により、競合が減少しました。
- OAuth メールの取得: Google OAuth に常に ID スコープが含まれるようになり、すべての接続でユーザーのメールアドレスが取得されます。一部のアカウントでメールアドレスが空白になる問題が修正されました。
- セキュリティの強化: OAuth PKCE フロー、エージェントのサブプロセス境界、および認証失敗が繰り返された場合のアカウントごとのブルートフォース・ロックアウトを強化しました。
- ブラウザチップのレイアウト: ブラウザセレクターのチップを小型化し、コンテナから溢れる代わりに折り返されるようにしました。
- レジストリ駆動の画像プロバイダー: ハードコードされた画像プロバイダーリストを動的なレジストリに置き換え、新しいモデルの追加を容易にしました。
- コンテンツ i18n パイプライン: すべてのドキュメントページに対して、ハッシュ追跡による統合コンテンツ同期と、増分翻訳サポートを実装しました。
バグ修正
- プレビュー内の数式: TipTap プレビューからコードビューに切り替える際に、数式が破損する問題を修正しました。
- プレビュー内の Wikilink: TipTap プレビューとコードビューを切り替える際に、Wikilink 構文が削除される問題を修正しました。
- スレッドメッセージの消失: STATE_PATCH によってスレッドメッセージが削除されたり、会話の途中でモデルを切り替えた際にメッセージが消えたりする問題を修正しました。
- 割り込みメッセージの孤立: 割り込みメッセージのフィルタリング後に親 ID が孤立し、レンダリングエラーが発生する問題を修正しました。
- Private Sync の無限ループ: コレクションアイテムのクロック競合と thread_data_ プレフィックスの汚染によって引き起こされる無限同期ループを解決しました。
- BYOA のエッジケース: クリア時に BYOA 設定が復元されない問題、非同期保存の競合、拡張機能が launchWebAuthFlow の代わりに無効な localhost ポップアップを使用する問題、および古い issuedByClientId の優先順位の問題を修正しました。
- Private Sync スコープの回復: Google Drive スコープが期限切れまたは不足している場合に、Private Sync のロック解除がサイレントに失敗する問題を修正しました。
- スキルの重複: Private Sync のマージ後にスキルが重複して表示されるのを防止しました。
- 変更追跡のルーティング:
get_tracked_changesとget_commentsを SlateTool のアクションルーティングに接続し、エージェントがリビジョン状態を読み取れるようにしました。 - DOCX ダウンロードのソース: downloadAsDocx がエディタのライブ状態ではなく、古いアーティファクトの内容を使用していた問題を修正しました。
- スマートなモデル名の省略: 長いモデル名がコンパクトなピッカーから溢れないよう、インテリジェントな省略機能を修正しました。
- Markdown リンクのレンダリング: レンダリングされた Markdown リンク内で chrome-extension: および Caiioo: URL がブロックされる問題を修正しました。
- スレッド作成速度: 設定のカスケードルックアップの冗長性を排除することで、スレッド作成時間を半分に短縮しました。
- Chrome タブのタイトル: アクティブな会話スレッドに基づいた動的な Chrome タブタイトルを復元しました。
- 適応型グリーティングトークン: 推論モデルでの切り捨てを防ぐため、適応型グリーティングの max_tokens を引き上げました。
Version 0.9.661 (2025年2月25日)
新機能
- Agent Interjection(エージェントへの介入): AIの実行中にメッセージを入力してEnterキーを押すことで、途中で指示を与えることができます。エージェントは次の判断ポイントであなたの指示を確認し、コースを調整します。キャンセルしてやり直す必要はありません。送信するテキストがある場合、停止ボタンの横にアンバー色のバッジが付いた送信ボタンが表示されます。
- API Tool Management: API統合ツールが
save_tool、list_tools、delete_toolを第一級のアクションとしてサポートしました。これにより、エージェントが発見したAPIを会話から直接簡単に管理できるようになります。無料ユーザーは GET と list_tools を利用でき、Proユーザーはフルセットを利用可能です。 - Live Token Counter: ストリーミング中にトークン使用量とコストがリアルタイムで更新され、各メッセージのフッターに表示されるようになりました。特殊なコスト(画像生成、ウェブ検索)は、各ツールの完了に合わせて段階的に加算されます。
- Auto-Expand Tool Cards: ツールカードは、ストリーミング引数の受信開始時や承認が必要な時に自動的に展開され、正常に完了すると自動的に折りたたまれます。エラーや拒否されたツールは、確認のために展開されたままになります。
- Monaco Diff Editor: Slateのコード修正において、従来のカスタムデコレーションシステムに代わり、Monacoネイティブのインライン差分エディタが採用されました。変更ごとの承認/拒否ボタンが備わっています。
改善点
- Private Sync Auth Recovery: Googleトークンの期限切れや取り消しによるPrivate syncエラー時に、受動的なエラーメッセージではなく、「Googleに再接続」および「権限を付与」という実行可能なボタンが表示されるようになりました。再接続時には正しい Drive 権限を要求し、適切な Google アカウントをあらかじめ選択します。
- Private Sync Multi-Account: Private syncにおいて、最初に接続されたアカウントではなく、設定されたメールアドレスに一致する Google アカウントで認証を行うようになりました。複数の Google アカウントが接続されている場合に、誤った Drive に同期される問題が修正されました。
- Brand Refresh: Caiioo ロゴに由来する新しいリバーブルーとロックグレーのカラーパレットを採用し、アプリ全体とウェブサイトの従来のパープルテーマを刷新しました。
- OAuth Security: 拡張機能パッケージから Google、GitHub、Slack の OAuth クライアントシークレットを削除しました。トークン交換は安全な Cloudflare リレープロキシを経由するようになり、クライアントコードからシークレットが排除されました。
- 起動の高速化: 添付ファイルの内容(画像、抽出テキスト)が起動時ではなくオンデマンドで読み込まれるようになり、多数の添付ファイルがある会話の初期読み込み時間が大幅に短縮されました。
- ストリーミングの高速化: コンテキストウィンドウの使用状況が、ストレージを経由するラウンドトリップではなく、高速なブロードキャストパスを介してストリーミングされるようになりました。これにより、エージェントループごとの非同期 I/O を待たずにリアルタイムの更新が可能になりました。
- Private Sync Speed: Google Drive のファイルIDキャッシュが再起動後も保持されるようになり、最初の同期サイクルでのフルファイルリスティング API コールの必要がなくなりました。
- Unified Streaming Render Path: ストリーミングと最終コンテンツが単一のレンダリングパスを通るようになり、生成完了時のフラッシュ(画面のちらつき)がなくなり、介入メッセージも保持されるようになりました。
- モデル間の切り替え: スレッドの途中で AI プロバイダーを切り替えた際(例:Gemini から Claude)、"Invalid signature in thinking block" エラーが発生しなくなりました。他モデルの思考プロセス(reasoning artifacts)は自動的にナラティブテキストにフラット化され、互換性のない暗号署名を除去しつつコンテキストを保持します。
- 無効化されたツールのガイダンス: AI が無効化されているツールを使用しようとした際、一般的な「見つかりません」というエラーではなく、実行可能な提案(類似の有効なツールや有効化の方法)を受け取るようになりました。
- レスポンシブな Composer レイアウト: Composer ツールバーに段階的な情報開示を採用しました。スペースに応じて、モードセレクター、モデルセレクター、設定、アジェンダ、ヘルプアイコンが表示され、クリップ(切り取られ)されることがなくなりました。
- 設定のカラーコーディング: 設定セクションに3色システムを導入しました。カスタマイズセクションにはアクセントカラー、その他には交互のニュートラルカラーを使用し、視覚的なグループ化を明確にしました。
- オンボーディングエラー: 無料キーの発行時に、サイレントに失敗するのではなく、アクションボタンの下に詳細なエラーメッセージが表示されるようになりました。
- AI Provider 設定: 分かりやすさのため、「API & Provider」セクションを「AI Provider」に名称変更しました。
- 無料トライアルの延長: Pro トライアル期間を7日間から14日間に延長し、新しいユーザーが Pro 機能を探索する時間を増やしました。
- 楽観的なブランチ切り替え: メッセージブランチの切り替えやメッセージの再読み込み時に、ストレージのラウンドトリップを待たずに UI が即座に更新されるようになりました。
- MCP Tool 設定: スキーマの自動修正と MCP ツール設定の改善により、より信頼性の高いツールセットアップが可能になりました。
バグ修正
- メッセージごとのコスト: 個別のメッセージコストの合計が、スレッドヘッダーの合計と一致するようになりました。ヘルパー、OCR、画像生成、検索のコストが、スレッドのサマリーだけでなく個別のメッセージに割り当てられます。
- 介入メッセージのレンダリング: 介入メッセージが、生成完了時に消失することなく、アシスタントのタイムライン内にコンパクトなアンバー色の注釈としてインラインでレンダリングされるようになりました。
- ループ検出: URLが自然に3回以上繰り返される引用の多い回答において、誤検知されていた繰り返し検出を修正しました。
- Slate 差分の配置: マルチラインのチャンクにおいて、オーバーレイループがチャンクの範囲に関わらず1行ずつしか進まなかったため、プレビューモードで赤線/緑線がずれる問題を修正しました。
- Slate 削除位置: 挿入によるシフトの二重カウントにより、削除がペアとなる挿入の前ではなく後にレンダリングされる問題を修正しました。
- Private Sync の修正: コード分割されたチャンク間で JIT スコープリクエストが実行されない問題と、アップロード後の無限同期ループを修正しました。
- オンボーディングフロー: OAuth フローがオンボーディングを正しく完了するよう修正しました。また、トリガー検出でのハイフン付きモード ID のサポート、および残り0日が null に強制変換される問題を修正しました。
- パスワードリセット: メールのリンクによるパスワードリセット時に、メールアドレスの検証を行うようにしました。検証メールの期限が切れたユーザーのために、再送エンドポイントを追加しました。
- ライセンスティア: 管理者からティアを付与されているがライセンス行がないユーザーが、アップグレード画面でスタックしないよう修正しました。
- 設定のスクロール: 学習済みページの脳アイコンをクリックした際、上部の遅延読み込みセクションの影響で手前で止まることなく、正しい設定セクションまでスクロールするよう修正しました。
- Monaco の破棄: 差分エディタモデルの破棄順序を修正し、参照が残ったり TipTap プレビュー越しに Monaco が透けて見えたりするのを防ぎました。
- ウォークスルーのターゲット: ウォークスルーのステップにおいて、レスポンシブなコンテナクエリで非表示になっている要素をスキップするようにしました。左上の 16x16 ピクセルの領域がスポットライトされるのを防ぎます。
- Kokoro TTS: 拡張機能でテキスト読み上げが機能しなかった問題を修正しました。オフスクリーンドキュメントで ONNX ランタイムの検出に失敗し、「利用可能なバックエンドが見つかりません」というエラーが発生していました。
- カスタム API ツールの保存: Service Worker コンテキストで動的な
import()が禁止されているため、エージェントが発見した API をカスタムツールとして保存する際に拡張機能がクラッシュする問題を修正しました。 - 起動パフォーマンス: 設定にアクセスするたびにセッション移行が実行されていた(起動時に20回以上)問題を修正しました。これにより、不要なディスク書き込みが減り、起動が高速化されました。
- ストレージブロードキャストの重複: リレー/サーバーモードで UI のちらつきを引き起こす可能性があった、ストレージ変更通知の二重発行を抑制しました。
- Cairn テクスチャの復元: ロードとレンダリングの間にインメモリのワールドキャッシュが破棄された場合にテクスチャ生成が失敗する問題、および添付ファイルベースのテクスチャでレンダラーが黒く表示される問題を修正しました。
- セキュリティパッチ: fast-xml-parser(DOCTYPE エンティティ展開による DoS)および tar(ハードリンクエスケープの脆弱性)を更新しました。
- MV3 準拠: CDN 経由で読み込んでいた vega-embed をローカルのベンダーバンドルに置き換え、すべてのチャートレンダリングコードが Chrome Web Store のリモートコードポリシーに適合するようにしました。
- Vega-Lite チャート: AI が CDN 経由の HTML ではなく、Slate 内で直接 Vega-Lite ビジュアライゼーションを生成するようになりました。これにより、リモートスクリプトに依存せずにインタラクティブなチャートを利用可能になりました。
- Google Drive 保存: 非エージェントの Drive ハンドラーにおける古い OAuth スコープチェックが原因で、Slate から Google Drive に保存する際に発生していた 403 エラーを修正しました。
- 新規ユーザーのオンボーディング: ログイン中に API キーが自動プロビジョニングされた際、新規ユーザーのオンボーディング画面が完全にスキップされる問題を修正しました。
- OpenRouter OAuth ポップアップ: ポップアップブロックによって OAuth ウィンドウがサイレントに閉じられた際、「接続中...」のスピナーが無限に止まらなくなる問題を修正しました。
- トライアルバナーの文言: トライアルバナーにおいて、モデルがティアによって制限されているという表現を修正しました。Pro 機能(書き込みアクセス、画像生成、カスタムモード)を正確に説明するように更新しました。
- DOCX レビューツールバー: ドキュメントレビューコントロールを表示する際、初期表示までスクロールを遅延させることで、ツールバーのちらつきを修正しました。
- プロンプトへの追加オーバーレイ: コンテンツセキュリティポリシー(CSP)によってオーバーレイロゴがブロックされる問題、および背景の不透明度がテーマと一致しない問題を修正しました。
- メッセージ編集/再読み込みの状態: メッセージの編集、回答の再読み込み、またはブランチの切り替え後に、インメモリの状態が古くなる問題を修正しました。
- サーバーログインのハング: サーバーログインフロー中に WebSocket ストレージ操作が失敗する問題を修正しました。認証が分離され、バックエンドでサーバー ID が解決されている間も、ローカルセッションが即座に動作するようになりました。
- WebSocket 接続のハング: 初期の WebSocket 接続中に AUTH_STATE: ready が届くと、認証の promise が孤立し、接続が完了しなくなるレースコンディションを修正しました。
バージョン 0.9.655 (2025年2月19日)
新機能
- Slack 連携: Slack ワークスペースを接続し、フル OAuth V2 認証による AI 駆動の Slack ツールを有効化
- API ツール資格情報: エージェントが発見した API を、資格情報を保存したカスタム MCP ツールとして保存可能になり、会話をまたいだ再利用が可能に
- 保存済み API バッジ: エージェントが作成した API ツールに「保存済み API」バッジを設定画面で表示し、識別を容易に
- 会話のインポート: ChatGPT、Claude、Gemini、Perplexity、Grok から会話をインポート。エクスポートファイルをアップロードすると、メッセージ履歴、添付ファイル、メタデータを保持したまま Caiioo 形式に変換
改善点
- 学習済み API のネスティング: 学習済み API ツールを設定画面の折りたたみ可能なセクションにグループ化し、整理を改善
- Caiioo ブランディング: 内蔵ツールに Caiioo アイコンを表示し、視覚的な一貫性を向上
- ブラウザ対応リンク: エージェントが開く URL が、設定で選択したブラウザで起動するように変更
- Slate クラウド読み込み: Google ドライブから Slate ドキュメントを読み込む際、不明なエラーではなく JIT OAuth プロンプトを表示するように改善
バグ修正
- DOCX 編集: ネストされたスパン間の段落実行正規表現マッチングを修正し、書式設定された DOCX テキスト編集時のコンテンツ破損を解消
- 検索/置換の安全性: リファクタリング中に失われた構造的 HTML パターンガードを復元し、編集による XLSX/DOCX 内部マークアップの破損を防止
- ツール承認ループ: 単一のエージェント実行中に同じツールに対して承認プロンプトが繰り返される競合状態を修正
- 古い ID: ライセンス同期中の 401 エラー時に古いユーザー ID がクリアされない問題を修正し、再訪ユーザーのオンボーディングにログアウト脱出を追加
Version 0.9.651 (2025年2月17日)
新機能
- 最小権限のパーミッション: Google Workspace ツールにおいて、広範なアクセス権ではなく、各アクションに必要な正確なスコープのみを要求するようになりました。メールの読み取りには読み取り専用権限を、イベントの作成にはカレンダーの書き込み権限のみを要求します。
- 強化された権限ダイアログ: ジャストインタイム(JIT)認証ダイアログに、要求されている具体的な権限、その必要性、および操作が読み取り専用か読み書き可能かが表示されるようになりました。
- 権限セレクター: Google アカウントを手動で接続する際、事前に許可するサービス(Calendar、Gmail、Drive、Docs、Sheets、Slides)とアクセスレベル(読み取り専用 vs 読み書き)を選択できるようになりました。既存の接続には「権限を編集」ボタンが追加されました。
- 画像結果の表示: 生成された画像やスクリーンショットが、折りたたまれたプロセスステップと最終回答の間に目立つようにレンダリングされるようになり、視覚的な出力を確認するためにツール呼び出しを展開する必要がなくなりました。
改善点
- Private Sync の安全性: 同時編集が発生した場合、アップロードではなくマージのためにダウンロードを行うようになりました。ロック更新による所有権の確認、およびマニフェストのマージにより、時期尚早なゴミ箱操作によるデータ損失を防止します。
- P2P Sync の廃止: P2P リアルタイム同期を廃止しました。これにより、100MB 以上の不要な WebSocket トラフィックが削減され、拡張機能のパフォーマンスが向上しました。
- 設定のパフォーマンス: 設定パネルのメモ化(memoization)と折りたたみコンテキストの分離により、レンダリングを高速化しました。
- DOCX レンダリング: ドキュメントパーサーにおける段落のレンダリング、番号付け、およびスタイルのサポートを改善しました。
バグ修正
- Google Docs スコープ: Google Docs のインデックス作成時に発生していた「認証スコープ不足」エラーを修正しました。
index_documentには名前付き範囲のための書き込みスコープが必要でした。 - Google Docs 読み取り: Docs スコープのみが許可されている場合に
read_documentとget_document_infoが失敗する問題を修正しました。これらのアクションには Drive の読み取りアクセスも必要です。 - Calendar コピー:
copy_eventアクションがスコープリポジトリから漏れていたため、JIT 権限リクエストが妨げられていた問題を修正しました。 - API キーの永続性: Pro トライアルの有効化中に
saveCustomModeが設定保存パスでクラッシュし、BYOK API キーが暗黙的に失われる問題を修正しました。 - 設定リロードの競合: 設定セクションの折りたたみ/展開によってストレージのリロードサイクルがトリガーされた際、保存されていない API キーが消去される問題を修正しました。
- Chrome Identity のキャンセル: インクリメンタルなスコープリクエスト中のユーザーによるキャンセルがエラーと区別されない問題を修正しました。また、Web OAuth リフレッシュトークンの取得後に認証メソッドが正しく遷移するようになりました。
- Private Sync の上書き: 同時編集が発生した際に、Private Sync が最近のターンを上書きしてしまう問題を修正しました。
- ビューポートのスクリーンショット: ビューポートのスクリーンショットが最終回答テキストの上に表示されないように修正しました。
- エージェントの調整: ターンの調整、知覚、および状態管理に関する 7 つの問題を修正しました。
- 変更履歴の記録: 二重状態変数の同期ずれにより、スレート分解後に変更履歴モードが壊れる問題を修正しました。
- ファイルマネージャー: 削除およびダウンロードアクションが、孤立したファイルだけでなく、すべてのモードで利用可能になりました。
- MCP ツール名: ツールが人間が読める名前ではなく、内部サーバー ID を使用していた問題を修正しました。
- Agenda ツール: 同期カードに常に権限不足が表示される問題を修正し、Google OAuth 接続システムに統合しました。
バージョン 0.9.642 (2025年2月16日)
改善
- 新規ドキュメント作成: 「新規ファイル」ドロップダウンから作成されたDOCX、XLSX、PDF、RTFファイルが、変更履歴の追跡に対応し、完全に編集可能に
- Geminiの安定性: 推論の繰り返し検知を追加し、Geminiの思考ループを自動的に解除。思考テキストがチャットに漏洩するのを防止
- 画像処理: DNG RAW写真のプレビューがEXIFの向きを尊重するようにし、アップロードされた画像の歪みを防止
バグ修正
- 新規ドキュメントの編集可能性: 「新規ファイル」で作成された空白ドキュメントが静的プレビューとしてレンダリングされる問題を修正
- APIキー検知: 独自のAPIキー(BYOK)への切り替えが、ページ更新なしで即座に反映されるように修正
- スクリーンショットの安定性: 添付ファイルIDの処理を修正し、スクリーンショットデータが消失または破損するのを防止
- タブグループ化: ブラウザに非標準のウィンドウ(devtools、ポップアップなど)がある場合のクラッシュを修正
- コンソールノイズ: 404エラーをスパムしていた不要なllms.txtプローブを削除
- ツールタイムアウト: Geminiによる4K画像生成のような長時間実行されるツール呼び出しを妨げる可能性のある、不安定なキープアライブの回避策を削除
- プロンプトキャッシュ: プロンプトキャッシュ最適化中にマルチモーダルコンテンツ(画像/スクリーンショット)がドロップされる問題を修正
内部
- エラーハンドリング、型安全性、アーキテクチャ層全体にわたる大幅なコード品質の向上
- コアドキュメントパーサーを、焦点を絞った保守性の高いモジュールにモジュール化
バージョン 0.9.641 (2025年2月14日) - ハッピーバレンタイン!
改善点
- モデルセレクターのティアメダル: ハードコードされた推奨バッジを、ベンチマークデータから直接金/銀/銅のランキングを表示する 5 つの API 駆動ティアメダル(Caiioo に最適、品質、信頼性、速度、バリュー)に置き換え
- スキルシステム: 内蔵スキルを再追加するための「デフォルトに戻す」ボタンを追加
- プロンプトキャッシュ: コスト削減のためにプロンプトキャッシュをさらに最適化
バグ修正
- ブラウザ互換性: Vivaldi およびその他の非 Chrome ブラウザで OAuth ログインと自動接続が動作するように修正
- コスト追跡: 実行のキャンセルがコストと使用状況データを上書きする競合状態を修正。キャンセルやエラーが発生した実行でもデータが保持されるように変更
- プライベート同期: purgeAllStorage を完全にクリアするように書き換え、同期リスナーの競合を修正し、プライベート同期 UI を統合
- i18n: conversation.html ポップアップページに不足していた翻訳初期化を追加
- セキュリティ: 依存関係の脆弱性を修正 (qs, @casl/ability, axios, markdown-it)
- ベンチマークページ: ベンチマークページのバックエンドを Cloudflare 認証に移行
バージョン 0.9.65 (2025年2月13日)
改善
- MiniMax M2.5 ベンチマーク: ベンチマークスイートが完了しました — ツールの精度 91%、信頼性 95% (ランク #2)、総合ランク #5 (ゴールドティア)
- Model Intelligence API: デフォルトの応答制限を 100 から 500 に引き上げ、バッジを獲得したすべてのモデルがクライアントに表示されるようにしました
バグ修正
- モデルバッジの欠落: 拡張機能のモデルリストに表示されていなかった、ティアバッジ(ゴールド/シルバー/ブロンズ)獲得済みの 35 モデルを修正しました(Claude Opus 4.6 (ゴールド)、Claude Sonnet 4.5 (シルバー)、Claude Haiku 4.5 (ブロンズ) を含む)。根本原因: API が信頼性順で上位 100 モデルのみを返す仕様でしたが、ティアは全 367 モデルから計算されていたため、信頼性上位 100 位外のモデルのバッジが非表示になっていました。
Version 0.9.64 (2025年2月12日)
改善点
- Ollama プロバイダーの機能パリティ: OpenRouter との完全な機能パリティを実現 — 中断信号(abort signal)のサポート、エラーハンドリング、推論の詳細、解決済みモデル ID、およびストリーミング mixin による think-tag 処理に対応
- AbortSignal の伝播: サブプロセスの SIGTERM/SIGINT が実行中の LLM API 呼び出しをキャンセルするよう改善
- ビルド時のスキーマ検証: ビルド時に設定スキーマの検証を行い、
SETTING_METADATAエントリの欠落を検出 - プラットフォーム機能のキャッシング: アクセスごとの再計算を廃止し、パフォーマンス向上のためにキャッシュ化
- ウェブサイトの i18n: Trust ページと料金体系のリファクタリングに伴う翻訳を、全22ロケールで同期
修正済みバグ
- ウェブサイトの認証: レガシーな Supabase 認証を、Google サインイン、メールログイン、新規登録、パスワードリセット用の直接的な Cloudflare Worker API 呼び出しに置き換え
- Stripe チェックアウトのロケール:
navigator.language(例:en-US)を Stripe がサポートするロケールにマッピングし、フォールバックをautoに設定することで、チェックアウトおよびポータルでの「Invalid locale」エラーを修正 - パスワードの最小文字数: サーバーの新規登録、パスワードリセット、およびウェブサイトのリセットページ間で、最小12文字の制限を同期
- Private Sync プロファイルの重複排除: ログイン時に、以前の同期バグによって作成された重複プロファイルを検出して削除する機能を追加
- State Manager の初期化競合: state-manager における初期化の競合状態(race condition)を修正
- Agent サブプロセスのクリーンアップ: Agent 終了時にゾンビサブプロセスをクリーンアップするよう修正
- Tab Group/Storage API のガード: 各プラットフォームにおける tab group および storage API への適切なガード処理を追加
- ジオロケーションのエラーハンドリング: ジオロケーションの権限エラーに対する猶予ある処理(graceful handling)を実装
- OAuth リフレッシュのロック: OAuth トークンの同時リフレッシュ試行を防止
- 設定保存のミューテックス: 設定の同時保存によってデータが上書きされる問題を修正
- Agent JSON パースの分離: 不正な形式の Agent 出力によってパーサーがクラッシュしないよう修正
- スレッド検索の競合: スレッド検索結果における競合状態を修正
- ストリーミング版の鮮度確認: ストリーミングレスポンス中の古いバージョンのチェック機能を追加
- コンテンツスクリプトのタイムアウト: コンテンツスクリプトのメッセージパッシングにタイムアウトを追加
- マルチモーダル用のコンテキストプルーニング: マルチモーダルコンテンツが存在する場合のコンテキストプルーニング(文脈の削減)を改善
バージョン 0.9.63 (2025年2月12日)
バグ修正
- プライベート同期モード変数: 同期サイクルごとにレガシー設定の移行が実行され、最近のローカル編集(モード変数の変更など)が古いDriveデータで静かに上書きされる問題を修正しました。
バージョン 0.9.62 (2025年2月12日)
新機能
OpenRouter OAuth ワンクリックセットアップ
- PKCE キー作成: 新しいワンクリック OpenRouter OAuth フローにより、Caiioo を離れることなく API キーを作成し、リンクできるようになりました。
- オンボーディングの再設計: OpenRouter OAuth 統合により、オンボーディングおよびアップグレードのフローを簡素化しました。
- プライバシー警告: 無料モデルのオンボーディングオプションにおいて、プライバシーおよびトレーニングデータに関する明確な警告が表示されるようになりました。
きめ細かな Private Sync
- アイテムごとの同期: MCP サーバー、ツールの承認、プロファイル、スキル、モード、オーバーライド、リマインダーが、コレクション全体を上書きするのではなく、個別のアイテムレベルで同期されるようになりました。
- キーごとの設定同期: 設定がキーごとに細かく同期されるようになり、無関係なローカルの変更がリモートによって上書きされるのを防ぎます。
- 読み取りの重複排除: 実行中の WebSocket ストレージ読み取りが重複排除され、不要なネットワークトラフィックが削減されます。
改善点
- モード設定の UX: オーバーライドが自動保存されるようになり、「デフォルトに戻す」で削除されたモード変数が正しく復元されるようになりました。
- レスポンシブな Composer: 幅が狭い場合、スキルボタンがアイコンのみに折りたたまれるようになりました。また、スキルセクションからレイアウトスペーサーを削除しました。
- サポートチケット: ビルドバージョンと日時が自動的に含まれるようになりました。
- Slate 検索: Slate ツールに新しい
search_documentアクションが追加されました。
バグ修正
- Google Slides/Sheets OAuth: セットアップテキストを返す代わりに、適切な
OAuthAuthorizationRequiredErrorをスローするようになり、ジャストインタイムの認証が可能になりました。 - Configuration Tool UI の更新: 設定ツールを介したエージェントの変更が
STORAGE_CHANGEDをブロードキャストするようになり、UI が即座に更新されるようになりました。 - ツール承認モーダル: React フックの順序違反(早期リターンの上の useMemo)を修正しました。
- Localhost HTTPS: API 統合ツールが、ローカル HTTPS サーバーの自己署名証明書を処理できるようになりました。
- モード変数の永続化: i18n ゲッタープロパティがストレージ保存前に実体化せず、リロード時に変数が消失する問題を修正しました。
- Slate スレッドセーフティ: 並列 AI ターン中に Slate が重複して作成される原因となっていた Slate ツールの競合状態を解決しました。
- Slate DOCX: 変更履歴における削除の可視性とベースラインの破損を修正しました。
- Private Sync の安定性: 同期コンフリクトによる編集のバウンドや消失を解消しました。
バージョン 0.9.61 (2025年2月10日)
改善
Slate エディタの国際化 (i18n)
- ツールバーとメニューの翻訳: Slate エディタのすべてのツールバーボタン、コンテキストメニュー、ダイアログ文字列が完全に翻訳されました
バグ修正
- OAuth フェッチタイムアウト: すべての OAuth トークン交換および更新リクエストに 15 秒のタイムアウトを設定し、ネットワーク停止時の無限ハングを防止しました
- GitHub プライベートメール: ユーザーのプロフィールメールが非公開の場合に GitHub 接続が失敗する問題を修正しました(
/user/emailsAPI から取得するように変更) - OAuth 接続ダイアログ: OAuth 接続ダイアログを汎用化し、複数のトークン/接続に関するバグを修正しました
- パスワード長の整合性: すべてのサインアップおよびリセット画面で、パスワードの最小 12 文字要件を同期しました
Version 0.9.6 (2025年2月8日)
新機能
多言語対応 (20言語以上)
- 完全な i18n サポート: Caiioo が英語、スペイン語、フランス語、ドイツ語、日本語、韓国語、中国語、アラビア語、ヘブライ語、ヒンディー語など、20以上の言語で利用可能になりました。
- RTL 言語のサポート: アラビア語、ヘブライ語、ウルドゥー語の右から左へのレイアウトに完全対応しました。
- UI 言語設定: 設定からお好みの言語を選択できます。すべての UI 要素、ツールラベル、ステータスメッセージが翻訳されます。
改善点
設定パネルのパフォーマンス
- セクションの遅延読み込み (Lazy-Loaded Sections): 設定パネルの各セクションが必要に応じて読み込まれるようになり、初期レンダリング時間が短縮されました。
- モジュール化されたストレージ: 設定を単一の巨大なデータとしてではなく、セクションごとの細かいキーで保存するようにし、読み書きのパフォーマンスを向上させました。
- 型定義されたゲッター: 内部設定へのアクセスに、変更の粒度を追跡できる強力な型付きゲッターを採用しました。
Slate 変更履歴の信頼性
- 17件のリビジョンマネージャーの修正: 差分計算、承認、拒否、永続化にわたる変更履歴システムの包括的な強化を行いました。
- プレーンテキストによる差分抽出: 変更箇所の強調表示(レッドライン)において、生の markdown ではなくプレーンテキストで差分を取るようにし、よりクリーンで正確なハイライトを実現しました。
- ユーザー変更の永続化: ユーザーが行った変更履歴が、ページの更新後も保持されるようになりました。
- 競合状態の修正: 保存前に変更履歴を強制的に確定(Force-bake)させることで、データ損失を防止しました。
バグ修正
- Service Worker のクラッシュ: Chrome の Service Worker のクラッシュを防ぐため、112箇所以上の動的な
import()呼び出しを静的インポートに置き換えました。 - モードのウェルカムメッセージ: モードごとのウェルカムメッセージにおける言語、プロビジョニングされたキーの検出、および永続化の問題を修正しました。
- Google ツールのプロファイル選択: アカウントピッカーが、実際に接続されているアカウントを動的に反映するように修正しました。
- DOCX の入れ子リスト: 入れ子になったリストの往復変換(インポート/エクスポート)における表示マーカーとエクスポートの破損を修正しました。
- LaTeX 数式レンダリング: 通貨のドル記号のエスケープが、数字で始まる LaTeX 数式表現を壊してしまう問題を修正しました。
- タブグループの作成: Web ブラウジングツールが実際に使用されるまで、タブグループの遅延作成を延期するようにしました。
- Agenda OAuth: ジャストインタイム認証が正しくトリガーされるよう、OAuth エラーを再スローするようにしました。
- 設定の永続化: サイレントに保存に失敗していた6つの設定項目について、不足していたメタデータエントリを追加しました。
バージョン 0.9.5 (2025年2月6日)
セキュリティの強化
- コンテンツスクリプトのオリジン検証: ウェブページから拡張機能へのメッセージ送信を caiioo.ai オリジンのみに制限し、厳格な同一オリジンチェックによりクロスオリジンメッセージインジェクションを防止します
- CSP の厳格化: 拡張機能ページのコンテンツセキュリティポリシー(CSP)から、開発専用の localhost スクリプトソースを削除しました
- 認証レスポンスのスコープ制限: 拡張機能の認証レスポンスを、すべてのフレームにブロードキャストするのではなく、特定のページオリジンに送信するように変更しました
バージョン 0.9.4 (2025年2月4日)
新機能
多言語音声入力 (Speech-to-Text)
- 言語選択: 設定で STT 言語を選択し、英語以外の音声入力の精度を向上
- 90 以上の言語に対応: Whisper および ElevenLabs と連携し、広範な言語をカバー
リアルタイム音声アクティビティ検出 (VAD)
- 低遅延 VAD: 新しい Silero VAD v5 統合により、最小限の遅延でリアルタイムに音声を検出
- スマート録音: 音声アクティビティに基づいて録音を自動的に開始・停止
- 誤検出の低減: 音声と背景ノイズの識別精度を向上
サジェスト表示の切り替え
- サジェストの表示/非表示: AI のフォローアップサジェストを非表示にするトグルを追加し、インターフェースをすっきりと整理
- 状態の保持: 設定はセッションをまたいで保存・記憶されます
改善
変更履歴の自動ベイク
- 差分ベースの追跡: 差分アルゴリズムを使用して変更追跡を効率化
- 自動保存: 長時間の編集セッション中のデータ損失を防ぐため、変更を定期的に保存
- 終了時のスナップショット: 変更追跡モードを終了すると、保留中のすべての変更が自動的にベイクされます
プロバイダーストリーミングの強化
- Gemini の改善: Google Gemini モデルのストリーミングと推論能力を向上
- 一貫した動作: OpenRouter とネイティブプロバイダー間でストリーミング動作を統一
バージョン 0.9.3 (2025年1月31日)
新機能
ガイド付きオンボーディング・ウォークスルー
- インタラクティブ UI ツアー: API キー入力後、インターフェースのすべての部分を案内するステップバイステップのウォークスルーを追加
- 3つのフェーズ: コンポーザー(11ステップ)、設定パネル(7ステップ)、モードシステム(5ステップ)をカバー
- スポットライト効果: 各ステップで関連する UI 要素をスポットライトで強調表示
- 対話型オンボーディング: AI ガイドによるプロフィール作成で、最初から体験をパーソナライズ
プロンプト履歴
- 過去のプロンプトへのアクセス: 最近のプロンプトが保存され、コンポーザーからアクセス可能に
- クイック再利用: 以前のメッセージを簡単に再利用または修正可能
広告ブロックレベル
- きめ細かな制御: 広告ブロックがオン/オフだけでなく、複数のレベルをサポート
- 保護レベルの選択: ブラウジングのニーズに合わせたブロックレベルを選択可能
- DOCX レビューツールバー: 変更履歴のある Word 文書を表示する際の新しいツールバー。編集内容の承諾/拒否を簡単にレビュー可能
改善点
スレッド保持設定
- クリーンアップ設定: 自動クリーンアップまでの古いスレッドの保持期間を設定可能
- ストレージ管理: 会話履歴のより良い制御を実現
Caiioo アニメーション
- パフォーマンス最適化: レンダリングの改善によりアニメーションがよりスムーズに
- ウェットネス効果: 水の飽和を示す新しい視覚オーバーレイを追加
- 直接パーティクルレンダリング: 最適化されたパーティクル描画によるクリアな視覚効果
プロフィール切り替え
- 強化された状態管理: プロトコル処理の改善により、より信頼性の高いプロフィール切り替えを実現
- 同期の改善: プロフィールの変更が拡張機能全体で正しく同期されるように改善
Google カレンダー
- トークン管理: カレンダー操作のアクセストークン処理を改善
- 信頼性の高い同期: カレンダー連携の OAuth フローを改善
バージョン 0.9.2 (2025年1月26日)
新機能
広告およびトラッカーのブロック
- 内蔵広告ブロック: MV3 対応の declarativeNetRequest を備えた Ghostery エンジンを使用して広告とトラッカーをブロック
- 設定で切り替え: 設定パネルから広告ブロックの有効/無効を切り替え可能
- フィルタリストの更新: 信頼性の高いブロックのためにフィルタリストを自動キャッシュ
ジャストインタイム Google 権限
- 段階的な承認: Google ツールの権限を事前ではなく、必要な時にのみ要求するように変更
- 明確なスコープ管理: 不足しているスコープがある場合に、アクセス許可のオプションを含む役立つエラーメッセージを表示
- プライバシーの向上: 各ツールに必要な特定の Google スコープのみを要求
改善点
Caiioo アニメーション
- 強化された物理演算: 高度、速度、密度フォースの改善によりパーティクル力学を向上
- スムーズな流れ: パーティクルが生成時にチャネルの方向に追従し、塊を軽減
- リアルな積み重なり: 小石やダムによってブロックされた際にパーティクルが自然に積み重なるように改善
Google OAuth フロー
- 高速サインイン: 認証を高速化するために ID トークンの取得を優先
- 信頼性の向上: トークン処理の改善により、非 Chrome ブラウザでの認証失敗を低減
オンボーディングと設定
- プレビューモード: ユーザーデータを消去せずにオンボーディングフローをテスト可能
- クリーンな無料枠: 非推奨のプロビジョニング済み API キー復元 UI を削除
内部
- ミニゲームシステム: インタラクティブなイントロ体験のための新しい MinigameContainer インフラを追加
- 隠しイースターエッグ: ミニゲームの表示状態をセッション間で保持
Version 0.9.1 (2025年1月25日)
新機能
インタラクティブな水のシミュレーション
- Caiioo Intro: ローディング画面に新しいインタラクティブな流体シミュレーションを追加。S字型のダイナミックなチャネルを流れる水を体験できます。
- ドラッグ可能な小石: 小石を動かして水の流れを変えたり、ダムを作ったりすることが可能です。
- 堆積物のダイナミクス: リアルな侵食と堆積を再現。流れの速い水は堆積物を巻き上げ、流れの遅い場所では堆積します。
- テーマ適応: 水の色は、選択したテーマのティントカラーに自動的に一致します。
Vega/Vega-Lite チャートのサポート
- インタラクティブな可視化: Slate 内で Vega および Vega-Lite チャートを直接表示・編集できます。
- データビジュアライゼーション: 棒グラフ、折れ線グラフ、散布図、および複雑なマルチレイヤーの可視化を作成可能です。
- Spec 編集: JSON 仕様を編集し、変更をリアルタイムでレンダリング結果に反映できます。
Mermaid ダイアグラムのサポート
- ダイアグラムの種類: フローチャート、シーケンス図、クラス図、状態遷移図などを作成できます。
- ライブプレビュー: Mermaid 構文を編集しながら、即座にビジュアルプレビューを確認できます。
- エクスポートオプション: ダイアグラムは SVG としてレンダリングされ、どのようなサイズでも鮮明に出力されます。
ファイル作成テンプレート
- クイック作成メニュー: Slate でファイルを作成する際、一般的なファイル形式のテンプレートを含む新しいドロップダウンメニューが表示されます。
- テンプレートカテゴリ: Markdown、コードファイル、データ形式、ダイアグラムなどが含まれます。
- ワンクリックで開始: 適切な構造を持つ新しいドキュメントをすぐに作成できます。
改善点
API エラーハンドリング
- 視覚的な通知: API エラーが、閉じることが可能なトースト通知として表示されるようになりました。
- 自動非表示: キャンセルなどの非クリティカルなエラーは、数秒後に自動的に消去されます。
- より明確なメッセージ: エラーメッセージの改善により、問題の特定と解決がより迅速に行えるようになりました。
プラットフォーム機能
- スマートな機能検出: 特定のプラットフォームを必要とする機能(macOS 上の Apple Calendar など)が自動的に検出されるようになりました。
- 適切なフォールバック: ツールがサイレントに失敗するのではなく、環境に適応して動作します。
- Apple ツールの改善: Apple Reminders が「未完了にする」アクションおよびリストアクションをサポートしました。
Safari および非 Chrome ブラウザ
- OAuth フローの改善: Google サインインのブラウザ検出を改善しました。
- フォールバックメカニズム: 非 Chrome ブラウザにおいて、より信頼性の高い認証パスが提供されるようになりました。
バージョン 0.9.0 (2025年1月22日)
新機能
データの自動クリーンアップ
- ストレージ管理: 保持設定に基づいて、古いスレッドや添付ファイルを自動的にクリーンアップ
- 設定可能なポリシー: 自動クリーンアップまでのデータ保持期間を設定可能
GitHub 同期
- GitHub へのバックアップ: Caiioo データを GitHub リポジトリに同期し、バックアップとデバイス間アクセスを可能に
- スマートな競合解決: 複数のデバイスからの変更をデータ損失なしで自動マージ
- 選択的同期:
.gitignoreスタイルのパターンで同期するデータを制御
GitHub ツール
- AI GitHub 連携: AI がお客様に代わって GitHub と対話可能に。イシュー作成、リポジトリ閲覧、プルリクエスト管理などが可能
- リポジトリ閲覧: AI にコードベースの探索、ファイルの検索、プロジェクト構造の理解を依頼可能
改善点
ブラウザ自動化
- 強化されたページ操作: 複雑なウェブページでのクリック、スクロール、フォーム入力の信頼性を向上
- スマートなツール選択: AI が各タスクに対して適切なツールをより正確に選択するように改善
ドキュメント処理
- Word 文書の改善: DOCX ファイル内の表、リスト、書式の処理を向上
- Google スライド: スライドの書式、図形、レイアウトの制御を強化
設定と UI
- 拡張された設定パネル: 整理されたより多くの構成オプションを追加
- 改善されたスレッドリスト: 会話のソートとフィルタリングを向上
- 位置情報の権限: 位置情報ベースのクエリに対して権限を付与する際のフローを明確化
バージョン 0.8.9 (2025年1月19日)
新機能
Google スライド統合
- AI プレゼンテーション: 新しい Google スライドツールで、AI がスライドの作成、読み取り、編集を実行可能
- フルスライド制御: スライドの作成、テキストボックス、画像、図形、表の追加
- テンプレートサポート: 組み込みテンプレートの使用や、白紙からの作成に対応
- 共同編集: 既存の Google アカウント接続で動作
改善
コード品質
- TypeScript の修正: コードベース全体の型エラーと未使用のインポートを整理
- テストカバレッジ: テストフィクスチャを現在の型定義に合わせて更新
バージョン 0.8.8 (2025年1月17日)
新機能
Resemble.ai テキスト読み上げ (TTS)
- プロフェッショナルな音声合成: 高品質な AI 音声生成のための Resemble.ai 統合
- ストリーミングオーディオ: 応答性の高い音声出力のためのリアルタイムオーディオストリーミング
- 設定可能な音声: 複数のプロフェッショナルな音声オプションから選択可能
- 切り捨て警告: 合成のために長いテキストが切り捨てられる際の明確なフィードバック
カレンダー同期サービス
- バックグラウンド同期: Google カレンダーとの自動同期
- 増分更新: 効率化のため、変更されたイベントのみを同期
- アラームベースのスケジューリング: Chrome アラームを使用した信頼性の高い同期スケジュール
改善
デスクトップアプリ (Electron)
- スリープ解除検出: Mac のスリープ解除を検出し、OAuth トークンを自動的に更新
- 信頼性の向上: 長時間のスリープ後も OAuth 接続を維持
リッチコンポーザー入力
- 構成の強化: 書式設定サポートを改善し、メッセージ入力を強化
- タブ補完: タブ参照のサジェスト応答性を向上
Version 0.8.71 (2025年1月15日)
新機能
Thread Search
- 会話の検索: スレッドリストに新しい検索ボックスを追加し、タイトルや内容からスレッドを素早く検索可能に
- インスタントフィルタリング: 入力と同時にフィルタリングが実行され、一致するスレッドがハイライト表示で即座に出現
- スマートなデバウンス: 数百のスレッドがある場合でも、検索が遅延しないよう最適化
Physics Simulation Tool
- AI駆動の物理演算: AIが物理計算やシミュレーションを実行できる新しい物理ツール
- 放物運動: 軌道の計算、衝突予測、運動問題の解決
- 構造解析: 構造物の応力、梁の曲げ、座屈、安定性の解析
- 材料特性: 一般的なエンジニアリング材料(鋼鉄、アルミニウム、木材、コンクリートなど)のデータベースを内蔵
- 物理公式: 運動エネルギー、運動量、力、力積の計算
Cairn World Builder の強化
- 物理エンジン: リアルなシミュレーションを実現する Rapier3D 物理エンジンの完全統合
- ジョイントと拘束: ボディ間にヒンジ、スライダー、ボールジョイント、固定接続を作成可能
- センサーとトリガー: オブジェクトの進入・退出を検知するセンサー領域の定義
- キャラクターコントローラー: 重力、ジャンプ、衝突判定を備えた一人称視点キャラクター
- ゲームモード: インタラクティブな探索のための、固定タイムステップによるリアルタイム物理演算
改善点
Private Sync v2
- 増分同期: 各スレッドと添付ファイルが、一つの大きなファイルではなく個別に同期されるように変更
- 同期の高速化: 変更されたアイテムのみがアップロードされるため、大規模なライブラリの同期時間を大幅に短縮
- 競合解決の向上: アイテムごとのベクトルクロックにより、より正確なマージ解決が可能に
- API コールの削減: スマートな差分抽出により、Google Drive API のリクエスト数を削減
同期の信頼性
- 拡張機能とサーバーの整合性: 添付ファイルストレージを修正し、両方のプラットフォームでベクトルクロックを正しく追跡
- トゥームストーン・フィルタリング: 削除されたプロファイルが、拡張機能とサーバーの両方で正しく非表示になるよう修正
バージョン 0.8.70 (2025年1月14日)
新機能
プライベート同期 (無料プラン)
- デバイス間同期: Google Driveを介して、スレッド、設定、添付ファイルをすべてのデバイス間で同期します
- エンドツーエンド暗号化: すべての同期データは、デバイスから離れる前にパスフレーズで暗号化されます
- 自動バックグラウンド同期: スマートデバウンス機能により、30秒ごとに変更が自動的に同期されます
- 競合解決: CRDT形式のベクトルクロックにより、デバイス間での変更が正しくマージされます
改善点
プライベート同期の効率化
- ポーリングの削減: API呼び出しを減らすため、同期インターバルを3秒から30秒に延長しました
- スマートデバウンス: 変更が落ち着いてから10秒待機した後に同期を開始します
- 実行中の保護: AIによってアクティブに処理されているスレッドは、完了するまで同期から除外されます
バージョン 0.8.69 (2025年1月14日)
新機能
Slate リビジョンナビゲーション
- 変更間の移動: エディタ内の保留中のリビジョンチャンク間を移動する新しいナビゲーションボタン
- 変更カウンター: 保留中のリビジョン内の現在位置(例: 「2 / 5」)を表示
- キーボードショートカット: Alt+Up/Down でキーボードから手を離さずにチャンク間を素早く移動
改善
ドキュメント処理
- リモート OCR フォールバック: ローカルでの PDF テキスト抽出が失敗または精度が低い場合、クラウド OCR で自動処理して精度を向上
- 処理ステータス: ドキュメントがリモートで処理されていることをリアルタイムで表示
推論モデルのサポート
- マルチターン推論: 会話ターン間での推論詳細のキャッシュを改善し、拡張思考モデルの継続性を向上
- メッセージのクリーンアップ: 内部システムノートをレンダリングされたメッセージから削除し、指示漏れを防止
バージョン 0.8.68 (2025年1月11日)
新機能
長期記憶
- コンテキストの永続化: AIが会話全体を通して長期記憶を保持し、ユーザーの好みやワークフローに関する重要なコンテキストを記憶するようになりました
- 使用状況の追跡: トークン使用量とコストの追跡を強化し、詳細なログ記録が可能になりました
モデルのインテリジェンス
- スマートモデル選択: 使用パターンに基づいて最適なモデルを特定する新しいモデルインテリジェンス機能を搭載しました
- ランキングシステム: パフォーマンスと価値の指標に基づいてモデルがランク付けされます
改善点
ストレージの信頼性
- クロスプラットフォームストレージ: モデルキャッシュ、ツール承認、学習済みページが、拡張機能、サーバー、LANモード間で確実に動作するようになりました
- 認証タイムアウト: リレーサーバー接続時のハングアップの可能性を修正しました。無期限に待機するのではなく、5秒後に正常にタイムアウトします
- 設定の読み込み速度: 拡張機能の再読み込み後、設定とモデルピッカーの読み込みが高速化されました
コンテンツのページネーション
- 適切なページサイズ: Webページコンテンツが、ハードコードされたデフォルト値ではなく、実際のモデルのコンテキストウィンドウ(例: 131kトークン)に基づいて分割されるようになりました。これにより、高コンテキストモデルを使用する際に、より大きなページチャンクが表示され、ページ数が削減されます。
バグ修正
- APIキーの永続化: LANモードを一時的に有効にしてから無効にした後に、OpenRouter APIキーが「忘れられる」問題を修正しました
バージョン 0.8.67 (2025年1月7日)
新機能
Kokoro TTS - ローカルニューラルテキスト読み上げ
- 高品質な音声: Kokoroは、複数の音声で自然な発話を実現するローカルニューラルTTSモデルです
- APIキー不要: WebGPU/WASMを使用してデバイス上で完全に動作するため、クラウドサービスやAPIキーは不要です
- 複数の音声: アメリカ英語、イギリス英語、その他のアクセントオプションから、男性/女性のバリエーションを選択できます
- 長文サポート: ストリーミング合成により長文を適切に処理します。30秒で途切れることはありません
- クリーンな音声: 読み上げ前にマークダウン形式(太字、斜体など)を自動的に削除します
改善点
音声設定
- 音声セクションの統合: TTSとSTTの設定をよりクリーンなレイアウトに統合しました
- 音声プレビュー: 使用前に選択した音声を確認できます
バージョン 0.8.66 (2025年1月7日)
改善点
設定パネル検索
- フィルター検索: 設定の上部に新しい検索ボックスを追加し、キーワードでセクションを素早く絞り込めるようになりました
- インスタント結果: 入力して絞り込むと、一致するセクションが即座に表示されます
- キーボード対応: 設定を開くと自動的に検索ボックスにフォーカスされます
MCPサーバーの信頼性
- 起動検証: MCPサーバーは、成功を返す前に実行中であることが検証されるようになりました
- エラーメッセージの改善: 起動中にMCPサーバーがクラッシュした場合、一般的な失敗ではなく実際のエラーが表示されるようになりました
- サンプルの修正: サンプルのパッケージ名を
@modelcontextprotocol/server-*(@anthropic/mcp-server-*ではなく)を使用するように修正しました
macOSアプリの認証
- 自己検証トークン: WebSocket状態同期の前にMCPサーバーを追加した際に発生する401エラーを修正しました
- 認証の高速化: HTTPエンドポイントがWebSocket接続を待機する必要がなくなりました
バージョン 0.8.65 (2025年1月6日)
新機能
ElevenLabs 音声連携 (BYOK)
- クラウド TTS: ElevenLabs を使用した高品質なテキスト読み上げ。複数の音声とモデルから選択可能
- クラウド STT: リアルタイムストリーミング(レイテンシ約150ms)と90以上の言語をサポートする Scribe 文字起こし
- 音声選択: 設定で ElevenLabs の音声ライブラリから直接ブラウズして選択可能
- モデルオプション: Flash v2.5(超高速 約75ms)、Turbo v2.5、または Multilingual v2(最高品質)から選択可能
- 独自のキーを使用: お客様の ElevenLabs API キーを使用。Caiioo からの追加費用はなし
多言語 Whisper モデル
- Whisper Tiny Multilingual: 99言語をサポートする新しいローカル STT オプション(ダウンロードサイズ約39MB)
- 英語専用と同じサイズ: 英語専用の Whisper Tiny と同じコンパクトな 39MB
- 言語検出: 話されている言語を自動的に検出
Google ドキュメントの読み書き強化
- デフォルトで Markdown: 書き込み時のテキストはデフォルトで markdown 形式になります。既存の書式を保持してプレーンテキストを挿入する場合は
useMarkdown: falseを使用してください。 - リッチな書式設定: markdown の見出し、太字、斜体、打ち消し線、リンクを Google ドキュメントのネイティブスタイルに変換
- リストと表: ネストされた順序付き/順序なしリストと markdown の表をサポート
- 提案の追跡: 保留中の提案をセマンティックタグで表示:挿入は
<ins>追加テキスト</ins>、削除は<del>削除テキスト</del>。隣接するタグは置換を示します。 - インラインコメント: 作成者属性付きのインラインコメントを表示:
<comment author=\"名前\" on=\"引用テキスト\">内容</comment>。スレッド用のネストされた<reply>タグもサポート
改善点
Gemini Extended Thinking
- 思考シグネチャの改善: ストリーミングチャンク間での Gemini の thought_signature の処理を改善し、マルチターン ツール使用時の思考の継続性を向上
バージョン 0.8.64 (2025年1月5日)
新機能
Google Sheets セルメタデータ
- ハイパーリンクとノートの読み取り:
includeMetadata: trueを使用して、セルからハイパーリンク、ノート、データ検証ルールを取得可能に - ハイパーリンクの追加: カスタム表示テキスト付きのクリック可能なハイパーリンクを追加する新しい
update_cell_metadataアクション - ノートの追加: プログラムでセルにノートやコメントを添付可能に
- データ検証: セルに対してドロップダウン、数値範囲、テキスト検証、カスタム数式ルールを作成可能に
Safari タイリング (macOS)
- スマートウィンドウ配置: サイドパネルからリンクを開く際、Safariウィンドウがサイドパネルの隣に自動配置され、並べてのブラウジングが容易に
- 画面スペースの最適化: タイリングロジックが利用可能な画面スペースに基づいて最適なSafariの配置を計算
- モード変更時の再タイリング: サイドパネルのモード変更時にSafariウィンドウが自動的に再配置
macOS サイドパネルでのコピー/ペースト
- 完全なコピー/ペーストサポート: macOSサイドパネルアプリでコピー&ペーストが確実に動作するように
- システムキーボードショートカット: 標準の ⌘C/⌘V ショートカットが期待通りに動作
改善点
macOS サーバーの信頼性
- シグナル処理: パイプシグナルの処理を改善し、予期しないアプリ終了を防止
- 再起動の信頼性: サーバーの停止および再起動操作において、適切なクリーンアップを行い信頼性を向上
- 接続の安定性: リトライロジックと指数バックオフを用いたOAuthトークン更新の処理を改善
Safari Extension
- 安定したブラウザID: Safari extensionが安定したブラウザIDを生成するようにし、再接続時の重複エントリーを防止
- よりクリーンな再接続: サーバー側のブラウザ登録において、クライアントが提供する安定したIDを使用し、再接続処理をクリーン化
モデルセレクター
- 選択項目へのスクロール: モデルドロップダウンを開いた際、現在選択されているモデルまで自動的にスクロールするように
macOSアプリでのタブ参照
- サイドパネルでの動作: タブ参照とコンテキストが、Chrome extensionだけでなくネイティブのmacOSサイドパネルでも動作するように
バージョン 0.8.63 (2025年12月31日)
新機能
音声出力 (Text-to-Speech)
- 読み上げ: AI の回答を Microsoft Edge TTS を使用して読み上げ可能に
- 自動再生オプション: 設定で新しい AI の回答を自動的に読み上げる機能を有効化可能
- 速度制御: 再生速度を 0.5倍から 2倍まで調整可能
- 一時停止/再開: 各メッセージの一時停止および再開ボタンで再生を制御可能
ローカル音声文字起こし (Whisper)
- Whisper アップグレード: より正確な音声入力のためにローカルの Whisper 文字起こしを選択可能に
- モデルのダウンロード: オフライン使用のために Whisper Tiny モデル(約40MB)をダウンロード可能
- プライバシー: 音声はローカルで処理され、外部サーバーに送信されることはありません
- フォールバック: Whisper が利用できない場合は Web Speech API にフォールバック
統合アジェンダツール
- 単一ツール: カレンダーとリマインダーの操作を統合した新しい
agendaツール - マルチプロバイダー: Google カレンダー、Apple カレンダー、Apple リマインダー、および Caiioo リマインダーに対応
- エージェントにとってよりシンプルに: すべてのスケジューリングニーズに対応する1つのツールインターフェース
改善点
設定パネル
- 折りたたみ状態の保持: セクションの開閉状態をセッション間で記憶するように変更
- 音声設定: TTS および STT の設定を行うための新しいセクションを追加
バージョン 0.8.62 (2025年12月31日)
新機能
DOCXリストサポート
- 番号付きリスト: 番号付きリストを含むWordドキュメントが適切なフォーマットで正しくレンダリングされるようになりました
- 箇条書きリスト: 箇条書きリストが保持され、正確に表示されます
- ネストされたリスト: HTMLプレビューでマルチレベルリストのインデントが維持されます
スプレッドシートのCSVエクスポート
- CSVとしてエクスポート: XLSXファイルをCSVとしてエクスポートし、簡単にデータ抽出ができるようになりました
- フォーマット選択: スプレッドシートの添付ファイルをダウンロードする際にXLSXかCSVを選択可能
バージョン 0.8.61 (2025年12月30日)
新機能
ツール承認ワークフロー
- インタラクティブな承認: 一部のツールでは、実行前にユーザーの承認が必要になりました。アクションの承認または拒否を求めるモーダルが表示されます。
- ステータス追跡: ツール実行のタイムラインに「承認待ち」および「拒否」の状態が表示されるようになりました。
- デフォルトで安全: 機密性の高い操作は、ユーザーの明示的な同意が得られるまで待機します。
現在地変数
- {{currentLocation}}: プロンプトに現在の位置情報を追加するための新しい変数です。
- 位置情報権限: 初回使用時にブラウザの位置情報権限が必要です。
- コンテキスト認識: 「近くのレストラン」や旅行計画など、場所に基づいたクエリに最適です。
スレッドの一括管理
- 複数選択モード: 選択モードを切り替えて、複数のスレッドを一度に選択できます。
- 一括削除: 選択したスレッドを一度のアクションで削除できます。
- 一括アーカイブ/エクスポート: 複数のスレッドを同時にアーカイブまたはエクスポートできます。
Slateの画像ビューア
- 専用ビューア: 画像がSlate内のフルスクリーンビューアで開くようになりました。
- ズームコントロール: 大きな画像を拡大/縮小したり、パン操作したりできます。
- ダウンロードオプション: 画像をローカルに保存するためのクイックダウンロードボタンを追加しました。
改善点
推論の表示
- 集約の改善: モデルの思考/推論ブロックが重複することなく適切に結合されるようになりました。
- 表示の整理: 拡張思考モデルからの推論コンテンツが、より確実に表示されるようになりました。
Ollama統合
- 推論のストリーミング: ローカルのOllamaモデルからの推論/思考コンテンツをリアルタイムでストリーミングします。
- モデルハンドリングの改善: Mistralモデルとの互換性および厳格なメッセージ順序要件への対応を改善しました。
添付ファイル管理
- 孤立ファイルのクリーンアップ: どのスレッドにもリンクされていない孤立した添付ファイルを管理するための新しいダイアログを「設定」に追加しました。
- スレッドへの割り当て: 孤立した添付ファイルを既存のスレッドに移動できます。
- 一括削除: 孤立したファイルをクリーンアップしてストレージ容量を解放できます。
Slateのデフォルト設定
- デフォルトでMarkdown: タイプを指定せずに新しいSlateを作成する場合、デフォルトでMarkdown (.md) 形式が選択されるようになりました。
バージョン 0.8.6 (2025年12月19日)
新機能
ブラウザ自動化の待機アクション
- 個別の待機タイプ: ブラウザ自動化に4つの特殊な待機モードを持つ
waitアクションを追加:timeout- 基本的なタイミングのための単純な遅延(デフォルト1000ms、最大30000ms)selector- 要素が表示または非表示になるのを待機(スピナー/ローダーに便利)network_idle- fetch/XHRリクエストが落ち着くのを待機(拡張機能のみ)animation- CSSアニメーションとトランジションが完了するのを待機
- スマート要素の可視性: セレクター待機は、正確な可視性検出のために表示、可視性、不透明度、offsetParentをチェックします
改善点
ブラウザ自動化アーキテクチャ
- スクリプト実行の統一: 新しい
executeInPage抽象化により、Chrome拡張機能とリレー/サーバーコンテキスト間で一貫した動作を保証 - MAINワールド実行: ページレベルのJavaScript(fetch, XHR)をインターセプトする必要がある操作のための適切なMAINワールドスクリプト実行
- 正常な劣化: 拡張機能専用機能は、リレーモードで使用された際に代替案を含む役立つエラーメッセージを提供します
バグ修正
OAuthトークン更新
- Chrome拡張機能のトークン更新: ChromeのキャッシュされたOAuthトークンが適切に更新されない古いトークンの問題を修正。トークンは検証され、再試行前に古いトークンはクリアされます。
- PKCE認証フロー: OAuthポップアップは、クライアントシークレットを必要とせずに適切な更新トークンサポートを可能にするため、暗黙的フローの代わりにPKCEを使用した認可コードフローを使用します。
- 直接トークン更新: 更新トークンを持つ接続は、バックエンドサーバーを必要とせず、Googleのトークンエンドポイントを使用して直接更新できるようになりました。
- トークン検証: 取り消された/無効なトークンを早期にキャッチし、自動再認証をトリガーするためのトークン検証ステップを追加しました。
バージョン 0.8.5 (2025年12月19日)
新機能
Apple カレンダー連携
- ネイティブカレンダーアクセス: 新しい Apple カレンダーツールにより、EventKit を介して macOS のカレンダーに高速かつネイティブにアクセス可能になりました
- 統合アジェンダ: 接続されたすべてのアカウント(Google カレンダー + Apple カレンダー)のリマインダーとカレンダーイベントを統合表示します
- マルチアカウント対応: 複数の Google カレンダーアカウントと Apple カレンダーから同時にイベントを取得できます
学習済みページ
- スマートページ学習: ウェブサイトの構造をキャプチャすることで、特定のサイトについて Caiioo に学習させることができます
- URL パターンマッチング: 学習したパターンは、同じサイト上の類似したページに自動的に適用されます
- DOM スナップショット保存: キャプチャされたページ構造により、AI が複雑なウェブアプリをより正確に理解し、操作できるようになります
RTF ドキュメント対応
- リッチテキスト編集: RTF(リッチテキスト形式)ドキュメントを Slate に直接アップロードして編集できます
- 双方向変換: 書式を維持したまま RTF と HTML の間で相互変換が可能です
- エクスポートオプション: 編集したドキュメントを RTF としてダウンロードし、Pages や Word などのワープロソフトで使用できます
改善点
デスクトップアプリのセキュリティ
- リレー認証: 拡張機能とデスクトップサーバー間の HMAC-SHA256 による安全な認証を導入しました
- ユーザーごとのトークン: マルチユーザー環境のセキュリティのため、認証トークンがユーザー ID に紐付けられるようになりました
- 保護されたエンドポイント: すべての機密性の高い API エンドポイントで認証が必須となりました
パフォーマンス
- Swift ヘルパー: Apple リマインダー、カレンダー、メモ用のネイティブ Swift バイナリにより、AppleScript よりも 10 倍高速なアクセスを実現しました
- ダイレクトコーラー: デスクトップ環境で実行する場合、Apple ツールは HTTP リレーをバイパスして低遅延で動作します
- 共有ユーティリティ: リレー API クライアントを統合し、コードの重複を排除しました
バグ修正
- カレンダーイベントの重複排除: 複数のカレンダーに表示されるイベントが、統合ビューで適切に重複排除されるようになりました
- プロンプトキャッシュ: トークン見積もり中にキャッシュ制御マーカーが削除される問題を修正しました
バージョン 0.8.45 (2025年12月18日)
新機能
- 画像の重複排除: 会話内で同じ画像を複数回アップロードすると、AIがそれを重複と認識し、再処理する代わりにオリジナルを参照するようになりました。これによりコンテキストトークンが節約され、AIが同じ画像を指していることを理解しやすくなります。
改善点
- ドキュメントの重複排除: ソース間ドキュメントマッチングを改善。ユーザーアップロード、Gmail添付ファイル、Webページ取り込みのいずれから来た場合でも、同じドキュメントコンテンツが認識されるようになりました。
バグ修正
- PDF認証エラー: 保護されたPDFを取得する際の認証エラー(401, 403)が一般的な抽出失敗として隠蔽されていた問題を修正。実際のエラーが適切なガイダンスとともに表示されるようになりました。
バージョン 0.8.44 (2025年12月18日)
バグ修正
- 再読み込み/再生成ボタン: アシスタントメッセージの再読み込みをクリックした際に、生成中の新しい応答ではなく古い応答が表示される問題を修正。UIはストリーミング中に新しいブランチに適切に切り替わるようになりました。
改善点
- コンテキストウィンドウ管理: すべてのページネーションとコンテキスト計算で、より保守的なトークン推定(3文字/トークン)を一貫して使用するようにし、大きなWebページでのコンテキストオーバーフローエラーの可能性を低減しました。
バージョン 0.8.43 (2025年12月17日)
改善点
タイムラインと推論の表示
- 完了時の自動折りたたみ: 推論ブロックとプロセスタイムラインは、生成終了時に自動的に折りたたまれるようになり、会話をクリーンに保ちつつアクセス可能にしました
- 中間思考の可視化: ツール呼び出し間のエージェントの「思考」がタイムラインにインライン表示され、エージェントの意思決定プロセスへの洞察が深まりました
- ツールアクションラベル: ツール呼び出しは、ラベルに特定のアクションを表示するようになりました(例: 「Web Browse」だけではなく「Web Browse → click」)
ツール結果
- スクリーンショット表示の修正: スクリーンショットと画像はツール結果内で自動展開されなくなりました。レンダリングされたテキストコンテンツ(検索結果など)のみが自動展開されます
バグ修正
- Ollama CORS: Chrome拡張機能からOllamaを使用する際の接続問題を修正。CORSヘッダーが自動的に処理されるようになりました
バージョン 0.8.41 (2025年12月15日)
改善点
- 型安全性: サーバーのストレージアダプターにおいて、スレッド、スキル、プロフィール、MCP サーバー、ライセンス情報の型に
anyではなく適切な TypeScript の型を使用するようにしました - ビルドシステム: バックアップディレクトリを
caiioo_BACKUP_DIR環境変数経由で選択可能にしました(ハードコードを廃止)
バージョン 0.8.4 (2025年12月15日)
新機能
DNG/RAW画像サポート
- カメラRAWファイル: カメラや写真ライブラリからDNG(デジタルネガ)ファイルを直接アップロード可能
- 自動プレビュー抽出: RAWファイルからJPEGプレビューを抽出し、高速処理を実現
- オリジナル品質の保持: AIが高品質なプレビューを扱う間、元のRAWデータは保持
画像処理の改善
- サーバーサイド圧縮: ローカル圧縮制限を超える大きな画像は、デスクトップサーバーで処理
- エラーフィードバックの向上: 画像処理失敗時に視覚的なエラーインジケーター(赤い枠、警告アイコン)を表示
- 適切なフォールバック: オフスクリーンでドキュメントが利用できない場合、自動的にサーバーでの圧縮にフォールバック
改善
- 共有エージェントアーキテクチャ: 拡張機能とデスクトップサーバー間でエージェントランナーを統合し、一貫した動作を実現
- プロトコルハンドラーの統合: ストレージとメッセージ処理に共有プロトコルハンドラーを使用
バージョン 0.8.3 (2025年12月13日)
新機能
ネイティブモバイルアプリ
- Androidアプリ: WebView + ネイティブブリッジチャネル(CalendarContract, SAF/フォトピッカー, AlarmManager, OkHttpストリーミング)を備えたネイティブKotlinアプリ(
android-app/) - 共有UI: モバイルアプリは拡張機能と同じReact UIを使用し、一貫した体験を提供します
- iOS + Android: 一致するブリッジAPIを備えたネイティブSwift (iOS) およびネイティブKotlin (Android)
改善点
- ID同期: 拡張機能とデスクトップサーバー間でのライセンスおよびプロファイルデータの同期を改善しました
- 添付ファイル管理: LAN/リレーモードにおける添付ファイルの処理を改善しました
- 拡張機能クライアントの追跡: デスクトップサーバーが接続された拡張機能クライアントをタイムスタンプで追跡するようになりました
削除
- Swiftリレーアプリ: macOSのリレー機能は、ネイティブアプリサーバーによって完全に処理されるようになりました(0.8.2で導入)
バージョン 0.8.2 (2025年12月12日)
新機能
クロスプラットフォーム対応デスクトップサーバー
- Caiioo Server: macOS 専用の Swift リレーアプリに代わり、Electron ベースの新しいデスクトップアプリケーションが登場しました
- Windows 対応: ネイティブ Windows インストーラー (NSIS) およびポータブル実行ファイルを提供します
- Linux 対応: Linux ディストリビューション向けに AppImage および .deb パッケージを用意しました
- メニューバー統合: ステータス表示とクイックコントロールを備えたシステムトレイ/メニューバーアプリを実装しました
プラットフォーム固有のスクリプト実行
- 統合スクリプト API: 新しい
/api/scriptエンドポイントがプラットフォームを自動検出し、適切なスクリプトエンジンを使用します - Windows での PowerShell: Windows 上のシステム自動化のために PowerShell スクリプトを実行できます
- Linux での Bash: Linux システム上でシェルスクリプト (bash/sh/zsh) を実行できます
- macOS での AppleScript: 既存の AppleScript/JXA サポートも維持されています
クロスプラットフォームヘルパー
- デスクトップ通知: すべてのプラットフォームでネイティブ API を使用して通知を表示します
- クリップボードアクセス: プラットフォームを問わずクリップボードの内容を読み書きできます
- アクティブウィンドウ検出: フォアグラウンドにあるアプリケーションやウィンドウのタイトルを取得します
- システム情報: OS、CPU、メモリ情報を取得します
改善点
- 自動ビルドパイプライン: ビルド中にメインプロジェクトからバージョン、アイコン、ライセンスが同期されるようになりました
- 配布サイズの削減: 統合ビルドの準備として、冗長なモバイルアプリのコードベースを削除しました
バージョン 0.8.1 (2025年12月11日)
新機能
柔軟なサインインオプション
- 複数の認証方法: Google OAuth、メール/パスワード、またはライセンスキーでサインイン可能
- アカウントリンク: Googleアカウントを既存のメール/パスワードアカウントにリンクし、複数の方法でシームレスにアクセス
MCPサーバー用カスタムOAuth
- 独自のOAuth認証情報: 事前登録されたOAuthクライアントを必要とするMCPサーバー向けに、独自のクライアントIDとシークレットを提供可能に
- 動的トークン更新: OAuthトークンが自動的に更新され、MCPサーバーへの接続を中断させない
改善
- ドキュメント処理インジケーター: PDF、Wordドキュメント、Excelスプレッドシート処理時の明確な視覚的インジケーター
- ティア別設定ナビゲーション: サブスクリプションティアに基づいて、関連するオプションをインテリジェントに表示
- OAuthエラーハンドリングの改善: MCPサーバーのOAuth検出失敗時のエラーメッセージを改善
Version 0.8.0 (December 10, 2025)
New Features
MCP Server Browser & Management
- Browse MCP Servers: Settings内から直接、MCP Registryおよびnpmの両方からMCPサーバーを検索・インストールできるようになりました
- Local MCP Servers: プライバシーとコントロールを強化するため、relay appを介してローカルマシン上でMCPサーバーを実行可能になりました
- Credential Resolution: セキュアな認証のため、MCPサーバーがCredentials Vaultから認証情報を取得できるようになりました
- Health Monitoring: 接続されたMCPサーバーの自動ヘルスチェック機能とステータスインジケーターを追加しました
Profile Management
- Multiple Profiles: 複数のユーザープロファイルを作成し、切り替えることができます
- Profile Switcher: コンポーザー内のアクセスしやすいドロップダウンからプロファイルを切り替え可能です
- Profile Deletion: 不要になったプロファイルを削除できます
Google Account Selection
- Account Choice Dialog: Googleサービスを接続する際、Chromeプロファイルのアカウントを選択するか、別のGoogleアカウントを追加するかを選択できるようになりました
- Web OAuth Flow: Chromeにサインインしていないアカウント向けに、ウェブブラウザ経由で認証するオプションを追加しました
Enhanced Browser Agent
- Go Back Action: エージェントがブラウザ履歴を戻る操作が可能になりました
- ARIA Snapshot: より少ないトークンで効率的なページ分析を行うため、アクセシビリティツリーのスナップショットを取得できるようになりました
Mobile Apps
- iOS App: ローカルネットワーク上の Caiioo にアクセスするためのネイティブiOSクライアントをリリースしました
- Android App: サーバー検出機能とWebViewキャッシュを備えたネイティブAndroidクライアントをリリースしました
Multi-Device Sync
- Device Identity: 接続された各デバイス/拡張機能は、固有のアイデンティティで追跡されます
- State Synchronization: 接続されている複数の拡張機能間で、リアルタイムのステート同期が可能になりました
- Web Client Authentication: relayに接続するウェブクライアント向けのセキュアな認証を実装しました
Improvements
- LLM Provider Key Management: 各種LLMプロバイダーのAPIキーをCredentials Vaultで直接管理できるようになりました
- MCP Tool Images: 画像を返すMCPツールが、会話内でインライン表示されるようになりました
- PDF Text Detection: PDF抽出における文字化けや空白の多いテキストの検出精度を向上させ、信頼度評価を追加しました
- CORS Bypass for Images: CORS制限を回避するため、オフスクリーンドキュメント経由で画像を取得するようになりました
Bug Fixes
- Generation State Tracking: 生成の完了を正確に検知できるよう、最終ステートのキャプチャ機能を改善しました
バージョン 0.7.8 (2025年12月7日)
新機能
Excel スプレッドシート対応
- XLSX インポート: Excel スプレッドシート (.xlsx) を会話に直接アップロードできます
- データ抽出: スプレッドシートの内容が解析され、AI による分析が可能になります
- ラウンドトリップ編集: Slate でスプレッドシートを編集し、再び XLSX 形式でエクスポートできます
「新機能」ダイアログ
- 更新通知: Caiioo のアップデート後、新しいバージョンのリリースノートを表示する「新機能」ダイアログが自動的に表示されます
- バージョン固有のノート: アップデートで何が変わったのか、フォーマットされた機能リストと改善点を確認できます
- 非干渉設計: ダイアログはアップデートごとに一度だけ表示され、初回インストール時には表示されません
バージョン 0.7.6 (2025年12月3日)
新機能
変更履歴追跡付きWordドキュメントサポート
- DOCXインポート: Wordドキュメント(.docx)を会話に直接アップロード
- 変更履歴の可視化: ホバー時に挿入(緑)と削除(赤の取り消し線)を、作成者と日付とともに表示
- コメントサポート: コメントは黄色でハイライトされ、ツールチップでコメントテキストと作成者を表示
- Slate編集: Slate内でDOCXコンテンツを、変更履歴のスタイルを完全に維持して表示・編集
- ダークモードサポート: すべての変更履歴とコメントスタイルがライト/ダーク両テーマで動作
バージョン 0.7.4 (2025年12月2日)
新機能
FLUX 画像生成
- AI画像生成: OpenRouter経由でFLUX AIモデルを使用し、テキスト説明から画像を生成
- 画像編集: 添付IDと編集指示を提供することで、会話内の既存画像を編集可能
- 複数参照サポート: flux.2-flexモデルを使用して最大10枚の画像から要素を組み合わせ可能
- 複数モデル: flux.2-pro(高速、デフォルト)またはflux.2-flex(最高品質)から選択可能
- 自動保存: 生成された画像は会話に保存され、インラインで表示
- コスト追跡: 画像生成コストは個別に追跡され、スレッド合計に追加
バージョン 0.7.3 (2025年12月1日)
新機能
拡張モデルセレクター
- 統合モデルピッカー: コンポーザーと設定全体で一貫したモデル選択体験
- プライバシーインジケーター: シールドアイコンはデータ保持ゼロ(ZDR)モデルを示し、プロンプトが学習に使用されないことを保証
- ビジョンサポート: 目アイコンは画像を分析できるモデルを示す
- 推奨モデル: 星アイコンは推奨される選択肢(Claude Haiku 4.5、Claude Sonnet 4.5)を強調
- コストの透明性: モデルリストで100万トークンあたりの価格を直接確認可能。無料モデルも簡単に識別可能
- アイコン凡例: 設定内のクイックリファレンスで各インジケーターの意味を解説
バージョン 0.7.2 (2025年12月1日)
新機能
PDFドキュメント取り込み
- PDFを直接アップロード: メッセージにPDFドキュメントを添付可能。Mistral OCR経由で自動処理
- 高品質なテキスト抽出: 表、図、数式、書式設定をMarkdownとして保持
- エージェントによるドキュメント取り込み: エージェントは新しい
ingest_documentアクションを使用して、ブラウジング中に遭遇したPDF URLを処理可能 - 永続ストレージ: 抽出されたコンテンツは、再処理コストなしで将来の参照用に保存
バグ修正
- 大きな画像添付: 5MBを超える画像はLLM APIに送信される前に自動圧縮され、Google/Geminiなどのプロバイダーで発生していた「画像が最大5MBを超えています」エラーを修正
バージョン 0.7.0 (2025年12月1日)
新機能
マルチスレッドサポート
- 複数のエージェントを同時に実行: 最大3つのスレッドを同時に実行可能
- 視覚的な実行インジケーター: スレッドがアクティブに生成している間、サイドバーのスレッドタイトルの横にアニメーションドットを表示
- バックグラウンド処理: エージェントはフォーカスを奪わずにバックグラウンドで動作。作業中に自由にブラウジング可能
- スレッドの分離: 各スレッドは独自のタブと状態を独立して追跡
エージェントの非干渉
- コントロールを維持: エージェントがタブを開いたりページを移動したりしても、別のタブに移動していればフォーカスを奪わない
- スマートタブ認識: エージェントは自分が作成または開始したタブのみを操作し、実行中に新しいタブへ追従することはない
Apple連携 (macOS)
- Appleメモ: フォルダ間でメモの読み取り、作成、検索、整理が可能。AIがメモのドラフト作成や編集を直接支援
- Appleリマインダー: To-Doリストとリマインダーを管理。AIの支援でタスクの作成、完了、整理が可能
バージョン 0.6.5 (2025年11月30日)
新機能
AIフォローアップ提案
- スマートプロンプト: アシスタントの応答後、会話を継続するためのAI生成によるフォローアップ提案を表示
- コンテキスト認識: 提案は会話のコンテキストと次に何を行いたいかに基づいて生成
改善
LANリレー設定
- ネットワークアドレスの表示: リレーサーバーに接続すると、設定画面に実際のIPアドレスと
.localホスト名が表示され、モバイルデバイスからの接続が容易に - 簡略化された手順: サーバー実行後、接続情報が自動的に表示されるため、ターミナルを確認する必要なし
バージョン 0.6.4 (2025年11月29日)
バグ修正
Slateリビジョンシステム
- 単語単位の承認/拒否: 後続の変更を壊すことなく、個々の単語の変更を確実に承認または拒否可能に
- 安定した変更追跡: 変更を承認すると他の保留中の変更がクリックできなくなる問題を修正
- プレビューでのMarkdownレンダリング: 変更プレビューで生の星印ではなくMarkdown書式(太字、斜体など)をレンダリング
- 無限ループの修正: 純粋なテキスト追加を承認する際のブラウザハングを修正
- 完全な差分表示: 変更プレビューで最小限の差分だけでなく、削除および追加されたすべての単語を表示
バージョン 0.6.3 (2025年11月26日)
新機能
- 基本ユーザーのデフォルト体験: 新規ユーザーは管理者ではなく基本ユーザーとして開始
- ライセンスキーのアップグレード: 設定に「Proにアップグレード」ボタンを配置し、ライセンスキーで管理者機能をアンロック可能に
- 簡略化されたオンボーディング: コア機能に焦点を当てた、よりクリーンな初回ユーザー体験
バージョン 0.6.2 (2025年11月26日)
バグ修正
- 生成タイムアウトからの復旧: 長時間のSlate操作中にUIが「生成中」のままになるサイレントエラーを修正
- バックエンドが生成中のアクティビティを追跡し、2分間進捗がない場合にタイムアウト
- ストリーミングチャンク、ツール実行、エージェントの決定によりタイムアウトをリセット
- 生成中にサービスワーカーが再起動した場合の自動復旧(孤立状態の検出)
- タイムアウト発生時にサイレントハングではなくエラーメッセージをユーザーに表示
バージョン 0.6.1 (2025年11月26日)
新機能
スレッドのインポート/エクスポート
- 選択したスレッドをエクスポート: 選択モードを切り替えて、エクスポートする特定のスレッドを選択可能
- すべてのスレッドをエクスポート: 添付ファイルを含むすべての会話をワンクリックでエクスポート
- ファイルからインポート: エクスポートされた JSON ファイルからスレッドをインポート
- 選択的インポート: ファイルからインポートするスレッドを選択可能
- 重複検知: 既存のスレッドを自動的に検知し、スキップまたは上書きするオプションを提供
- 添付ファイルのサポート: すべての画像、PDF、ファイルがエクスポートに含まれます
- アーカイブ済みスレッドのサポート: アクティブなスレッドとアーカイブ済みのスレッドの両方をエクスポート/インポート可能
Prompt Caching の改善
- Claude モデルでの長い会話におけるキャッシュヒット率を向上
- 会話の長さに適応する動的なキャッシュ戦略
Google Workspace 統合
- Google Drive: ファイルやフォルダの検索、作成、コピー、移動、共有
- Gmail: メールの閲覧、ラベル管理、下書き作成(安全優先:下書きのみ、自動送信なし)
- Google Calendar: カレンダーの一覧表示、イベントの照会、イベントの作成/更新/削除、空き時間の検索
- インライン認証: 設定画面に移動することなく、チャットから直接 Google へのアクセスを承認
Web Browsing の改善
- 画面上の位置で要素をクリックするための新しい
click_coordinatesアクション - URL がデフォルトで新しいタブで開くように変更(タブの上書きを防止)
- 会話スレッドごとにタブを自動的にグループ化
- 信頼性の高い要素クリックのための CSS セレクター検知の向上
モデル選択
- 素早く切り替えられるよう、モデルセレクターをコンポーザーエリアに移動
- モードを切り替えてもモデル設定をグローバルに保持
- Vision 対応モデルに目(eye)のアイコンを表示
ストリーミング UI
- ツールパラメータをストリーミング中に表示
- 推論/思考ブロックのプログレッシブ表示
- レスポンス中の「生成中...」ステータス表示
トークン使用量とコストの追跡
- 入力、出力、推論、およびキャッシュされたトークンを表示
- メッセージごとのコストとスレッドの累積コストを表示
UI の改善
- すべてのユーザーがモードセレクターを利用可能: 管理者以外のユーザーも設定からモードを切り替え可能に
- 折りたたみ可能な設定セクション: ナビゲーションを容易にするため、設定パネルのセクションを折りたたみ/展開可能に
- AI & Model Configuration (LLM Provider, API Key, Model, Temperature, Max Iterations)
- Personalization (Personal Instructions, Profile Variables)
- Agent Mode Configuration (Mode Selector, Variables, Instructions, Branding, Tools, MCP Servers)
- 外観設定
- バックアップと復元
- ドキュメント
- モード固有のテーマカラー: 各組み込みモードにデフォルトのカラースキームを設定
- Shopping Agent: グリーン
- Travel Agent: ブルー
- Helper Agent: ピンク
- Caiioo (General): パープル
- Chromatic モード: スペクトルを徐々に循環させるカラーローテーションを有効化
- テーマ上書きの管理:
- テーマがカスタマイズされている場合に視覚的なインジケーターを表示(モード切り替え時に失われません)
- 「Save as Mode Defaults」ボタン(管理者用)で、テーマをモードの新しいデフォルトとして保存
- 「Reset to Mode Defaults」で元のモードテーマカラーに復元
- 新しい Caiioo のブランディングとアイコン
- モードセレクターをコンポーザーエリアに移動
- 新規スレッドボタンにモード選択ドロップダウンを表示
- コンポーザー上部バーにスレッドリストの切り替えボタンを追加
- 制御中のブラウザタブにビネット境界線エフェクトを追加
- 制御中のタブにフローティング停止ボタンを追加
- ドロップダウンメニューが画面端付近で適切に配置されるよう修正
バグ修正
- 設定変更後、モデルセレクターが即座に更新されるよう修正
- 新規ユーザーのオンボーディングで Helper Agent が正しく起動するよう修正
- 不正な形式のカスタム変数によって設定パネルがクラッシュする問題を修正
- スレッドタイトルの変更時にタブグループ名が更新されるよう修正
- Slate の承認/拒否ウィジェットが正しく配置されるよう修正
- より多くのモデル(Haiku 4.5、Gemini など)で拡張思考(Extended thinking)が機能するよう修正
- 「maximum 4 cache_control blocks」エラーを修正
バージョン 0.3.4 (2025年11月24日)
新機能
テキスト選択コンテキスト
- ウェブページ上のテキストを選択すると「プロンプトに追加」ボタンが表示されるようになりました
- 選択されたテキストは、ページコンテキストと共にコンポーザー内にチップとして表示されます
- 正確なエージェント操作のため、DOM の位置情報がキャプチャされます
Google カレンダー連携
- カレンダーのフル管理(イベントのリスト表示、作成、更新、削除)に対応しました
- すべてのカレンダーを対象としたスマートな空き時間検索が可能です
- 自然言語による時間の解析(「明日」「来週」など)に対応しました
バグ修正
Slate モード
- 承認/却下ボタンがエディタのコンテンツに隠れてしまう問題を修正しました
- 差分ハイライトを(行全体ではなく)単語レベルで行うようにしました
- 複数の propose_change 呼び出しが正しく累積されるようになりました
- ビューの切り替えが予期せず「跳ね返る」問題を修正しました
リブランド
- 名称を「ContextFlow」から「Caiioo」に変更しました
バージョン 0.3.0 (2025年11月22日)
新機能
モバイル & LAN アクセス
- LAN サーバー: ローカルネットワーク上の任意のデバイスから Caiioo にアクセスできます
- 会話サイドバー: ブラウザのタブで会話を開き、より広い画面を利用できます
- モバイルエクスポート: オフライン閲覧用に会話をスタンドアロンの HTML としてエクスポートできます
バグ修正
- 重大なメッセージ分岐ロジックのバグを修正しました
- アーカイブされたスレッドの操作に関する問題を修正しました
バージョン 0.2.0 (2025年11月21日)
新機能
拡張思考(Extended Thinking)のサポート
- Claudeモデルが拡張思考/推論ブロックをサポートしました
- モデルの思考プロセスを表示する折りたたみ可能な推論UI
- マルチターンでの継続性を高める推論詳細のキャッシュ
新しいLLMプロバイダー
- Ollama連携: Ollamaを通じてローカルLLMを実行可能に
- 設定パネルでのプロバイダー選択
画像フォーマットのサポート
- HEIC/HEIFサポート: Appleの画像フォーマットを互換性のために自動変換
UIの改善
- ツールメニューの終了時自動保存
- 設定パネルの構成を改善
バグ修正
- 変数オートコンプリートの配置を改善
バージョン 0.1.x (過去のリリース)
コア機能
- マルチモデルAIチャット (OpenRouter, Anthropic, OpenAI, Ollama)
- ブラウザ自動化およびWebスクレイピング
- コードおよびドキュメント編集用Slate
- MCPサーバー連携
- スクリーンショットおよびビジョン機能
- 音声入力
- スレッド管理およびブランチ機能
- プロファイルおよびモードシステム