この文書は元の英語版を機械翻訳したものです。翻訳版と英語版の間に相違がある場合は、英語版が優先されるものとします。 英語版の原文を読む
ツール:AIができること
AIはただチャットするだけではありません。実際の行動を起こすことができます。ツールを使用して、ウェブの閲覧、ドキュメントの読み取り、画像の生成、カレンダーの管理などを行えます。AIは、あなたの依頼内容に基づいて、どのツールを使用するかを自動的に判断します。
Caiiooは読み取り/書き込みアクセスモデルを採用しています。無料ユーザーはほとんどのツールに対して読み取り専用アクセスが可能で、Proプランでは全面的にフル書き込みアクセスが解放されます。
全員が利用可能なツール (無料)
Web ブラウジング (読み取り専用)
AIがブラウザを操作し、ページの閲覧、スクリーンショットの撮影、Google 検索、コンテンツの抽出を行います。リサーチやデータ収集に最適です。
依頼例:
- 「このページを読んで要約して」
- 「これのスクリーンショットを撮って」
- 「このページにあるすべての価格を見つけて」
- 「最高のキャンプ用テントを Google で検索して」
Google Workspace (読み取り専用)
Gmail、Google Drive、Docs、Sheets、Calendar の検索と読み取りが可能です。Google アカウントを連携するだけで、複雑な設定は不要です。Gmail の検索は、送信者、件名、ラベル、カテゴリ、期間、添付ファイルの有無、未読状態などの自然なフィルタを理解するため、Gmail 独自の検索構文を知らなくても利用できます。
依頼例:
- 「Drive から第4四半期のレポートを探して」
- 「先週届いたボブからの未読メールで、添付ファイルがあるものを探して」
- 「最新のメールを読んで」
- 「今日のカレンダーの予定は?」
Sundial Agenda (読み取り専用)
カレンダーのイベントやリマインダーの表示、空き時間の確認、空きスロットの検索が可能です。すべてのプラットフォームで Google Calendar と連携します。
Web 検索
引用元を明示した AI 駆動の検索です。検索結果を自分で探し回る代わりに、質問を投げかけるだけでソースに基づいた回答を得られます。
Slate エディタ
コードやドキュメントのためのリアルタイム AI コラボレーションツールです。詳細は Slate を参照してください。
計算機
素早い計算が可能です。AI は外部ツールを使用せずに、算術、三角関数、統計などの計算を実行できます。
API 統合 (読み取り専用)
外部の REST API に対して GET リクエストを送信します。まだ標準サポートされていないサービスからデータを取得する際に便利です。
SQL データベース
ローカルの SQLite データベースの作成とクエリ実行が可能です。CSV データの分析、軽量なダッシュボードの構築、データワークフローのプロトタイピングに役立ちます。
サブエージェント
複雑なタスクの一部を並列エージェントに委任し、それぞれ独立して実行させ、結果を報告させることができます。リサーチ、分析、ドラフト作成を同時に行いたい場合に有用です。サブエージェントの結果はメインチャット内にインラインで表示されます。
ユーザーへの確認 (Ask User)
AI の実行を途中で一時停止し、意思決定ダイアログを表示します。AI は最大 4 つのオプション(承認、メモ付きで承認、拒否、メモ付きで拒否)を提示し、あなたの入力を待ちます。入力したメモは、プランを上書きする自然言語の指示として AI にフィードバックされ、エージェントはその場で処理を続行します。
セルフチェッカー (Self Checker)
アシスタントのすべての応答を評価・検証します。応答の横にある ⚖ ボタンをクリックすると、判定カードが開きます。LLM による判定に加え、決定論的なチェック(完全一致、部分一致、正規表現パターン、数値範囲、算術計算)から選択できます。結果はインラインで表示され、コストはスレッドの合計に加算されます。
インスタントツールセレクター (Instant Tool Chooser)
デバイス上でのセマンティックなツール選択機能です。AI はモデルを呼び出すことなく、約 10ms で適切なツールを選択します。すべてのティアでデフォルトで有効になっています。「設定 > ツール」から「Instant Tool Chooser」と「Quick Tasks LLM」を切り替えることができます。
Pro Tier ツール(月額 $9)
Pro は、Free では読み取り専用であるツールの完全な書き込みアクセスをアンロックし、さらに追加の機能を提供します。
ローカルチャットモデル(Ollama など)を実行している場合、データをリモートの AI プロバイダーに送信する可能性のある AI 駆動型ツールは、最初にあなたの承認を求めます。Privacy & Data → Remote AI Providers を参照してください。
完全な Web オートメーション
読み取り専用ブラウジングのすべての機能に加え、リンクのクリック、フォームへの入力、テキストの入力、ページ要素とのインタラクション、JavaScript の実行が可能です。フォーム入力、データ入力、ブラウザの自動化に最適です。
依頼できることの例:
- 「このフォームに私の情報を入力して」
- 「レビュータブをクリックして、人々の意見を読んで」
- 「このサイトにログインして、請求書をダウンロードして」
完全な Google Workspace
Google Docs、Sheets、Slides、Gmail の下書き、Drive ファイル、Calendar イベントの作成、編集、管理が可能です。Google Sheets には新しいアクションが追加されました:CSV/TSV/HTML の貼り付け、テキストの列分割、空白のトリミング、重複の削除、ツールバーフィルタの適用と解除、行と列の移動、セル範囲の挿入と削除、範囲の保護、名前付き範囲の定義と更新、デベロッパーメタデータの添付、条件付き書式の適用。Google Docs では、ネイティブコメント(追加、返信、解決、削除)、マルチタブドキュメントのサポート、スマートチップ認識(人物、リンク、数式、改ページ、日付)が利用可能になりました。
Google Drive — フォルダの作成、ファイルの移動、共有権限の管理 Gmail — メールの下書き作成と送信、添付ファイルのダウンロード Google Docs & Sheets — ドキュメントの作成と編集、数式の記述、セルの書式設定 Google Slides — プレゼンテーションの作成、テキスト/画像/表の追加、レイアウトの編集 Google Calendar — イベントやリマインダーの作成、アカウント内のすべてのカレンダー(チーム、家族、個人のカレンダー)にわたる会議のスケジューリング
完全な Sundial Agenda
イベントやリマインダーの作成、会議のスケジューリング、プロバイダーをまたいだカレンダー管理が可能です。
完全な API 統合
GET だけでなく、任意の REST エンドポイントに対して POST、PUT、PATCH、DELETE リクエストを実行できます。
ドキュメントの取り込み
PDF、Word ドキュメント(DOCX)、Excel スプレッドシート(XLSX)、および OCR を使用した画像のアップロードと分析が可能です。複雑なドキュメントのより高品質な抽出は、OpenRouter キーを介してアクセスする OCR モデルを通じて利用できます。
画像生成
テキストの説明から画像を生成します。利用可能なモデルには、FLUX.2 (Flex, Klein, Max, Pro)、Gemini (2.5 Flash, 3 Pro, 3.1 Flash)、GPT-5 Image、Seedream 4.5、Riverflow v2 が含まれます。イラスト、モックアップ、視覚化に最適です。
作成できるものの例:
- 新しいデザインの製品モックアップ
- ブログ記事用のイラスト
- 3D プロジェクト用のテクスチャ
- 既存の画像のバリエーション
ビデオ生成
テキストの説明からビデオを生成します。OpenRouter を介してアクセス可能なモデル:Google Veo 3.1、OpenAI Sora 2 Pro、ByteDance Seedance。有効な再生時間と解像度はモデルによって異なります。ビデオはスレッドの添付ファイルとして保存されます。
生成できるものの例:
- 製品デモビデオ
- アニメーション解説動画
- 編集用のシーン遷移
- ストーリーボードのシーケンス
音楽生成
Google Lyria 3 Pro Preview(OpenRouter 経由でアクセス)を使用して、テキストの説明からオリジナルの音楽を生成します。ロイヤリティフリーのトラックを作成し、スレッド内にインラインオーディオ添付ファイルとして保存されます。
生成できるものの例:
- ビデオの背景音楽
- アンビエントなサウンドスケープ
- プロジェクトの音楽テーマ
- 説明文のインストゥルメンタルバージョン
Seeing-Eye Dog
テキスト専用モデルのためのビジョン・フォールバック機能です。選択したモデルが画像をサポートしていない場合(ローカルの Ollama、DeepSeek V4 Pro、Kimi K2.6 など)でも、画像を添付できます。画像は安価なビジョンモデルにルーティングされてキャプションが生成され、そのテキストがメインモデルに送信されます。デフォルトは OpenRouter 経由の Gemini 3.1 Flash Lite です。自動キャプションはメッセージ構築時に行われ、添付ファイルごとにキャッシュされます。特定のフォローアップには vision({action: "inspect"}) ツールを使用してください。Settings > Tools > Vision Fallback Model で設定可能です。
Workspace Files
指定したフォルダ内でのサンドボックス化された読み取り、書き込み、編集、検索が可能です。そのフォルダ外へのアクセスやネットワークへの接続はできません。.docx、.xlsx、.pptx、PDF を自動解析します。ローカルのプロジェクトファイルをクラウドにアップロードせずに作業するのに最適です。Settings > Tools > Workspace Files で設定可能です。
Test Runner
グレーダー(部分一致、パターン (regex)、期待されるツール呼び出し、またはセカンドモデルによる 1-10 のスコアリング)を使用して、プロンプトのリストを実行します。各プロンプトは、それぞれ新しい会話の中で実行されます。結果は CSV の合格/不合格レポートとしてエクスポートできます。
XLSX セルレベルの変更履歴
Slate スプレッドシートで、propose_change({editMode: 'xlsx_cell'}) を介した DOCX スタイルの校正(レッドライニング)がサポートされました。変更は cellRef とシート名によって固定され、<del>古い内容</del><ins>新しい内容</ins> としてインラインでレンダリングされます。次へ、前へ、承認、拒否のためのツールバーが備わっています。AI とユーザーはセルごとにマージし、競合が発生した場合はユーザーの編集が優先されます。
物理・構造解析
放体運動、衝突、エネルギー、運動量、力、力積、ターゲットへの速度、梁の荷重、柱の座屈、および材料特性を計算します。
Private Sync
暗号化されたクラウドバックアップを介して、デバイス間で設定と会話を同期します。詳細は Private Sync を参照してください。
MCP サーバー
HTTP/SSE 経由でリモートの MCP サーバーに接続したり、自身のマシン上でデスクトップツール(デスクトップアプリ経由のローカル MCP)を実行したりできます。カスタムツールの統合を構築したり、サードパーティのサービスに接続したりできます。
Meeting Recall
最近のビデオ会議の詳細(トランスクリプト、アクションアイテム、要約)を取得し、会議のコンテキストを任意の会話に取り込むことができます。
Messaging Gateway
WhatsApp や Telegram などでメッセージを受信・送信し、エージェントがあなたに代わって応答します。Messaging Gateway を参照してください。
その他の Pro 機能
- 無制限のカスタムモード — カスタムプロンプトと変数を使用して、独自の AI パーソナリティを作成
- カスタムプロフィール変数 — すべてのモードにわたって AI の動作をパーソナライズ
- アクションごとの指示 — 各ツールアクションの動作をカスタマイズ
- Caiioo Benchmarks — 品質評価とスループットテストでモデルのパフォーマンスを比較
- 優先サポート — アプリから直接サポートチケットを送信
実験的ツール
デバイス上のスイッチで実験的ツールを切り替えられます。これらは機能が成熟するにつれて、無料または Pro ティアへと移行します。利用可能なオプションには、GitHub 連携、Slack、高度な空間推論、テスト自動化などが含まれます。
ツールの有効化/無効化
設定 > ツール で利用可能なツールを確認し、オン/オフを切り替えられます。一部のモードには、あらかじめ設定されたツールが含まれています。
参照
- サブスクリプションと請求 — 各プランに含まれるツール
- モードと性格 — モードによるツールの有効化について
This guide is maintained by the Caiioo team using Slate, our built-in editor.