본 문서는 영어 원본을 기계 번역한 것입니다. 번역본과 영어 원본 사이에 내용이 상충할 경우 영어 원본이 우선합니다. 영어 원본 보기


도구: AI가 할 수 있는 일

AI는 단순히 대화만 하는 것이 아니라 실제 행동을 취할 수 있습니다. 도구를 사용하여 웹을 탐색하고, 문서를 읽고, 이미지를 생성하고, 캘린더를 관리하는 등의 작업을 수행하세요. AI는 사용자의 요청에 따라 어떤 도구를 사용할지 자동으로 결정합니다.

Caiioo는 읽기/쓰기 액세스 모델을 사용합니다. 무료 사용자는 대부분의 도구에 대해 읽기 전용 액세스 권한을 가지며, Pro 사용자는 모든 도구에 대해 전체 쓰기 액세스 권한을 가집니다.

모든 사용자에게 제공되는 도구 (무료)

Web Browsing (읽기 전용)

AI가 브라우저를 탐색하고, 페이지를 읽고, 스크린샷을 찍고, Google에서 검색하며, 콘텐츠를 추출할 수 있습니다. 리서치 및 데이터 수집에 최적화되어 있습니다.

요청 예시:

  • "이 페이지를 읽고 요약해줘"
  • "이 화면을 스크린샷 찍어줘"
  • "이 페이지에 있는 모든 가격 정보를 찾아줘"
  • "최고의 캠핑용 텐트를 Google에서 검색해줘"

Google Workspace (읽기 전용)

별도의 설정 없이 Google 계정 연결만으로 Gmail, Google Drive, Docs, Sheets, Calendar를 검색하고 읽을 수 있습니다. Gmail 검색은 발신자, 제목, 라벨, 카테고리, 기간, 첨부 파일 유무, 읽지 않음 상태 등 자연어 필터를 이해하므로, Gmail의 복잡한 검색 구문을 알 필요가 없습니다.

요청 예시:

  • "내 Drive에서 4분기 보고서를 찾아줘"
  • "지난주에 Bob이 보낸 첨부 파일이 있는 읽지 않은 이메일을 찾아줘"
  • "최신 이메일들을 읽어줘"
  • "오늘 내 캘린더 일정이 뭐야?"

Sundial Agenda (읽기 전용)

캘린더 이벤트와 리마인더를 확인하고, 가용 시간을 체크하며, 비어 있는 시간대를 찾을 수 있습니다. 모든 플랫폼의 Google Calendar와 연동됩니다.

Web Search

인용 출처가 포함된 AI 기반 검색입니다. 검색 결과를 직접 일일이 확인하는 대신, 질문을 던지고 출처가 명시된 답변을 얻으세요.

Slate Editor

코드와 문서를 위한 실시간 AI 협업 도구입니다. 자세한 내용은 Slate를 참조하세요.

Calculator

빠른 수학 계산입니다. AI는 외부 도구 없이도 산술, 삼각함수, 통계 등을 수행할 수 있습니다.

API Integration (읽기 전용)

외부 REST API에 GET 요청을 보냅니다. 아직 기본적으로 지원하지 않는 서비스에서 데이터를 가져올 때 유용합니다.

SQL Database

로컬 SQLite 데이터베이스를 생성하고 쿼리할 수 있습니다. CSV 데이터 분석, 가벼운 대시보드 구축, 또는 데이터 워크플로우 프로토타이핑에 유용합니다.

Sub-Agents

복잡한 작업의 일부를 병렬 에이전트에게 위임하여 독립적으로 실행하고 결과를 보고받습니다. 리서치, 분석, 초안 작성을 동시에 진행하고 싶을 때 유용합니다. Sub-agent의 결과는 메인 채팅창에 인라인으로 표시됩니다.

Ask User

AI 실행 도중 작업을 일시 중지하고 결정 대화 상자를 띄웁니다. AI는 최대 4가지 옵션(승인, 메모와 함께 승인, 거부, 메모와 함께 거부)을 제시하고 사용자의 입력을 기다립니다. 사용자의 메모는 기존 계획을 대체하는 자연어 가이드로 전달되며, 에이전트는 그 지점에서 작업을 재개합니다.

Self Checker

어시스턴트의 모든 답변을 평가하고 검증합니다. 응답 옆의 ⚖ 버튼을 클릭하여 판정 카드를 엽니다. LLM 기반 판단과 결정론적 체크(정확히 일치, 부분 문자열 포함, regex 패턴, 숫자 범위, 산술 계산) 중에서 선택할 수 있습니다. 결과는 인라인으로 표시되며, 비용은 해당 스레드 총액에 합산됩니다.

Instant Tool Chooser

기기 내(On-device) 시맨틱 도구 선택 기능입니다. AI가 모델을 호출하지 않고도 약 10ms 내에 적절한 도구를 선택합니다. 모든 티어에서 기본적으로 활성화되어 있으며, Settings > Tools에서 "Instant Tool Chooser"와 "Quick Tasks LLM" 사이를 전환할 수 있습니다.

Pro Tier 도구 (월 $9)

Pro 등급은 Free 등급에서 읽기 전용이었던 도구들에 대한 전체 쓰기 권한과 추가 기능을 제공합니다.

로컬 채팅 모델(예: Ollama)을 실행 중일 때, 데이터를 원격 AI 제공업체로 전송해야 하는 AI 기반 도구는 먼저 사용자의 승인을 요청합니다. Privacy & DataRemote AI Providers를 참조하세요.

전체 웹 자동화

읽기 전용 브라우징의 모든 기능에 더해, 링크 클릭, 양식 작성, 텍스트 입력, 페이지 요소와의 상호작용, JavaScript 실행이 가능합니다. 양식 작성, 데이터 입력 및 브라우저 자동화에 완벽합니다.

요청 예시:

  • "내 정보로 이 양식을 작성해줘"
  • "리뷰 탭을 클릭해서 사람들이 뭐라고 하는지 읽어줘"
  • "이 사이트에 로그인해서 내 인보이스를 다운로드해줘"

전체 Google Workspace

Google Docs, Sheets, Slides, Gmail 초안, Drive 파일 및 Calendar 이벤트를 생성, 편집 및 관리합니다. Google Sheets에 새로운 액션이 추가되었습니다: CSV/TSV/HTML 붙여넣기, 텍스트를 열로 분할, 공백 제거, 중복 제거, 툴바 필터 적용 및 해제, 행과 열 이동, 셀 범위 삽입 및 삭제, 범위 보호, 이름이 지정된 범위 정의 및 업데이트, 개발자 메타데이터 첨부, 조건부 서식 적용. Google Docs에는 네이티브 댓글(추가, 답글, 해결, 삭제), 멀티 탭 문서 지원, 스마트 칩 인식(사람, 링크, 수식, 페이지 나누기, 날짜) 기능이 추가되었습니다.

Google Drive — 폴더 생성, 파일 이동, 공유 권한 관리 Gmail — 이메일 초안 작성 및 전송, 첨부 파일 다운로드 Google Docs & Sheets — 문서 생성 및 편집, 수식 작성, 셀 서식 지정 Google Slides — 프레젠테이션 생성, 텍스트/이미지/표 추가, 레이아웃 편집 Google Calendar — 이벤트 및 알림 생성, 계정 내 모든 캘린더(팀, 가족 및 개인 캘린더)를 가로지르는 회의 일정 예약

전체 Sundial Agenda

이벤트 및 알림 생성, 회의 일정 예약, 여러 제공업체에 걸친 캘린더 관리를 수행합니다.

전체 API 통합

GET뿐만 아니라 모든 REST 엔드포인트에 대한 POST, PUT, PATCH, DELETE 요청을 지원합니다.

문서 수신 (Ingestion)

PDF, Word 문서(DOCX), Excel 스프레드시트(XLSX) 및 이미지를 OCR과 함께 업로드하고 분석합니다. 복잡한 문서에 대한 고품질 추출은 OpenRouter 키를 통해 액세스하는 OCR 모델을 통해 사용할 수 있습니다.

이미지 생성

텍스트 설명을 바탕으로 이미지를 생성합니다. 사용 가능한 모델에는 FLUX.2 (Flex, Klein, Max, Pro), Gemini (2.5 Flash, 3 Pro, 3.1 Flash), GPT-5 Image, Seedream 4.5, Riverflow v2가 포함됩니다. 일러스트레이션, 목업 또는 시각화에 적합합니다.

생성 예시:

  • 새로운 디자인을 위한 제품 목업
  • 블로그 포스트용 일러스트레이션
  • 3D 프로젝트용 텍스처
  • 기존 이미지의 변형 버전

비디오 생성

텍스트 설명을 바탕으로 비디오를 생성합니다. OpenRouter를 통해 액세스 가능한 모델: Google Veo 3.1, OpenAI Sora 2 Pro, ByteDance Seedance. 유효한 재생 시간과 해상도는 모델마다 다릅니다. 비디오는 스레드 첨부 파일로 저장됩니다.

생성 예시:

  • 제품 데모 비디오
  • 애니메이션 설명 영상
  • 편집을 위한 장면 전환
  • 스토리보드 시퀀스

음악 생성

OpenRouter를 통해 액세스하는 Google Lyria 3 Pro Preview를 통해 텍스트 설명으로부터 독창적인 음악을 생성합니다. 저작권료 없는 트랙을 생성하며, 스레드 내 인라인 오디오 첨부 파일로 저장됩니다.

생성 예시:

  • 비디오 배경 음악
  • 앰비언트 사운드스케이프
  • 프로젝트용 음악 테마
  • 설명의 인스트루멘탈 버전

Seeing-Eye Dog

텍스트 전용 모델을 위한 비전 폴백(fallback) 기능입니다. 선택한 모델이 이미지를 지원하지 않는 경우(예: 로컬 Ollama, DeepSeek V4 Pro, Kimi K2.6), 이미지를 첨부하면 저렴한 비전 모델을 통해 캡션을 생성한 후 텍스트가 메인 모델로 전송됩니다. 기본값은 OpenRouter를 통한 Gemini 3.1 Flash Lite입니다. 자동 캡션은 메시지 빌드 시점에 수행되며 첨부 파일별 캐싱이 적용됩니다. 타겟팅된 후속 작업을 위해 vision({action: "inspect"}) 도구를 사용하세요. Settings > Tools > Vision Fallback Model에서 설정하십시오.

Workspace Files

지정한 폴더 내에서 샌드박스 처리된 읽기, 쓰기, 편집 및 검색을 수행합니다. 해당 폴더를 벗어나거나 네트워크에 접속할 수 없습니다. .docx, .xlsx, .pptx 및 PDF를 자동으로 파싱합니다. 로컬 프로젝트 파일을 클라우드에 업로드하지 않고 작업하기에 완벽합니다. Settings > Tools > Workspace Files에서 설정하십시오.

Test Runner

프롬프트 목록을 평가 도구(부분 일치, 정규식 패턴, 예상 도구 호출 또는 보조 모델의 1-10점 척도 점수)와 함께 실행합니다. 각 프롬프트는 새로운 대화에서 실행됩니다. 결과는 CSV 통과/실패 보고서로 내보낼 수 있습니다.

XLSX 셀 단위 변경 내용 추적

Slate 스프레드시트는 이제 propose_change({editMode: 'xlsx_cell'})를 통해 DOCX 스타일의 교정 기능을 지원합니다. 변경 사항은 cellRef 및 시트 이름에 고정되며, <del>이전</del><ins>이후</ins>로 인라인 렌더링됩니다. 다음, 이전, 수락, 거부 기능을 위한 툴바가 제공됩니다. AI와 사용자는 셀 단위로 병합하며, 충돌 시 사용자 편집이 우선합니다.

물리 및 구조 분석

투사체 운동, 충돌, 에너지, 운동량, 힘, 충격량, 목표물 도달 속도, 빔 하중, 기둥 좌굴 및 재료 특성을 계산합니다.

Private Sync

암호화된 클라우드 백업을 통해 기기 간에 설정과 대화를 동기화합니다. 자세한 내용은 Private Sync를 참조하세요.

MCP 서버

HTTP/SSE를 통해 원격 MCP 서버에 연결하거나, 본인의 머신에서 데스크톱 도구(데스크톱 앱을 통한 로컬 MCP)를 실행합니다. 커스텀 도구 통합을 구축하거나 타사 서비스에 연결하세요.

Meeting Recall

최근 화상 회의에서 세부 정보(전사 데이터, 실행 항목, 요약)를 검색하여 회의 컨텍스트를 대화로 가져올 수 있습니다.

Messaging Gateway

에이전트가 사용자를 대신하여 응답하며 WhatsApp, Telegram 등에서 메시지를 확인하고 전송합니다. Messaging Gateway를 참조하세요.

기타 Pro 기능

  • 무제한 커스텀 모드 — 커스텀 프롬프트와 {{variable}}를 사용하여 자신만의 AI 페르소나 생성
  • 커스텀 프로필 변수 — 모든 모드에서 AI 동작을 개인화
  • 액션별 지침 — 각 도구 액션의 동작 방식 커스텀 설정
  • Caiioo Benchmarks — 품질 평가 및 처리량 테스트를 통해 모델 성능 비교
  • 우선 지원 — 앱에서 직접 지원 티켓 제출

실험적 도구

기기 내 스위치를 통해 실험적 도구를 활성화할 수 있습니다. 이러한 기능은 성숙도에 따라 Free 또는 Pro 등급으로 전환됩니다. 사용 가능한 옵션에는 GitHub 연동, Slack, 고급 공간 추론, 테스트 자동화 등이 포함됩니다.

도구 활성화 또는 비활성화

설정 > 도구로 이동하여 사용 가능한 도구를 확인하고 토글을 통해 활성화하거나 비활성화하세요. 일부 모드는 특정 도구가 미리 구성되어 있습니다.

더 보기


This guide is maintained by the Caiioo team using Slate, our built-in editor.