Данный документ является машинным переводом оригинальной английской версии. В случае любых расхождений между переводом и оригиналом на английском языке, приоритет имеет английская версия. Читать оригинал на английском языке
Контролируйте действия ИИ до того, как он их совершит
Каждый вендор агентов обещает вам «полную автономность!». Контракт Caiioo противоположен: агент описывает, что он собирается сделать, а вы решаете, позволить ли ему это — для каждого действия, для каждого диалога или навсегда. Вот как это выглядит от начала до конца.
Перед началом
Откройте Настройки > Инструменты, чтобы увидеть, какие инструменты сейчас включены для вашего режима. Отключите все, к чему вы не хотите давать агенту доступ в принципе. Подтверждение требуется только для включенных инструментов — отключенные инструменты модели никогда не предлагаются.
Когда агент хочет использовать инструмент
Попросите что-то, что задействует инструмент. «Найди в сети последние изменения в законе ЕС об ИИ», «покажи мой календарь на завтра», «сохрани эту заметку в файл» — любое из этих действий заставит агента предложить вызов инструмента.
Агент не продолжает работу самостоятельно. Появляется модальное окно Требуется подтверждение, которое блокирует выполнение и показывает:
- Намерение — одна строка, описывающая, что агент пытается сделать, его собственными словами. Это первое, на что падает взгляд.
- Название инструмента и действие — например,
googleCalendar.listEvents,fileSystem.writeFile. - Уровень риска — цветовой индикатор: зеленый для безопасного чтения, желтый для записи, красный для деструктивных операций или перевода денег. Для инструментов с высоким риском также отображается баннер: «Это операция с высоким риском. Подтверждайте только если понимаете последствия».
- Детали — разворачиваемая секция с очищенными аргументами. Секреты (API-ключи, токены, пароли) удаляются перед отображением. Переключатель Показать исходный JSON внутри позволяет увидеть необработанные данные, если вы хотите знать точно, что отправляется по сети.
Выберите область действия, соответствующую риску
В футере предложены четыре кнопки. Каждая соответствует определенному уровню доверия:
| Кнопка | Что она делает |
|---|---|
| Отклонить | Заблокировать это конкретное действие. Агент получит отказ и сможет попробовать что-то другое. |
| Разрешить один раз | Разрешить этот конкретный вызов, но спросить снова при следующем обращении. Подходит для разовых задач. |
| Разрешить для беседы | Разрешить использование этого инструмента во всей текущей ветке. Сбрасывается при начале новой беседы. Подходит для обычных случаев: «Я провожу исследование в течение часа, пусть агент ищет свободно». |
| Всегда разрешать | Постоянное глобальное разрешение для всех бесед. Для инструментов с высоким риском кнопка выделена красным, чтобы вы не нажали её по привычке. Подходит для простых инструментов, которыми вы пользуетесь постоянно (например, калькулятор). |
Наблюдайте за процессом
После одобрения вызов инструмента выполняется и отображается на боковой панели рядом с беседой с его текущим статусом — ожидание → выполнение → успешно или ошибка — вместе с аргументами, с которыми он был запущен, и полученным результатом. Ничего не запускается без вашего ведома; ничего не происходит в фоновом режиме втайне от вас.
Остановите в любой момент
Если одобренный инструмент ведет себя неправильно или беседа идет не туда, куда вы планировали, нажмите кнопку остановки в поле ввода. Агент немедленно прекратит работу, ожидающие подтверждения действия будут очищены, а любая активная сессия браузера корректно закроется. Никаких брошенных вызовов или бесконечных циклов.
Когда агент делает паузу, чтобы задать вопрос
Подтверждение — это когда агент просит разрешения. Иногда агенту нужны вводные данные — он не уверен, какой из двух путей выбрать, или хочет, чтобы вы утвердили план, прежде чем он потратит десяток вызовов инструментов на его выполнение. Для этого используется отдельная панель взаимодействия с человеком, которая приостанавливает ход работы и спрашивает вас напрямую.
Панель показывает заголовок, предложение в формате markdown (план агента, черновик или вопрос) и четыре кнопки ответа:
- Одобрить — продолжать согласно предложению.
- Одобрить, но… — продолжать с корректировками, которые вы введете в появившемся поле заметок. Агент продолжит работу с учетом ваших указаний.
- Отклонить, но… — не делать этого, и вот почему (или вот что я предпочитаю). Опять же, работа продолжится с учетом ваших аргументов.
- Отклонить — полностью отказаться от этого направления.
Если предложение агента содержит набор конкретных вариантов, они отображаются в виде кнопок-чипов над основными кнопками, чтобы вы могли кликнуть по ответу вместо ввода текста. Предложения с высоким риском помечаются красным баннером. Ваш ответ обрабатывается в контексте — агент не начинает заново, а просто продолжает нить диалога с вашим ответом.
Сделайте это по умолчанию: попросите Caiioo создать «Осторожный режим»
Описанный выше процесс — это вариант «для каждого действия». Если вы хотите, чтобы это было вашим поведением по умолчанию для целого класса задач, лучшее решение — это режим.
Просто попросите. В поле ввода напечатайте что-то вроде:
«Создай новый режим под названием Осторожный, который всегда представляет план перед использованием любых инструментов, просит меня утвердить план и не продолжает, пока я не подтвержу».
Caiioo использует свой встроенный инструмент конфигурации, чтобы настроить режим для вас — системный промпт, название, настройки по умолчанию. Переключитесь на этот режим в заголовке, и каждый запуск агента будет начинаться с плана, останавливаться для вашего одобрения и только после этого обращаться к инструментам. Позже редактируйте режим таким же образом: «Обнови Осторожный режим, чтобы он также резюмировал результаты после каждого шага». Агент редактирует сам себя.
Создание или обновление пользовательских режимов — это возможность уровня Pro. См. Режимы и личности для полной картины того, что можно настроить в режимах: системный промпт, включенные инструменты, переменные и многое другое.
См. также
- Инструменты и интеграции — каталог инструментов и способы их включения/отключения
- Режимы и личности — что можно настроить в режиме и как между ними переключаться
- Конфиденциальность и данные — почему учетные данные инструментов хранятся в Keychain (или аналогах), а не в общем конфиге
- Почему такой дизайн — статья в блоге о разнице в безопасности по сравнению с «автономными» агентами