Це машинний переклад оригінального документа англійською мовою. У разі будь-яких розбіжностей між цим перекладом та оригінальною англійською версією, пріоритет має версія англійською мовою. Читати оригінал англійською мовою
Контролюйте дії ШІ до того, як він їх виконає
Кожен постачальник агентів обіцяє вам «повну автономність!». Контракт Caiioo протилежний: агент описує, що він збирається зробити, а ви вирішуєте, чи дозволити йому це — для кожної дії, для кожної розмови або назавжди. Ось як це виглядає від початку до кінця.
Перед початком
Відкрийте Налаштування > Інструменти, щоб побачити, які інструменти зараз увімкнено для вашого режиму. Вимкніть усе, до чого ви не хочете, щоб агент мав доступ. Схвалення стосується лише увімкнених інструментів — вимкнені інструменти ніколи не пропонуються моделі.
Коли агент хоче використати інструмент
Попросіть про щось, що задіює інструмент. «Знайди в мережі останні зміни до Закону ЄС про ШІ», «покажи мій календар на завтра», «збережи цю нотатку у файл» — будь-який із цих запитів змусить агента запропонувати виклик інструменту.
Агент не продовжує роботу самостійно. Модальне вікно з заголовком Потрібне схвалення блокує виконання та показує:
- Намір — один рядок, що описує, що агент намагається зробити, його власними словами. Це перше, на що падає ваш погляд.
- Назва інструменту та дія — наприклад,
googleCalendar.listEvents,fileSystem.writeFile. - Рівень ризику — кольоровий щит: зелений для безпечного читання, жовтий для запису, червоний для деструктивних операцій або операцій з грошима. Інструменти високого ризику також відображають банер із попередженням: «Це операція високого ризику. Схвалюйте лише якщо ви розумієте, що вона зробить».
- Деталі — розділ, що розгортається, з очищеними аргументами. Секрети (API-ключі, токени, паролі) видаляються перед відображенням. Перемикач Показати сирий JSON всередині відкриває незмінені дані, якщо ви хочете побачити, що саме надсилається.
Виберіть обсяг дозволу відповідно до ризику
У нижній частині вікна є чотири кнопки. Кожна відповідає за певний рівень довіри:
| Кнопка | Що вона робить |
|---|---|
| Відхилити | Заблокувати цю конкретну дію. Агент отримає відмову і зможе спробувати щось інше. |
| Схвалити один раз | Дозволити цей конкретний виклик, а потім знову запитати при наступному зверненні. Підходить для разових завдань. |
| Схвалити для розмови | Дозволити всі використання цього інструменту в межах поточної гілки. Скидається, коли ви починаєте нову розмову. Підходить для типових випадків: «Я проводжу дослідження протягом наступної години, нехай агент вільно шукає». |
| Завжди схвалювати | Постійний глобальний дозвіл для всіх розмов. Відображається червоним для інструментів високого ризику, щоб ви не натиснули за звичкою. Підходить для безпечних інструментів, якими ви користуєтеся постійно (наприклад, калькулятор). |
Спостерігайте за процесом
Після схвалення виклик інструменту виконується і з'являється на бічній панелі поруч із розмовою з його поточним статусом — очікує → виконується → успішно або помилка — разом із аргументами, з якими він був запущений, та отриманим результатом. Ніщо не запускається без вашого відома; ніщо не працює тихо у фоновому режимі.
Зупиніть у будь-який момент
Якщо схвалений вами інструмент поводиться неправильно або розмова йде не туди, куди ви планували, натисніть кнопку зупинки в полі введення. Агент негайно зупиниться, очікувані схвалення будуть скасовані, а будь-яка активна сесія браузера коректно закриється. Жодних покинутих викликів інструментів чи неконтрольованих циклів.
Коли агент робить паузу, щоб поставити вам запитання
Схвалення — це коли агент просить дозволу. Іноді агенту потрібні вхідні дані — він не впевнений, який із двох шляхів ви оберете, або хоче, щоб ви затвердили план, перш ніж він витратить десяток викликів інструментів на його виконання. Для цього він використовує окрему панель «людина в циклі», яка призупиняє хід і запитує вас напряму.
Панель показує заголовок, пропозицію у форматі markdown (план агента, його чернетку або запитання) та чотири кнопки відповіді:
- Схвалити — діяти згідно з пропозицією.
- Схвалити, але… — діяти з коригуваннями, які ви введете в полі для нотаток, що з'явиться. Агент продовжить той самий хід з урахуванням ваших вказівок.
- Відхилити, але… — не робити цього, і ось чому (або ось що я хотів би натомість). Знову ж таки, продовжує той самий хід з вашим обґрунтуванням.
- Відхилити — повністю відмовитися від цього напрямку.
Якщо пропозиція агента містить набір конкретних варіантів, вони відображаються як кнопки швидкого вибору над основними кнопками, щоб ви могли клікнути на відповідь замість введення тексту. Пропозиції високого ризику отримують червоний банер із попередженням над основним текстом. Ваша відповідь обробляється в межах поточного контексту — агент не починає спочатку, а просто продовжує нитку розмови з вашою відповіддю.
Зробіть це налаштуванням за замовчуванням: попросіть Caiioo створити обережний режим
Описаний вище робочий процес — це версія для кожної дії. Якщо ви хочете, щоб це було вашою позицією за замовчуванням для цілого класу завдань, найкращим рішенням буде режим.
Просто попросіть. У полі введення напишіть щось на кшталт:
«Створи новий режим під назвою Обережний, який завжди представляє план перед запуском будь-яких інструментів, просить мене схвалити план і не продовжує, поки я не підтверджу».
Caiioo використає свій вбудований інструмент конфігурації, щоб створити режим для вас — системну підказку, назву, налаштування за замовчуванням. Перемкніться на цей режим у селекторі режимів у заголовку, і кожен запуск агента починатиметься з плану, зупинятиметься для вашого схвалення і лише після цього торкатиметься інструментів. Пізніше редагуйте режим таким же чином: «Онови режим Обережний, щоб він також підсумовував результати після кожного кроку». Агент редагує сам себе.
Створення або оновлення власних режимів — це можливість тарифу Pro. Див. Режими та особистості для повної картини того, що можна налаштувати в режимах — системну підказку, увімкнені інструменти, змінні та інше.
Дивіться також
- Інструменти та інтеграції — Що є в каталозі інструментів і як увімкнути або вимкнути кожен із них
- Режими та персоналії — Що можна налаштувати в режимі та як перемикатися між ними
- Конфіденційність та дані — Чому облікові дані інструментів зберігаються у Keychain (або аналогах), а не в спільному файлі конфігурації
- Чому такий дизайн — Допис у блозі, що розкриває контраст безпеки з «автономними» агентами