Problem
You want to let the AI use tools — browse, write files, send messages — but only after you see what it intends to do and can stop or scope the action.

यह मूल अंग्रेजी दस्तावेज़ का मशीन अनुवाद है। इस अनुवाद और मूल अंग्रेजी संस्करण के बीच किसी भी विवाद की स्थिति में, अंग्रेजी संस्करण ही मान्य होगा। मूल अंग्रेजी संस्करण पढ़ें


AI क्या कर सकता है, इसे करने से पहले नियंत्रित करें

प्रत्येक एजेंट वेंडर आपको "पूर्ण स्वायत्तता!" बताता है। Caiioo का अनुबंध इसके विपरीत है: एजेंट वर्णन करता है कि वह क्या करने वाला है, और आप तय करते हैं कि उसे ऐसा करने देना है या नहीं — प्रति क्रिया, प्रति बातचीत, या हमेशा के लिए। यहाँ बताया गया है कि यह शुरू से अंत तक कैसा दिखता है।

शुरू करने से पहले

यह देखने के लिए कि आपके मोड के लिए वर्तमान में कौन से टूल सक्षम हैं, Settings > Tools खोलें। किसी भी ऐसी चीज़ को अक्षम करें जिसे आप नहीं चाहते कि एजेंट इस्तेमाल करे। अनुमोदन केवल उन टूल पर लागू होता है जो सक्षम हैं — अक्षम टूल मॉडल को कभी भी पेश नहीं किए जाते हैं।

जब एजेंट किसी टूल का उपयोग करना चाहता है

ऐसी किसी चीज़ के लिए पूछें जो टूल का उपयोग करती हो। "EU AI Act में हाल के बदलावों के लिए वेब पर खोजें," "कल के लिए मेरा कैलेंडर सूचीबद्ध करें," "इस नोट को एक फ़ाइल में सहेजें" — इनमें से कोई भी एजेंट को टूल कॉल का प्रस्ताव देने के लिए प्रेरित करेगा।

एजेंट अपने आप आगे नहीं बढ़ता है। Approval Required शीर्षक वाला एक मोडल रन को रोकता है और दिखाता है:

  • इरादा (Intent) — एजेंट अपने शब्दों में क्या करने की कोशिश कर रहा है, इसका एक लाइन का विवरण। यह पहली चीज़ है जिस पर आपकी नज़र पड़ती है।
  • टूल का नाम और क्रिया — जैसे, googleCalendar.listEvents, fileSystem.writeFile
  • जोखिम स्तर — रंग-कोडित शील्ड: कम जोखिम वाले पढ़ने के लिए हरा, लिखने के लिए एम्बर, विनाशकारी या पैसे भेजने जैसे कार्यों के लिए लाल। उच्च जोखिम वाले टूल एक चेतावनी बैनर भी दिखाते हैं: "यह एक उच्च जोखिम वाला ऑपरेशन है। केवल तभी अनुमति दें जब आप समझते हों कि यह क्या करेगा।"
  • विवरण — संशोधित तर्कों (arguments) के साथ एक विस्तार योग्य अनुभाग। प्रदर्शन से पहले गोपनीय जानकारी (API कुंजी, टोकन, पासवर्ड) हटा दी जाती है। अंदर एक Show raw JSON टॉगल अनछुए पेलोड को प्रकट करता है यदि आप देखना चाहते हैं कि वास्तव में क्या भेजा जा रहा है।

जोखिम के अनुसार दायरा चुनें

फुटर में चार बटन दिए गए हैं। प्रत्येक एक अलग भरोसे के निर्णय को दर्शाता है:

बटन यह क्या करता है
Deny इस एकल क्रिया को रोकें। एजेंट को अस्वीकृति मिल जाती है और वह कुछ और कोशिश कर सकता है।
Approve Once इस विशिष्ट कॉल की अनुमति दें, फिर अगली बार फिर से पूछें। एक बार के कार्यों के लिए सही।
Approve for Conversation वर्तमान थ्रेड के अंदर इस टूल के सभी उपयोगों की अनुमति दें। जब आप नई बातचीत शुरू करते हैं तो यह रीसेट हो जाता है। सामान्य मामले के लिए सही: "मैं अगले एक घंटे तक शोध कर रहा हूँ, एजेंट को स्वतंत्र रूप से खोजने दें।"
Always Approve सभी बातचीत में स्थायी वैश्विक अनुमति। उच्च-जोखिम वाले टूल के लिए लाल रंग में दिखाया गया है ताकि आप आदतवश क्लिक न कर सकें। कम जोखिम वाले टूल के लिए सही जिन्हें आप लगातार उपयोग करते हैं (जैसे कैलकुलेटर)।

इसे होते हुए देखें

एक बार स्वीकृत होने के बाद, टूल कॉल निष्पादित होती है और बातचीत के बगल में साइडपैनल में अपनी लाइव स्थिति के साथ दिखाई देती है — pending → executing → succeeded या failed — उन तर्कों के साथ जिन्हें उसने वास्तव में चलाया और जो परिणाम उसे मिला। ऐसा कुछ भी नहीं चलता जिसे आपने नहीं देखा; बैकग्राउंड में चुपचाप कुछ भी नहीं चलता।

किसी भी समय रोकें

यदि आपके द्वारा स्वीकृत टूल गलत व्यवहार कर रहा है या बातचीत उस दिशा में जा रही है जो आपका इरादा नहीं था, तो कंपोज़र पर स्टॉप बटन दबाएं। एजेंट तुरंत रुक जाता है, लंबित अनुमोदन साफ़ हो जाते हैं, और कोई भी सक्रिय ब्राउज़र सत्र सुरक्षित रूप से बंद हो जाता है। कोई लावारिस टूल कॉल नहीं, कोई अनियंत्रित लूप नहीं।

जब एजेंट आपसे सवाल पूछने के लिए रुकता है

अनुमोदन का मतलब है कि एजेंट अनुमति मांग रहा है। कभी-कभी एजेंट को इनपुट की आवश्यकता होती है — वह निश्चित नहीं होता कि आप दो रास्तों में से कौन सा चाहते हैं, या वह चाहता है कि आप किसी योजना को निष्पादित करने के लिए दर्जनों टूल कॉल खर्च करने से पहले उस पर हस्ताक्षर करें। इसके लिए वह एक अलग 'ह्यूमन-इन-द-लूप' पैनल का उपयोग करता है जो टर्न को रोकता है और आपसे सीधे पूछता है।

पैनल एक शीर्षक, एक मार्कडाउन-रेंडर किया गया प्रस्ताव (एजेंट की योजना, उसका ड्राफ्ट, उसका प्रश्न), और चार प्रतिक्रिया बटन दिखाता है:

  • Approve — प्रस्तावित तरीके से आगे बढ़ें।
  • Approve But… — दिखाई देने वाले नोट्स फ़ील्ड में आपके द्वारा टाइप किए गए समायोजन के साथ आगे बढ़ें। एजेंट आपके मार्गदर्शन के साथ उसी टर्न को जारी रखता है।
  • Reject But… — यह न करें, और यहाँ कारण बताया गया है (या मैं इसके बजाय क्या चाहूँगा)। फिर से, आपके तर्क के साथ उसी टर्न को जारी रखता है।
  • Reject — इस दिशा को पूरी तरह से छोड़ दें।

यदि एजेंट का प्रस्ताव ठोस विकल्पों का एक सेट प्रदान करता है, तो वे बटन के ऊपर क्विक-पिक चिप्स के रूप में दिखाई देते हैं ताकि आप टाइप करने के बजाय उत्तर पर क्लिक कर सकें। उच्च-जोखिम वाले प्रस्तावों को बॉडी के ऊपर एक लाल चेतावनी बैनर मिलता है। आपकी प्रतिक्रिया इनलाइन हल हो जाती है — एजेंट फिर से शुरू नहीं करता है, वह बस आपके उत्तर के साथ थ्रेड को आगे बढ़ाता है।

इसे डिफ़ॉल्ट बनाएं: Caiioo को एक सतर्क (cautious) मोड बनाने के लिए कहें

ऊपर दिया गया वर्कफ़्लो प्रति-क्रिया संस्करण है। यदि आप इसे कार्यों के पूरे वर्ग के लिए अपनी डिफ़ॉल्ट स्थिति के रूप में चाहते हैं, तो सबसे स्पष्ट उत्तर एक मोड है।

बस पूछें। कंपोज़र में, कुछ इस तरह टाइप करें:

"Cautious नाम का एक नया मोड बनाएं जो किसी भी टूल को निष्पादित करने से पहले हमेशा एक योजना प्रस्तुत करे, मुझसे योजना को अनुमोदित करने के लिए कहे, और जब तक मैं पुष्टि न करूं तब तक आगे न बढ़े।"

Caiioo आपके लिए मोड तैयार करने के लिए अपने अंतर्निहित कॉन्फ़िगरेशन टूल का उपयोग करेगा — सिस्टम प्रॉम्प्ट, नाम, डिफ़ॉल्ट। हेडर मोड पिकर से उस मोड पर स्विच करें और प्रत्येक एजेंट रन एक योजना के साथ शुरू होगा, आपकी स्वीकृति के लिए रुकेगा, और उसके बाद ही टूल को छुएगा। बाद में उसी तरह मोड को संपादित करें: "प्रत्येक चरण के बाद परिणामों को सारांशित करने के लिए Cautious मोड को अपडेट करें।" एजेंट खुद को संपादित करता है।

कस्टम मोड बनाना या अपडेट करना एक Pro-टियर क्षमता है। मोड क्या कॉन्फ़िगर कर सकते हैं — सिस्टम प्रॉम्प्ट, सक्षम टूल, चर, और बहुत कुछ — इसकी पूरी तस्वीर के लिए मोड्स और व्यक्तित्व देखें।

यह भी देखें

  • Tools & Integrations — टूल कैटलॉग में क्या है और प्रत्येक को कैसे सक्षम या अक्षम करें
  • Modes & Personalities — एक मोड क्या कॉन्फ़िगर कर सकता है, और उनके बीच कैसे स्विच करें
  • Privacy & Data — टूल द्वारा उपयोग किए जाने वाले क्रेडेंशियल साझा कॉन्फ़िगरेशन फ़ाइल के बजाय Keychain (या समकक्ष) में क्यों रहते हैं
  • Why this design — ब्लॉग पोस्ट जो "स्वायत्त" एजेंटों के साथ सुरक्षा अंतर को स्पष्ट करता है