On-device pseudonymizer: built and benchmarked

এটি মূল ইংরেজি নথির একটি মেশিন অনুবাদ। এই অনুবাদ এবং মূল ইংরেজি সংস্করণের মধ্যে কোনো বিরোধ দেখা দিলে, ইংরেজি সংস্করণটিই প্রাধান্য পাবে। মূল ইংরেজি সংস্করণটি পড়ুন


অন-ডিভাইস সিউডোনিমাইজার (Pseudonymizer): তৈরি এবং বেঞ্চমার্ক করা হয়েছে

2026-05-22 · Caiioo Team

আমরা AI সিস্টেমের আসল ব্যক্তিগত তথ্য (PII) প্রশিক্ষণ এবং সংরক্ষণের গোপনীয়তা সমস্যার সমাধান করতে চেয়েছিলাম। "Zero Data Retention" পলিসি এবং চুক্তিগুলো ঝুঁকি কমায়, কিন্তু সেগুলো অনেক ব্যতিক্রমের দ্বারা সীমাবদ্ধ। সেগুলো মূলত বলে: "আমরা আপনার কোনো প্রম্পট বা আউটপুট সংরক্ষণ করব না, তবে এই ব্যতিক্রমগুলো ছাড়া: (নিরাপত্তা উদ্দেশ্য, সরকারি নজরদারি, আইনি বাধ্যবাধকতা, পণ্য উন্নয়ন, এরর লগ, পরিষেবার উন্নতি...)"

এটি সমাধান করার জন্য, আমরা একটি ব্যক্তিগত ডেটা ফিল্টার তৈরি করেছি যা ব্যবহারকারীর নিজস্ব মেশিনে চলে, ডিভাইস থেকে মেসেজ বের হওয়ার আগে সেটি দেখে এবং ব্যবহারকারী ফিল্টার ছাড়া মেসেজ পাঠালে যে উত্তর পেতেন ঠিক সেই উত্তরটিই নিশ্চিত করে।

তাই আমরা একটি তৈরি করেছি। Caiioo-এর পরবর্তী সংস্করণে Pseudonymizer অন্তর্ভুক্ত থাকবে। এটি এজেন্ট চ্যাটের শিল্ড আইকন এবং সেটিংসের মাধ্যমে অ্যাক্সেস করা যাবে।

এই হোয়াইট পেপারটি আমাদের গোপনীয়তা ফিল্টারিং সিস্টেমের যৌক্তিকতা, আর্কিটেকচার, মূল্যায়ন প্রক্রিয়া এবং ডিজাইনের নীতিগুলো তুলে ধরে।

আমরা যা করতে চেয়েছি

ডেটা মিনিমাইজেশনের মাধ্যমে সাধারণ গোপনীয়তা সুরক্ষা। যখন একজন ব্যবহারকারী একটি রিমোট মডেলের সাথে চ্যাট করেন, তখন ব্যবহারকারীর প্রশ্নের উত্তর দেওয়ার জন্য মডেলটির আসল নাম, বাড়ির ঠিকানা, আসল ইমেল বা গ্রাহকের ফোন নম্বরের প্রয়োজন হয় না। এর প্রয়োজন প্রশ্নের ধরন (shape), এবং এটিকে একটি আসল প্রশ্নের মতো হতে হবে যাতে LLM কোয়েরিটিকে একটি পরীক্ষা হিসেবে বাতিল করে না দেয়। তাই ফিল্টারটি AI-এর কাছে পাঠানো ডেটা থেকে আসল আইডেন্টিফায়ারগুলো সরিয়ে ফেলে এবং ফিরে আসার পথে আসল মানগুলো আবার যুক্ত করে দেয়। মডেলটি সিন্থেটিক নাম এবং আইডেন্টিফায়ার দেখে; ব্যবহারকারী আসল কথোপকথন দেখতে পান।

HIPAA কমপ্লায়েন্স সহায়তা। দ্বিতীয় মোডটি HIPAA Safe Harbor নিয়মের (§164.514) ১৮টি আইডেন্টিফায়ার এবং তুলনামূলক শিথিল Limited Data Set ভেরিয়েন্টকে লক্ষ্য করে। একজন ক্লিনিশিয়ান, একজন হেলথকেয়ার অ্যাডমিন, বা কভারড ওয়ার্কফ্লোতে কাজ করা যে কেউ AI-এর কাছে প্রোটেক্টেড হেলথ ইনফরমেশন না পাঠিয়েই আসল কেসগুলো নিয়ে একটি জেনারেল-পারপাস মডেলের সাথে কথা বলতে পারেন। আমরা কভারড এনটিটির কমপ্লায়েন্স অফিসার নই — তবে আমরা সেই লেয়ার হতে পারি যা PHI-কে ল্যাপটপ থেকে বের হতে বাধা দেয়। আমাদের মূল্যায়নগুলো পরিমাপযোগ্য বেঞ্চমার্ক প্রদান করে যা সংস্থাগুলো তাদের কমপ্লায়েন্স এবং গোপনীয়তার মানদণ্ডের জন্য ফিল্টারটির উপযুক্ততা যাচাই করতে ব্যবহার করতে পারে। সমস্ত গোপনীয়তা এবং নিরাপত্তা ব্যবস্থা হলো বিচারবুদ্ধিপ্রসূত সিদ্ধান্ত যা ব্যবহারকারী বা ব্যবহারকারী এনটিটির দায়িত্ব।

আমরা উভয়ই বেছে নিয়েছি কারণ এগুলোর ইঞ্জিনিয়ারিং একই, এবং PHI ব্যবহারের ক্ষেত্রটি প্রযুক্তিগতভাবে আসলে সহজ কারণ এতে সুনির্দিষ্ট নেমড এনটিটি (named entities) ব্যবহার করা হয়, যা Personal Data ক্যাটাগরির সাধারণ ডেটার তুলনায় রেড্যাক্ট (redact) করা সহজ। HIPAA ফিল্টারিংয়ের ক্ষেত্রে এটি সাধারণত ইংরেজি বা স্প্যানিশ ভাষায় হওয়ার বিষয়টিও সহায়ক। আমরা আইডেন্টিফায়ারগুলো শনাক্ত করি, একই ফরম্যাটে স্থিতিশীল ছদ্মনাম এবং প্রতিস্থাপিত আইডেন্টিফায়ার বসাই, ফিরে আসার পথে সেগুলো পুনরুদ্ধার করি এবং কখনোই আসল মানগুলো লগ করি না। সিন্থেটিক তথ্য এবং আসল তথ্যের মধ্যকার ম্যাপটি শুধুমাত্র ব্যবহারকারীর ডিভাইসেই থাকে, যাতে ব্যবহারকারী এজেন্টের প্রতিক্রিয়াগুলোতে আসল তথ্য পড়তে পারেন। মোড পরিবর্তনের সাথে সাথে শুধুমাত্র ক্যাটাগরি লিস্ট এবং পলিসি গেট পরিবর্তিত হয়।

কেন regex এবং machine learning উভয়ই প্রয়োজন, শুধু একটি নয়

আমাদের pseudonymizer-এ দুটি প্রধান ফিল্টার প্রযুক্তি রয়েছে: একটি ডিটারমিনিস্টিক প্যাটার্ন রিকগনিশন ল্যাঙ্গুয়েজ যাকে regex বলা হয় এবং প্রশিক্ষিত machine learning মডেল।

Surface formats বা বাহ্যিক কাঠামোর ক্ষেত্রে regex অপরাজেয়। একটি ইমেল অ্যাড্রেসের একটি নির্দিষ্ট আকার থাকে ([email protected])। তেমনি একটি IP, ক্রেডিট কার্ড, IBAN, VIN, SSN (XXX-XX-XXXX), অথবা একটি API key-এরও নির্দিষ্ট কাঠামো থাকে। যদি ফরম্যাটটি নির্ভরযোগ্য হয়, তবে regex কোনো মডেল লোড বা ইনফারেন্স খরচ ছাড়াই প্রতিবার ডিটারমিনিস্টিক উপায়ে এটি শনাক্ত করতে পারে।

যাইহোক, context বা প্রসঙ্গের ক্ষেত্রে regex একেবারেই অকার্যকর। "Sarah's chart from last Tuesday" বাক্যটিতে একজন ব্যক্তি এবং একটি তারিখ রয়েছে, কিন্তু শুধুমাত্র ফরম্যাট দেখে এদের আলাদা করা সম্ভব নয়। "The patient at 14 Elm" বাক্যটিতে এমন একটি ঠিকানা রয়েছে যা হাজার হাজার অ-ঠিকানা শব্দের সাথে মিলে যেতে পারে। "Their MRN is 7741032" - এই বাক্যটিতে সংখ্যাটির অর্থ বোঝার জন্য তার চারপাশের শব্দগুলো প্রয়োজন।

একটি ছোট fine-tuned ল্যাঙ্গুয়েজ মডেল এই প্রসঙ্গগুলো পরিচালনা করে — আমাদেরটি একটি বিশেষভাবে প্রশিক্ষিত 110M-parameter এনকোডার যা একটি বহুভাষিক tiny language model থেকে ডিস্টিল করা হয়েছে। এটি সাবস্ট্রিং নয়, বরং পুরো বাক্যটি পড়ে এবং এটি আকারে যথেষ্ট ছোট হওয়ায় ডিভাইসে, এমনকি মোবাইল ফোনেও অত্যন্ত দ্রুত চলতে পারে।

বেঞ্চমার্কগুলো এই দুটি স্তরের পরিপূরক শক্তি প্রদর্শন করে। প্রতিটি স্তর আসলে কতটা কার্যকর তা নিশ্চিত করার জন্য আমরা আইসোলেশনে দুটি স্তরের বেঞ্চমার্ক করেছি। ১৫০টি প্রশ্নের PrivacyBench-PD সেটটিতে, যেখানে প্রশ্ন এবং উত্তরগুলো মডেলটিকে প্রশিক্ষণ দিতে স্পষ্টভাবে ব্যবহার করা হয়নি:

Layer PII caught Caught rate
Regex only 205 / 670 30.6 %
ML only 516 / 670 77.0 %
Both (production) 625 / 670 93.3 %

শুধুমাত্র regex তিন-চতুর্থাংশ আইডেন্টিফায়ার মিস করে কারণ বাস্তব গদ্যের বেশিরভাগ আইডেন্টিফায়ার সুগঠিত নয়। শুধুমাত্র ML ১৬ শতাংশ পয়েন্ট মিস করে যা regex স্তরটি শনাক্ত করতে পারত — অর্থাৎ সেই জিনিসগুলো যা সম্পূর্ণরূপে তাদের আকৃতির ওপর নির্ভরশীল (একটি ক্রেডিট কার্ড দেখতে ক্রেডিট কার্ডের মতোই; এখানে মডেলের যোগ করার মতো বাড়তি কোনো সিগন্যাল নেই)। একত্রে তারা এমন সব ক্ষেত্র কভার করে যা একা কোনোটিই পারে না।

প্রতিটি স্তর কোথায় সিদ্ধান্তমূলক ভূমিকা রাখে তা গভীরভাবে পর্যবেক্ষণ করলে দেখা যায়: একই সেটের মধ্যে, ১৬টি টেস্ট ভ্যালু শুধুমাত্র regex দ্বারা শনাক্ত হয়েছে (ইমেল, IP, ফিন্যান্সিয়াল অ্যাকাউন্ট, স্ট্রাকচার্ড ID) এবং ৩২৭টি শুধুমাত্র ML দ্বারা শনাক্ত হয়েছে (নাম, প্রসঙ্গিক আইডেন্টিফায়ার, বহুভাষিক বাক্যাংশ)।

ছোট, বুদ্ধিমান, দ্রুত — এবং সব জায়গায় চলে

আমাদের ফিল্টারটিকে অন-ডিভাইস করতে হয়েছে, যা একটি ইঞ্জিনিয়ারিং চ্যালেঞ্জ ছিল।

এটি ছোট হতে হবে কারণ আমাদের অ্যাপ অনেক সিস্টেমে চলে: ব্রাউজার এক্সটেনশন, macOS অ্যাপ, iOS অ্যাপ, Android অ্যাপ, অথবা Windows এবং Linux-এ। প্রতিটি মডেলের বান্ডেল সাইজ প্রায় ১১৩ MB। এখানে দুটি মডেল রয়েছে — একটি সাধারণ ব্যক্তিগত ডেটার জন্য, অন্যটি সুরক্ষিত স্বাস্থ্য তথ্যের জন্য — এবং Safe Harbor মোড দুটিকেই সমান্তরালভাবে চালায়। এগুলোর মধ্যে একটি লো-এন্ড Android ডিভাইস সবচেয়ে কম পারফরম্যান্স দেয়, তবুও আমাদের সিস্টেম সেখানে ঠিকঠাক কাজ করে।

এটি বুদ্ধিমান হতে হবে কারণ ভুল নেগেটিভ হলে আসল ডেটা রিমোট LLM-এ ফাঁস হয়ে যায় এবং ভুল পজিটিভ হলে কথোপকথন নষ্ট হয়ে যায়। নাম অবশ্যই রিড্যাক্ট করতে হবে; কিন্তু সর্বনাম নয়। ফরোয়ার্ড করা থ্রেডে ডাক্তারের ইমেল রিড্যাক্ট করা উচিত; কিন্তু [email protected] ফুটার সম্ভবত নয়।

এটি দ্রুত হতে হবে কারণ এটি ব্যবহারকারীর পাঠানো বা গ্রহণ করা প্রতিটি মেসেজের মাঝখানে থাকে। আমরা পরিমাপ করেছি যে একটি একক CPU থ্রেডে রাউন্ড-ট্রিপ ওভারহেড ২০০ ms-এর কম, যার বেশিরভাগই টোকেনাইজেশন। WebGPU এবং Apple-এর Neural Engine-এ এটি LLM কলের নেটওয়ার্ক ল্যাটেন্সির তুলনায় অত্যন্ত সামান্য।

এটি একাধিক রানটাইমে চলতে হবে কারণ Caiioo মাল্টি-প্ল্যাটফর্ম। একই সিস্টেম Chrome এক্সটেনশন, macOS এবং iOS, Android এবং Windows ও Linux-এ চলে। একটি ডিটেকশন মডেল, একটি regex লাইব্রেরি, একটি মার্জার, একটি পলিসি — Caiioo যেখানেই চলে সবখানে অভিন্ন আচরণ করে।

স্কোরসমূহ

কয়েক রাউন্ড পরীক্ষা এবং প্রশিক্ষণের পর, আমরা আমাদের মডেলের ১৬তম সংস্করণে স্থির হয়েছি। নিচে তিনটি বেঞ্চমার্ক দেওয়া হলো, যার প্রতিটি ভিন্ন ভিন্ন বিষয় পরিমাপ করে।

আমাদের নিজস্ব টেস্ট সেট, ১৫০টি প্রশ্ন যা মডেলটি আগে কখনও দেখেনি

পাবলিক বেঞ্চমার্কের বিরুদ্ধে পরীক্ষা করার আগে, আমরা আমাদের Personal Data ফিল্টারটিকে একটি অভ্যন্তরীণ টেস্ট সেটের বিরুদ্ধে চালিয়েছি যা আমরা ইচ্ছাকৃতভাবে প্রশিক্ষণ ডেটা থেকে আলাদা রেখেছিলাম — যাতে ডিটেক্টরটি আগে কখনও এই প্রশ্নগুলোর কোনোটি না দেখে। ১৫০টি প্রশ্ন চারটি গ্রুপে বিভক্ত (code snippets, document prose, ইচ্ছাকৃতভাবে অপরিচিত শব্দবিন্যাস এবং ১০টি অ-ইংরেজি ভাষা), সাথে একটি "নেগেটিভ" গ্রুপ যাতে কোনো ব্যক্তিগত ডেটা নেই (এটি নিশ্চিত করার জন্য যে আমরা অতিরিক্ত রেড্যাক্ট বা তথ্য মুছে ফেলছি না)। সম্মিলিত regex + ML পাইপলাইন:

সাব-বেঞ্চ (Sub-bench) ধরা পড়েছে (Caught) হার (Rate)
code_bench 69 / 74 93.2 %
doc_bench 233 / 247 94.3 %
generalization_bench 123 / 133 92.5 %
multilingual_bench 200 / 216 92.6 %
সবগুলো ৪টি পজিটিভ বেঞ্চ 625 / 670 93.3 %

(নেগেটিভ গ্রুপে খুঁজে পাওয়ার মতো কোনো ব্যক্তিগত ডেটা ছিল না। ফিল্টারটি একটি জিনিস মাস্ক করেছিল যা করা উচিত ছিল না — যা নিচের প্রিসিশন সংখ্যার সাথে সামঞ্জস্যপূর্ণ।)

গ্রেডারটি অত্যন্ত কঠোর: প্রশ্নের স্কোর পাওয়ার জন্য মাস্ক করা আউটপুট থেকে প্রতিটি প্রত্যাশিত ব্যক্তিগত ডেটা সম্পূর্ণভাবে অদৃশ্য হতে হবে। কোনো আংশিক ক্রেডিট বা "কাছাকাছি গেছে" এমন সুযোগ নেই। এটি সেইসব বেঞ্চমার্কের চেয়েও কঠোর যা অন্য একটি LLM-কে বিচারক হিসেবে ব্যবহার করে (LLM বিচারকরা সাধারণত উদার হয়ে থাকেন)। অন্যান্য সিস্টেমের সাথে সরাসরি তুলনামূলক সংখ্যার জন্য নিচের হেড-টু-হেড বিভাগটি দেখুন।

PrivacyBenchHIPAA — ৪০টি স্বাস্থ্যসেবা সংক্রান্ত প্রশ্ন

প্রতিটি প্রশ্নে সুরক্ষিত স্বাস্থ্য তথ্য (protected health information) তালিকাভুক্ত থাকে যা অবশ্যই রেড্যাক্ট করতে হবে (নাম, মেডিকেল রেকর্ড নম্বর ইত্যাদি) এবং কিছু সংকেত যা অবশ্যই রাখতে হবে (তারিখ, ভৌগোলিক অবস্থান, ৯০ বছরের কম বয়স হলে বয়স — HIPAA Limited Data Set নিয়ম অনুযায়ী)। গ্রেডারটি উভয় দিক পরীক্ষা করে: আমরা কি যা মুছে ফেলার কথা ছিল তা মুছেছি, এবং যা রাখার কথা ছিল তা কি রেখেছি?

মোড (Mode) PHI রেড্যাক্ট করা হয়েছে রিটেইনড রাখা হয়েছে
Limited Data Set (তারিখ / ভূগোল / বয়স ≤৮৯ সংরক্ষণ) 79 / 79 (100 %) 34 / 34
Safe Harbor (তারিখসহ সবকিছু রেড্যাক্ট করা) 99 / 104 (95.2 %)

Limited Data Set সাবমোডটি এই বেঞ্চমার্কে নিখুঁত ফলাফল দিয়েছে। Safe Harbor — যেখানে রেড্যাক্ট করার মতো তথ্য বেশি থাকে, তাই ভুল হওয়ার সম্ভাবনাও বেশি — সেখানে ৯৫.২% কভার করেছে।

আমাদের নিজস্ব ডেটাতে ক্যাটাগরি-ভিত্তিক ফলাফল, প্রতি মোডে ২০০টি স্যাম্পল

পাবলিক বেঞ্চমার্কগুলো সবকিছু একসাথে মিলিয়ে ফেলে। আমাদের অভ্যন্তরীণ টেস্ট ডেটা ফলাফলগুলোকে ক্যাটাগরি অনুযায়ী (নাম, ইমেল, ঠিকানা ইত্যাদি) ভাগ করে এবং প্রতিটি তিনটি উপায়ে চালায়: শুধুমাত্র regex, শুধুমাত্র ML, এবং উভয়ই একসাথে। এটি আমাদের স্পষ্টভাবে জানায় যে কোন প্রযুক্তি কোন ধরনের আইডেন্টিফায়ার ধরছে — এবং কোথায় একটির জন্য অন্যটির প্রয়োজন। সাম্প্রতিকতম রান, 2026-05-20:

তিনটি ফিল্টার মোডের সারসংক্ষেপ

মোড (Mode) সম্মিলিত রিকল (Recall) প্রিসিশন (Precision) F2 স্যাম্পল
Personal Data filter 97.3 % 97.8 % 97.4 200
HIPAA filter — Limited Data Set 92.3 % 92.3 % 92.3 200
HIPAA filter — Safe Harbor 91.9 % 91.5 % 91.8 200

এই সংখ্যাগুলোতে URL অন্তর্ভুক্ত নয়, যা আমরা ইচ্ছাকৃতভাবে রেখে দিই — একটি URL মুছে ফেললে "এই লিঙ্কটি ওপেন করুন" বা "ওই পেজটি ফেচ করুন"-এর মতো পরবর্তী কাজগুলো বাধাগ্রস্ত হবে। এই বিষয়ে নিচের ওয়ার্কফ্লো বিভাগে আরও বিস্তারিত রয়েছে।

প্রতি-ক্যাটাগরি টেবিলের আগে মূল চিত্র: প্রতিটি মোডে, একজন ব্যক্তিকে প্রকৃতপক্ষে শনাক্ত করে এমন আইডেন্টিফায়ারগুলো ১০০% বা তার কাছাকাছি সময়ে ধরা পড়ে। নাম, ইমেল, ফোন নম্বর, ডাক ঠিকানা, সরকারি আইডি, বায়োমেট্রিক আইডি, সুনির্দিষ্ট জিওলোকেশন, মেডিকেল রেকর্ড নম্বর, জন্ম তারিখ, সোশ্যাল সিকিউরিটি নম্বর — প্রতিটি স্যাম্পল এবং প্রতিটি টেস্টে ধরা পড়েছে। যেসব ক্যাটাগরিতে আমরা ১০০%-এর নিচে নেমেছি সেগুলো অনুমানযোগ্য: ডিভাইস আইডি (আসল টেক্সটে ফরম্যাটের বিশাল বৈচিত্র্য), বিবিধ প্রাতিষ্ঠানিক আইডি (লয়্যালটি নম্বর, এমপ্লয়ি আইডি — একই সমস্যা), এবং ফটো (একটি টেক্সট-অনলি ফিল্টার ছবির ভেতরে কী আছে তা দেখতে পায় না)। এগুলোর কোনোটিই "চার্টে থাকা নাম" বা "ড্রাফটে থাকা ইমেল"-এর মতো আইডেন্টিফায়ার নয় যা তথ্য ফাঁসের ক্ষেত্রে আসলে গুরুত্বপূর্ণ। উচ্চ-ঝুঁকিপূর্ণ ক্যাটাগরিগুলো নির্ভরযোগ্য।

Personal Data filter

সম্মিলিত রিকল (সেরাটি আগে) এবং তারপর রিস্ক টিয়ার (T1 = সবচেয়ে সংবেদনশীল) অনুযায়ী সাজানো।

ক্যাটাগরি টিয়ার Regex রিকল ML রিকল (raw) সম্মিলিত রিকল Gold n
biometric_id T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
email_address T1 100.0 % (20/20) 100.0 % (20/20) 100.0 % 20
government_id T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
person_name T1 13.3 % (4/30) 96.7 % (29/30) 100.0 % 30
phone_or_fax T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
postal_address T1 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
precise_geolocation T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
birth_date T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
ip_address T2 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
online_handle T2 40.0 % (4/10) 100.0 % (10/10) 100.0 % 10
vehicle_id T2 50.0 % (5/10) 100.0 % (10/10) 100.0 % 10
authentication_secret T4 40.0 % (4/10) 100.0 % (10/10) 100.0 % 10
financial_account T1 90.0 % (18/20) 100.0 % (20/20) 90.0 % 20
institutional_id T3 80.0 % (8/10) 90.0 % (9/10) 90.0 % 10
device_id T3 40.0 % (4/10) 50.0 % (5/10) 80.0 % 10

বিশ্লেষণ করলে দেখা যায়, দ্বি-স্তরীয় ডিজাইনটি কাজে দিচ্ছে। ডাক ঠিকানা, জন্ম তারিখ এবং ব্যক্তির নাম শুধুমাত্র regex-এর অধীনে ০–১৩% স্কোর করে — কারণ এগুলোর মিলানোর মতো কোনো নির্দিষ্ট আকার নেই, তাই শুধুমাত্র ML মডেল এগুলো ধরতে পারে। ইমেল, ফোন নম্বর, IP, সরকারি আইডি, বায়োমেট্রিক আইডি এবং সুনির্দিষ্ট জিওলোকেশন শুধুমাত্র regex-এর অধীনে ১০০% স্কোর করে — যা ML মডেল সহজেই পেয়ে যায়। অনলাইন হ্যান্ডেল, ভেহিকল আইডি এবং অথেন্টিকেশন সিক্রেট মিশ্রিত ফলাফল দেয়: regex স্ট্যান্ডার্ড ফর্মগুলো ধরে ফেলে, ML বাকিগুলো ধরে। প্রতিটি ক্যাটাগরিতে সম্মিলিত রিকল একক স্তরের চেয়ে বেশি বা সমান।

ডিভাইস আইডি এবং বিবিধ প্রাতিষ্ঠানিক আইডি ক্যাটাগরিগুলো ১০০%-এর নিচে রয়েছে এবং আমরা জানি কেন: আসল টেক্সটে এগুলোর ফরম্যাটের ব্যাপক বৈচিত্র্য রয়েছে। আমরা যেসব ক্যাটাগরিতে রিকল কম সেখানে ফিল্টারটি নিখুঁত বলে দাবি না করে বরং সত্যটি প্রকাশ করতে পছন্দ করি।

HIPAA filter — Limited Data Set submode

Limited Data Set সাবমোডটি ডিজাইন অনুযায়ী তারিখ, ভূগোল এবং ৮৯ বা তার কম বয়স সংরক্ষণ করে — এগুলো সেই সংকেত যা HIPAA একটি সংস্থাকে বৈধ ক্লিনিকাল গবেষণা এবং অপারেশনের জন্য রাখার অনুমতি দেয়।

ক্যাটাগরি টিয়ার Regex রিকল ML রিকল (raw) সম্মিলিত রিকল Gold n
biometric_id T1 100.0 % (12/12) 100.0 % (12/12) 100.0 % 12
email_address T1 100.0 % (13/13) 100.0 % (13/13) 100.0 % 13
medical_record_number T1 100.0 % (26/26) 100.0 % (26/26) 100.0 % 26
person_name T1 15.4 % (4/26) 100.0 % (26/26) 100.0 % 26
phone_or_fax T1 100.0 % (13/13) 100.0 % (13/13) 100.0 % 13
social_security_number T1 100.0 % (12/12) 100.0 % (12/12) 100.0 % 12
account_number T2 0.0 % (0/13) 100.0 % (13/13) 100.0 % 13
health_plan_id T2 0.0 % (0/13) 100.0 % (13/13) 100.0 % 13
ip_address T2 100.0 % (12/12) 100.0 % (12/12) 100.0 % 12
license_number T2 0.0 % (0/12) 100.0 % (12/12) 100.0 % 12
vehicle_id T2 25.0 % (3/12) 100.0 % (12/12) 100.0 % 12
device_id T3 41.7 % (5/12) 100.0 % (12/12) 100.0 % 12
photo T2 0.0 % (0/12) 0.0 % (0/12) 0.0 % 12

ফটো একটি পরিচিত মিস — একটি টেক্সট-অনলি ফিল্টার ছবির ভেতরে কী আছে তা দেখতে পায় না। Image-PHI একটি আলাদা সমস্যা যা আমরা এখনও রিলিজ করিনি। এই মোডের অন্য প্রতিটি ক্যাটাগরি ১০০%-এ রয়েছে।

HIPAA filter — Safe Harbor submode

Safe Harbor সেই সবকিছু মুছে ফেলে যা Limited Data Set সাবমোড রেখে দিত — তারিখ, ৮৯ বছরের বেশি বয়স, ভূগোল। কঠোরতম কভারেজ পেতে এটি সমান্তরালভাবে উভয় ফিল্টার মডেল চালায়: HIPAA-নির্দিষ্ট এবং সাধারণ ব্যক্তিগত-ডেটা ফিল্টার।

ক্যাটাগরি টিয়ার Regex রিকল ML রিকল (raw) সম্মিলিত রিকল Gold n
age_over_89 T1 100.0 % (18/18) 0.0 % (0/18) 100.0 % 18
biometric_id T1 100.0 % (9/9) 100.0 % (9/9) 100.0 % 9
email_address T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
medical_record_number T1 100.0 % (20/20) 100.0 % (20/20) 100.0 % 20
person_name T1 20.0 % (4/20) 100.0 % (20/20) 100.0 % 20
phone_or_fax T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
social_security_number T1 90.0 % (9/10) 100.0 % (10/10) 100.0 % 10
account_number T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
general_date T2 100.0 % (27/27) 29.6 % (8/27) 100.0 % 27
health_plan_id T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
ip_address T2 100.0 % (9/9) 100.0 % (9/9) 100.0 % 9
license_number T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
vehicle_id T2 10.0 % (1/10) 100.0 % (10/10) 100.0 % 10
device_id T3 22.2 % (2/9) 88.9 % (8/9) 77.8 % 9
photo T2 0.0 % (0/9) 0.0 % (0/9) 0.0 % 9

দুটি আকর্ষণীয় রো হলো সাধারণ তারিখ (regex ১০০%, ML ৩০%) এবং ৮৯ বছরের বেশি বয়স (regex ১০০%, ML ০%)। আমরা ইচ্ছাকৃতভাবে Safe Harbor-এ উভয়ই regex-কে সামলাতে দিয়েছি: তারিখের এমন একটি আকার আছে যা regex প্রতিবার ধরে ফেলে, এবং আমরা চাই না কোনো সম্ভাব্য মডেল ">৮৯"-এর মতো একটি সংখ্যাসূচক থ্রেশহোল্ড নিয়ে দ্বিধা করুক। ML মডেলকে একই নিয়ম শেখানোর চেয়ে একটি ডিটারমিনিস্টিক নিয়ম বেশি নির্ভরযোগ্য।

সকল ক্যাটাগরি জুড়ে সামগ্রিক সংখ্যা

সবকিছু যোগ করলে: পূর্ণ পাইপলাইন (regex + ML একসাথে) একক স্তরের তুলনায় কেমন ফলাফল দেয়?

মোড স্তরসমূহ রিকল প্রিসিশন F2
Personal Data শুধুমাত্র regex 65.8 % 93.0 % 69.9 %
Personal Data শুধুমাত্র ML 95.4 % 92.4 % 94.8 %
Personal Data উভয় (পূর্ণ) 96.9 % 98.0 % 97.1 %
Limited Data Set শুধুমাত্র regex 55.9 % 95.0 % 60.9 %
Limited Data Set শুধুমাত্র ML 92.9 % 84.5 % 91.0 %
Limited Data Set উভয় (পূর্ণ) 92.9 % 89.3 % 92.1 %
Safe Harbor শুধুমাত্র regex 58.9 % 93.6 % 63.6 %
Safe Harbor শুধুমাত্র ML 82.4 % 88.3 % 83.5 %
Safe Harbor উভয় (পূর্ণ) 92.4 % 88.9 % 91.7 %

Personal Data ফিল্টারের "পূর্ণ" রো প্রতিটি মেট্রিক-এ একক স্তরের সংস্করণগুলোকে ছাড়িয়ে গেছে — regex (সারফেস ফরম্যাটের জন্য) এবং ML মডেলের (প্রসঙ্গের জন্য) সংমিশ্রণ প্রকৃতপক্ষে এমন কিছু প্রদান করে যা একক কোনো স্তর পারে না। এই পোস্টের শুরুতে উল্লিখিত ৯৭.৩% সংখ্যাটি একজন প্রকৃত ব্যবহারকারী যা পান তা প্রতিফলিত করে। উপরের টেবিলের সংখ্যাটি কিছুটা কম কারণ এতে URL ক্যাটাগরি অন্তর্ভুক্ত রয়েছে, যা আমরা ইচ্ছাকৃতভাবে সংরক্ষণ করি যাতে লিঙ্ক এবং টুল কলগুলো নষ্ট না হয়।

অন্যান্য ডেডিকেটেড প্রাইভেসি ফিল্টারের সাথে সরাসরি তুলনা

আমাদের মতো অন-ডিভাইস, তাৎক্ষণিক প্রাইভেসি ফিল্টারের জন্য সঠিক তুলনা হলো অন্যান্য অন-ডিভাইস, তাৎক্ষণিক প্রাইভেসি ফিল্টারের সাথে — বিশাল ক্লাউড-হোস্টেড LLM-এর সাথে নয় যা প্রতি মেসেজে কয়েক সেকেন্ড সময় নেয় এবং নেটওয়ার্ক রাউন্ড-ট্রিপের প্রয়োজন হয়। আমরা একই টেস্ট সেট এবং একই ম্যাচিং রুল ব্যবহার করে এই ক্লাসের প্রতিটি সিস্টেম চালিয়েছি। সবার জন্য একই মানদণ্ড।

সহকর্মী ক্লাস (Peer class):

  • openai/privacy-filter — OpenAI-এর ওপেন-সোর্স ডেডিকেটেড প্রাইভেসি ফিল্টার। প্রায় ৫০ মিলিয়ন প্যারামিটার, যেকোনো আধুনিক ব্রাউজারে চালানোর মতো ছোট।
  • piiranha-v1 — iiiorg থেকে একটি ২৭৮M-প্যারামিটার ডিটেক্টর। এর লাইসেন্স এটিকে শুধুমাত্র গবেষণা এবং মূল্যায়নের মধ্যে সীমাবদ্ধ রাখে (আমরা এটি পরিমাপ করতে পারি, কিন্তু বাণিজ্যিকভাবে পাঠাতে পারি না)।
  • Microsoft Presidio — সবচেয়ে ব্যাপকভাবে ব্যবহৃত ওপেন-সোর্স রেডাক্টর, যা প্রসঙ্গের জন্য একটি ছোট ল্যাঙ্গুয়েজ মডেলের সাথে ঐতিহ্যগত প্যাটার্ন ম্যাচিংকে একত্রিত করে।
  • GLiNER PII family — ছোট, সাধারণ-উদ্দেশ্যের এনটিটি ক্লাসিফায়ারের একটি পরিবার। Knowledgator ছোট (~44M), বেস (~86M), এবং লার্জ (~304M) ভেরিয়েন্ট সরবরাহ করে; NVIDIA অক্টোবর ২০২৫-এ একটি 570M ভেরিয়েন্ট রিলিজ করেছে।
  • Caiioo তিনটি মোডেই (Personal Data, HIPAA Limited Data Set, HIPAA Safe Harbor)।

পাঁচটি টেস্ট সেট জুড়ে রিকল, Caiioo-কে প্রথমে রেখে সাজানো:

সিস্টেম PrivacyBench PD-25 Caiioo synthetic PD-200 PrivacyBenchHIPAA-40 Caiioo synthetic PHI-200 Multilingual PD-40 (10 locales)
Caiioo — Personal Data 96.2 % (76/79) 99.0 % (198/200) 92.6 % (200/216)
Caiioo — HIPAA Limited Data Set 100.0 % (79/79) 100.0 % (200/200)
Caiioo — HIPAA Safe Harbor 100.0 % (79/79) 100.0 % (200/200)
openai/privacy-filter (50M) 96.2 % (76/79) 83.0 % (166/200) 93.7 % (74/79) 77.0 % (154/200) 94.9 % (205/216)
gliner_pii_nvidia (570M) 94.9 % (75/79) 85.5 % (171/200) 84.8 % (67/79) 85.0 % (170/200) 76.9 % (166/216)
gliner_pii_large (~304M) 72.2 % (57/79) 86.5 % (173/200) 84.8 % (67/79) 93.0 % (186/200) 50.0 % (108/216)
gliner_pii_base (~86M) 87.3 % (69/79) 66.0 % (132/200) 74.7 % (59/79) 66.0 % (132/200) 51.4 % (111/216)
gliner_pii_small (~44M) 88.6 % (70/79) 84.5 % (169/200) 91.1 % (72/79) 83.0 % (166/200) 68.5 % (148/216)
Microsoft Presidio 82.3 % (65/79) 76.5 % (153/200) 84.8 % (67/79) 76.5 % (153/200) 69.0 % (149/216)
piiranha-v1 (~278M) 60.8 % (48/79) 58.5 % (117/200) 43.0 % (34/79) 47.0 % (94/200) 82.4 % (178/216)

Caiioo দুটি বৃহত্তম টেস্টে (PD-200 এবং PHI-200) ডেডিকেটেড-ফিল্টার ক্লাসে নেতৃত্ব দিচ্ছে, পাবলিক বেঞ্চমার্কে সমান বা এগিয়ে আছে এবং বহুভাষিক ক্ষেত্রে দ্বিতীয় অবস্থানে রয়েছে। ক্ষুদ্রতম টেস্টে (PrivacyBench PD-25, মাত্র ২৫টি প্রশ্ন) Caiioo এবং openai/privacy-filter ৯৬.২%-এ টাই করেছে। বহুভাষিক ক্ষেত্রে, openai/privacy-filter ৯৪.৯% নিয়ে এগিয়ে আছে এবং Caiioo ৯২.৬%-এ রয়েছে — যে ভাষায় আমরা সবচেয়ে পিছিয়ে আছি তা হলো চীনা; অন্য সব জায়গায় আমরা শীর্ষে বা তার কাছাকাছি আছি। যদি বহুভাষিক কভারেজ অত্যন্ত গুরুত্বপূর্ণ হয়, তবে openai/privacy-filter একটি ভালো বিকল্প। অন্য বেশিরভাগ কাজের জন্য Caiioo সেরা।

HIPAA ফলাফলটি সবচেয়ে উল্লেখযোগ্য। Caiioo-এর উভয় HIPAA মোড প্রতিটি HIPAA টেস্টে ১০০% রিকল অর্জন করেছে — প্রতিটি রোগীর নাম, প্রতিটি মেডিকেল রেকর্ড নম্বর, প্রতিটি জন্ম তারিখ, প্রতিটি অ্যাকাউন্ট নম্বর ধরা পড়েছে। দ্বিতীয় সেরা সিস্টেম হলো openai/privacy-filter যা PrivacyBenchHIPAA-তে ৯৩.৭% পেয়েছে — একটি ৬.৩ পয়েন্টের ব্যবধান, এমন একটি বেঞ্চমার্কে যেখানে প্রতিটি মিস মানেই বাস্তব জগতের তথ্য প্রকাশ।

আরেকটি সংখ্যা পড়ার মতো: ওভার-রেডাকশন — এমন জিনিস মাস্ক করা যা আসলে ব্যক্তিগত ডেটা ছিল না। ওভার-রেডাকশন কোনো প্রাইভেসি ক্ষতি নয়, এটি ব্যবহারের খরচ। খুব বেশি জিনিস মাস্ক করলে LLM-এর যুক্তি দেওয়ার ক্ষমতা কমে যায় এবং প্রাপ্ত উত্তরটি নিম্নমানের হয়। Caiioo টেস্ট সেটগুলোতে ১–২৪ বার অপ্রয়োজনীয়ভাবে মাস্ক করেছে। Presidio: ১০–৫১। NVIDIA-এর GLiNER: শুধুমাত্র HIPAA টেস্টেই ৩১–৬৪। যখন লক্ষ্য হয় সর্বনিম্ন এক্সপোজারের সাথে সেরা সম্ভাব্য উত্তর পাওয়া, তখন রিকলের মতোই প্রিসিশন গুরুত্বপূর্ণ।

ফিল্টার হিসেবে শুধু একটি ফ্রন্টিয়ার LLM ব্যবহার করলে কেমন হয়?

তারা পারে — এবং রিকলের ক্ষেত্রে তারা জয়ী হয়। বড় সাধারণ-উদ্দেশ্যের LLM (Llama 3.1 8B, Gemma 4, Qwen 3.5 9B এবং অনুরূপ), ক্লাউডে বা লোকালি চললে বহুভাষিকসহ প্রতিটি টেস্টে ৯৫–১০০% স্কোর করতে পারে। এটি সেইসব ব্যবহারকারীদের জন্য একটি বাস্তব বিকল্প যাদের সর্বোচ্চ রিকল প্রয়োজন এবং এর জন্য মূল্য দিতে রাজি।

তবে এর কিছু বাস্তব অসুবিধা রয়েছে:

  • এটি ধীরগতিসম্পন্ন। মিলিসেকেন্ডের পরিবর্তে প্রতি মেসেজে কয়েক সেকেন্ড সময় লাগে। ফিল্টারটি ব্যবহারকারীর পাঠানো প্রতিটি মেসেজের সামনে থাকে।
  • হয় মেসেজটি ব্যবহারকারীর মেশিন ছেড়ে চলে যায়, অথবা মডেলটি আসে। ক্লাউডে ফিল্টার করতে হলে মেসেজটি সেখানে পাঠাতে হয় — যা মূল উদ্দেশ্যকেই ব্যাহত করে। অন-ডিভাইস ফিল্টার করতে ১–১৭ GB মডেল ডাউনলোড করতে হয়।
  • এটিকে ফাঁকি দেওয়া সম্ভব। একটি জেনারেটিভ মডেলকে মেসেজের মাঝখানে রেড্যাক্ট না করার জন্য রাজি করানো যেতে পারে (একটি "prompt injection" অ্যাটাক)। আমাদের মতো একটি ছোট ক্লাসিফায়ারকে তা করা সম্ভব নয়।
  • একই ইনপুট, ভিন্ন আউটপুট। জেনারেটিভ মডেল সবসময় দুবার একই উত্তর দেয় না। এটি রাউন্ড-ট্রিপকে নষ্ট করে দেয় — যাওয়ার পথে মাস্ক করা এবং ফেরার পথে আনমাস্ক করা এই বিষয়ের ওপর নির্ভর করে যে একই আসল ভ্যালু সবসময় একই ফেক ভ্যালুতে ম্যাপ হবে।

Caiioo এই ট্রেডঅফের অন্য দিকের জন্য তৈরি: একটি ক্ষুদ্র, অনুমানযোগ্য, সাব-সেকেন্ড ফিল্টার যা ব্যবহারকারী সেন্ড বাটন চাপার আগে কম্পোজারে চলে এবং যা একটি কথোপকথনের মধ্যে একই আসল ভ্যালুর জন্য সবসময় একই ফেক ভ্যালু তৈরি করে, যাতে রাউন্ড-ট্রিপটি সুসংগত থাকে। এই ধরনের ব্যবহারের ক্ষেত্রে উপরের পিয়ার-ক্লাস টেবিলটিই হলো সঠিক তুলনা।

আসল প্রমাণ কাজের মাধ্যমেই পাওয়া যায়

বেঞ্চমার্কগুলো কেবল একটি শুরুর বিন্দু, শেষ গন্তব্য নয়। ফিল্টারটি Caiioo-এর নতুন ফিচার: pseudonymizer-এর সাথে যুক্ত করা হয়েছে — এই উপাদানটি মূলত কম্পোজার এবং মডেলের মাঝখানে অবস্থান করে।

ব্যবহারকারী যখন সেন্ড (send) বাটনে চাপ দেন, তখন যা ঘটে তা নিচে দেওয়া হলো।

  1. Detect. প্রথমে রেজেক্স (regex) লেয়ারটি কাজ করে — এটি অত্যন্ত সুনির্দিষ্ট এবং মাইক্রোসেকেন্ডের মতো দ্রুত। এরপর যা অবশিষ্ট থাকে তার ওপর ML মডেল কাজ করে। যদি এই দুটি লেয়ার একই টেক্সটের ওপর ওভারল্যাপ করে, তবে আমরা একটি সহজ নিয়ম অনুসরণ করি: সারফেস ফরম্যাটের ক্ষেত্রে regex প্রাধান্য পায়, আর কনটেক্সটের ক্ষেত্রে ML প্রাধান্য পায়।
  2. Tag self vs. other. Caiioo এমন আইডেন্টিফায়ারগুলোকে আলাদা করে যা সরাসরি ব্যবহারকারীকে নির্দেশ করে এবং যা অন্য ব্যক্তিদের নির্দেশ করে। ব্যবহারকারী চাইলে কেবল একটি অথবা উভয়ই রিড্যাক্ট (redact) করতে পারেন। ব্যবহারকারী তার ব্যক্তিগত ডিকশনারিতে যে নামগুলো যুক্ত করেছেন, সেগুলো সবসময় "self" হিসেবে গণ্য হয়।
  3. Substitute. প্রতিটি আসল ভ্যালুর বিপরীতে একটি স্থিতিশীল এবং স্টাইল-ম্যাচড ছদ্মনাম (pseudonym) বসানো হয়। "Sarah Goldberg" হয়ে যায় "Maya Hartwell" — এবং পুরো কথোপকথন জুড়ে এটি "Maya Hartwell" হিসেবেই থাকে, যাতে ওই ব্যক্তিকে নিয়ে মডেলের যুক্তিনির্ভর বিশ্লেষণগুলো বিভিন্ন ধাপে খণ্ডিত না হয়ে যায়। আসল-থেকে-নকল ভ্যালুর একটি লুকআপ টেবিল ব্যবহারকারীর ডিভাইসে সংরক্ষিত থাকে, যা প্ল্যাটফর্মের কি-চেইন (keychain) থেকে প্রাপ্ত একটি কি (key) দিয়ে এনক্রিপ্ট করা থাকে।
  4. Send. মডেলটি সম্পূর্ণ একটি ফেক বা নকল মেসেজ গ্রহণ করে। কোনো আসল আইডেন্টিফায়ার কখনোই নেটওয়ার্ক অতিক্রম করে না এবং আমাদের অডিট লগ কেবল সংখ্যা রেকর্ড করে — কখনোই ভ্যালুগুলো নিজে নয়।
  5. Restore. স্ট্রিমিং রেসপন্স আসার সাথে সাথেই সেটিকে পুনরায় আগের অবস্থায় ম্যাপ করা হয়। মডেলের উত্তরের "Maya Hartwell" স্ক্রিনে পৌঁছানোর আগেই "Sarah Goldberg"-এ রূপান্তরিত হয়, যা একটি ছোট গ্লো পিল (glow pill) দিয়ে রেন্ডার করা হয় যাতে ব্যবহারকারী এক পলকেই বুঝতে পারেন কী সুরক্ষিত করা হয়েছে।
  6. Restore tool arguments too. যদি মডেল কোনো টুল কল করে — যেমন ইমেল পাঠানো, টিকিট ফাইল করা, বা কোনো ডক-এ লেখা — এবং আর্গুমেন্টগুলোতে যদি ফেক ভ্যালু থাকে, তবে টুলটি রান করার আগেই আমরা আসল ভ্যালুগুলো পুনরায় বসিয়ে দিই। মডেল ফেক ভ্যালুর ওপর ভিত্তি করে যুক্তি সাজায়; কিন্তু অ্যাকশনটি আসল ভ্যালু গ্রহণ করে।

ফিল্টারটি কোন AI সার্ভিস ব্যবহার করা হচ্ছে তার তোয়াক্কা করে না। মেসেজটি মডেলে পৌঁছানোর আগেই এটি কাজ করে, তাই OpenRouter, Anthropic, Google, OpenAI এবং লোকাল Ollama সবাই একই ধরনের মাস্কড পেলোড (masked payload) পায়। নতুন কোনো প্রোভাইডার যুক্ত করলেও প্রাইভেসির এই সুরক্ষা বলয় ভেঙে যায় না।

কাদের সুরক্ষা দেয়

ব্যবহারকারীকে। ব্যবহারকারীর নাম, ইমেল, ঠিকানা, ফোন, IP এবং বায়োমেট্রিক আইডেন্টিফায়ার — যে বিষয়গুলো একত্রে একজন ব্যক্তিকে শনাক্ত করতে পারে — ফিল্টার চালু থাকলে সেগুলো কখনোই ডিভাইস থেকে বের হয় না।

যাদের সম্পর্কে ব্যবহারকারী কথা বলেন। বেশিরভাগ গোপনীয়তা টুল টাইপ করা ব্যক্তির ওপর ফোকাস করে, কিন্তু তারা 'সামাজিক চুক্তি' উপেক্ষা করে — অর্থাৎ আমাদের নিজেদের পাশাপাশি অন্যদের প্রতিও দায়িত্ব রয়েছে। কোনো LLM-এ "মিস্টার সন্ডার্সের অযোগ্যতার জন্য তার আচরণ বিশ্লেষণ করুন" সাবমিট করা, যেখানে এটি অনির্দিষ্টকালের জন্য সিস্টেম লগে রেকর্ড হতে পারে, তা দায়িত্বজ্ঞানহীন (এবং সম্ভাব্য মানহানিকর)। ১,০০০ বিজনেস কন্টাক্ট আছে এমন একটি Google Sheet-এর জন্য LLM-এর সাহায্য চাওয়া মানে সেগুলোকে ডেটা-রিটেনশন জালে ফেলে দেওয়া। Caiioo-এর ফিল্টার থার্ড পার্টিদেরও কভার করে: যে ক্লায়েন্টের জন্য চুক্তি তৈরি করা হচ্ছে, যে রোগীর রেকর্ড বিশ্লেষণ করা হচ্ছে, বা যে সহকর্মীর ইমেল কনটেক্সটে পেস্ট করা হয়েছে। তারা তাদের আইডেন্টিফায়ার রিমোট LLM-কে দেখার অনুমতি দেয়নি। ফিল্টার ডিফল্টভাবে সেটি সম্মান করে; কাজের প্রয়োজনে ব্যবহারকারী চাইলে এটি "self only" বা "others only"-তে পরিবর্তন করতে পারেন।

প্রতিষ্ঠান — ব্যবসা, হাসপাতাল, ফার্ম। অ্যাকাউন্ট নম্বর, লাইসেন্স নম্বর, মেডিকেল রেকর্ড নম্বর, ফিন্যান্সিয়াল রাউটিং ডিটেইলস, ইন্টারনাল ID, API কী, কাস্টমার তালিকা। একজন ব্যক্তির মতো একটি ব্যবসারও ডেটা-মিনিমাইজেশন স্বার্থ রয়েছে। Caiioo ব্যবহার করে ডিসচার্জ নোট ড্রাফট করা একজন চিকিৎসক রোগীর মেডিকেল রেকর্ড নম্বর OpenAI-তে পাঠাচ্ছেন না। একজন আইনজীবী ক্লায়েন্টের অ্যাকাউন্ট নম্বর Anthropic-এ পাঠাচ্ছেন না। একজন সাপোর্ট ইঞ্জিনিয়ার কাস্টমার লগ থেকে API কী Google-এ পাঠাচ্ছেন না। ফিল্টারটি আইডেন্টিফায়ারটি কোনো ব্যক্তির নাকি প্রতিষ্ঠানের তা বিচার করে না — এটি কেবল সেটিকে ডিভাইসেই রাখে।

সর্বোচ্চ উপযোগিতা, সর্বনিম্ন প্রকাশ

মূল লক্ষ্য হলো ব্যবহারকারী যেন ফিল্টারটির উপস্থিতি অনুভব না করেন।

বেশিরভাগ গোপনীয়তা টুল একটি কঠিন পছন্দ করতে বাধ্য করে: কঠোরভাবে রিড্যাক্ট করুন এবং মডেলের উত্তরের মান কমতে দেখুন, অথবা প্রম্পট ব্যবহারযোগ্য রাখুন এবং গোপনীয়তার প্রতিশ্রুতি নষ্ট হতে দেখুন। আমরা এই আপস প্রত্যাখ্যান করেছি। মডেলটি এখনও একটি পূর্ণাঙ্গ প্রম্পট পায় — এটি সঠিক ব্যাকরণগত অবস্থানে নাম, স্থান, তারিখ, মেডিকেল রেকর্ড নম্বর দেখতে পায়। এটি কেবল নকল তথ্য দেখে। এর যুক্তি বা বিশ্লেষণ অভিন্ন থাকে; শুধু স্ট্রিংগুলো পরিবর্তন করা হয়।

স্টেবল সাবস্টিটিউশন (Stable substitution) এটি সম্ভব করে। যেহেতু একটি কথোপকথনে একই আসল মানের জন্য সবসময় একই নকল মান ম্যাপ করা হয় — ব্যবহারকারীর মেসেজ, টুলের রেজাল্ট এবং মডেলের আগের উত্তর সবখানেই — তাই মডেলটি একজন ব্যক্তি বা স্থান সম্পর্কে সুসংগতভাবে চিন্তা করতে পারে। মাল্টি-টার্ন কথোপকথন এলোমেলো হয়ে যায় না। টুল কল নষ্ট হয় না। সাব-এজেন্টরা মূল কথোপকথনের ম্যাপ উত্তরাধিকার সূত্রে পায় এবং পুরো টাস্ক জুড়ে সামঞ্জস্য বজায় রাখে।

ব্যবহারকারী যে আউটপুট দেখেন তা হলো আসল কথোপকথন। প্রোভাইডার যে ডেটা দেখে তা হলো একটি সুসংগত কাল্পনিক তথ্য। এই দুই দৃশ্যের মাঝখানের ফাঁকা জায়গায় কাজটি সম্পন্ন হয় এবং আমাদের একমাত্র লক্ষ্য হলো সেই ফাঁকা জায়গাটিকে অদৃশ্য করে তোলা।

একটি গোপনীয়তা ফিল্টার যা কাজের পথে বাধা হয়ে দাঁড়ায়, তা বন্ধ করে দেওয়া হবে। একটি গোপনীয়তা ফিল্টার যা কাজের ধারার সাথে মিশে যায়, সেটিই কেবল ব্যবহারের যোগ্য।

আমরা সেই মানদণ্ডেই এটি তৈরি করেছি।