On-device pseudonymizer: built and benchmarked

Huu ni utafsiri wa mashine wa hati asili ya Kiingereza. Ikitokea mgongano wowote kati ya tafsiri hii na toleo asili la Kiingereza, toleo la Kiingereza ndilo litakalozingatiwa. Soma toleo asili la Kiingereza


Kificha utambulisho cha ndani ya kifaa: kimeundwa na kupimwa

2026-05-22 · Caiioo Team

Tulitaka kutatua tatizo la faragha la mifumo ya AI inayofanya mafunzo na kuhifadhi taarifa halisi zinazoweza kumtambulisha mtu. Sera na makubaliano ya "Zero Data Retention" yanapunguza hatari, lakini yamejaa vighairi. Kimsingi yanasema: "Hatutahifadhi maelekezo au matokeo yako yoyote isipokuwa kwa: (ingiza orodha kubwa ya vighairi hapa: madhumuni ya usalama, ufuatiliaji wa serikali, ushikiliaji wa kisheria, maendeleo ya bidhaa, kumbukumbu za makosa, kuboresha huduma...)"

Ili kutatua hili, tumeunda kichujio cha data ya kibinafsi kinachojiendesha kwenye mashine ya mtumiaji mwenyewe, kinachoona ujumbe kabla haujaondoka kwenye kifaa, na kurudisha jibu lile lile ambalo mtumiaji angepata kama ungeandikwa bila kichujio kabisa.

Hivyo tulijenga kimoja. Toleo lijalo la Caiioo litajumuisha Pseudonymizer. Inapatikana kupitia ikoni ya ngao katika mazungumzo ya wakala pamoja na mipangilio.

Jarida hili linaelezea mantiki, usanifu, mchakato wa tathmini, na kanuni za muundo nyuma ya mfumo wetu wa kuchuja faragha.

Kile tulichokusudia kufanya

Ulinzi wa faragha wa jumla kupitia upunguzaji wa data. Mtumiaji anapozungumza na modeli ya mbali, modeli hiyo haihitaji jina halisi, anwani ya nyumbani, barua pepe halisi, au nambari ya simu ya mteja ili kujibu swali la mtumiaji. Inahitaji muundo wa swali, na inahitaji kuonekana kama swali halisi ili LLM isipuuze hoja hiyo kama jaribio. Kwa hivyo, kichujio huondoa vitambulisho halisi kutoka kwa data inayotumwa kwa AI na kuunganisha tena thamani halisi wakati wa kurudi. Modeli huona majina na vitambulisho bandia; mtumiaji huona mazungumzo halisi.

Usaidizi wa kufuata HIPAA. Hali ya pili inalenga vitambulisho 18 katika sheria ya HIPAA Safe Harbor (§164.514) na lahaja ya Limited Data Set isiyo na masharti makali. Tabibu, msimamizi wa huduma ya afya, au mtu yeyote anayefanya kazi katika mchakato unaosimamiwa anaweza kuzungumza na modeli ya madhumuni ya jumla kuhusu visa halisi bila kutuma taarifa za afya zilizolindwa kwa AI. Sisi si afisa wa kufuata sheria wa huluki inayohusika — lakini tunaweza kuwa tabaka linalozuia PHI isiondoke kwenye kompyuta mpakato kwanza kabisa. Tathmini zetu hutoa vigezo vinavyoweza kupimika ambavyo mashirika yanaweza kutumia ili kutathmini ufaafu wa kichujio kwa viwango vyao vya kufuata sheria na faragha. Hatua zote za faragha na usalama ni maamuzi ya kibusara ambayo ni jukumu la mtumiaji au huluki ya mtumiaji.

Tulichagua zote mbili kwa sababu uhandisi wake ni uleule, na kisa cha matumizi ya PHI kiufundi ni rahisi zaidi kwa sababu ya matumizi yake ya huluki zilizotajwa kwa njia tofauti, ambazo ni rahisi kuzihariri kuliko data ya jumla zaidi katika kategoria ya Personal Data. Uchujaji wa HIPAA pia unasaidiwa na ukweli kwamba kwa ujumla uko katika lugha ya Kiingereza au Kihispania. Tunatambua vitambulisho, tunaweka majina mbadala thabiti na vitambulisho vilivyobadilishwa katika muundo uleule, tunavirejesha wakati wa kurudi, na hatuweki kumbukumbu za thamani halisi kamwe. Ramani kati ya taarifa bandia na taarifa halisi inabaki tu kwenye kifaa cha mtumiaji, ili mtumiaji aweze kusoma taarifa halisi katika majibu ya ajenti. Orodha ya kategoria na lango la sera ndivyo vinavyobadilika kati ya hali hizi.

Kwa nini regex pamoja na machine learning, na siyo kimoja tu kati yao

Kuna teknolojia mbili kuu za vichujio katika pseudonymizer yetu: lugha ya utambuzi wa ruwaza inayotabirika iitwayo regex, na modeli za machine learning zilizofunzwa.

Regex haishindiki kwenye miundo ya juu (surface formats). Anuani ya barua pepe ina umbo fulani ([email protected]). Hali kadhalika IP, kadi ya mkopo, IBAN, VIN, SSN (XXX-XX-XXXX), na API key. Ikiwa muundo unaaminika, regex huunasa kwa uhakika, kila wakati, bila mzigo wa modeli na bila gharama ya inference.

Hata hivyo, regex haina uwezo kwenye muktadha (context). "Chati ya Sarah ya Jumanne iliyopita" ina jina la mtu na tarehe, lakini hakuna hata kimoja kinachoweza kutofautishwa kwa muundo wake pekee. "Mgonjwa aliye 14 Elm" ina anuani ambayo inafanana na maelfu ya vitu ambavyo si anuani. "MRN yao ni 7741032" inahitaji maneno yanayozunguka namba hiyo ili iwe na maana yoyote.

Modeli ndogo ya lugha iliyofanyiwa fine-tuned hushughulikia muktadha — yetu ni encoder ya vigezo 110M iliyofunzwa maalum na kutolewa (distilled) kutoka kwa modeli ndogo ya lugha ya lugha nyingi (multilingual tiny language model). Inasoma sentensi, siyo kipande cha maandishi (substring), na ni ndogo kiasi cha kuweza kufanya kazi kwa kasi kubwa kwenye kifaa, hata simu ya mkononi.

Vipimo vya ulinganifu (benchmarks) vinaonyesha nguvu zinazokamilishana za tabaka hizi mbili. Tulilinganisha tabaka hizi mbili kila moja peke yake ili kuhakikisha kila moja inafanya kazi yake ipasavyo. Kwenye seti ya maswali 150 ya PrivacyBench-PD ambapo maswali na majibu hayakutumika kabisa kufunza modeli:

Tabaka PII zilizonaswa Kiwango cha kunasa
Regex pekee 205 / 670 30.6 %
ML pekee 516 / 670 77.0 %
Zote (production) 625 / 670 93.3 %

Regex pekee hukosa robo tatu ya vitambulishi kwa sababu vitambulishi vingi katika maandishi ya kawaida havina muundo maalum. ML pekee hukosa asilimia 16 ambayo tabaka la regex lingeweza kunasa — vitu ambavyo ni umbo lake tu (kadi ya mkopo inaonekana kama kadi ya mkopo; modeli haina ishara ya ziada ya kuongeza). Kwa pamoja, vinashughulikia kile ambacho hakuna kinachoweza kushughulikia peke yake.

Tukiangalia kwa undani zaidi pale ambapo kila tabaka lina umuhimu wa kipekee: katika seti hiyo hiyo, thamani 16 za majaribio zilinasywa na regex pekee (barua pepe, IPs, akaunti za kifedha, vitambulishi vyenye muundo) na 327 zilinasywa na ML pekee (majina, vitambulishi vya kimuktadha, misemo ya lugha nyingi).

Mdogo, mwerevu, wa haraka — na hufanya kazi kila mahali

Tulilazimika kufanya kichujio kijiendeshe ndani ya kifaa, jambo ambalo lilikuwa changamoto ya kihandisi.

Lazima kiwe kidogo kwa sababu programu yetu inajiendesha kwenye kifaa kwenye mifumo mingi: ndani ya kiendelezi cha Chrome, programu ya macOS, programu ya iOS, programu ya Android, au Windows na Linux. Kifurushi ni takriban MB 113 kwa kila mfano. Kuna mifano miwili — mmoja kwa data ya kibinafsi ya jumla, mmoja kwa taarifa za afya zilizolindwa — na hali ya Safe Harbor huendesha yote miwili kwa pamoja. Kati ya hizi, kifaa cha Android cha hali ya chini ndicho chenye utendaji mdogo zaidi, lakini mfumo wetu unafanya kazi vizuri.

Lazima kiwe mwerevu kwa sababu makosa ya kutotambua yanavujisha data halisi kwa LLM ya mbali na makosa ya kutambua kimakosa yanaharibu mazungumzo. Majina lazima yafichwe; viwakilishi havipaswi kufichwa. Barua pepe ya daktari katika mazungumzo yaliyotumwa inapaswa kufichwa; kadi ya chini ya [email protected] pengine haipaswi.

Lazima kiwe haraka kwa sababu kiko moja kwa moja kwenye njia ya kila ujumbe ambao mtumiaji anatuma au kupokea. Tulipima muda wa ziada wa mzunguko kuwa chini ya ms 200 kwenye uzi mmoja wa CPU, zaidi ikiwa ni ugawaji wa maneno (tokenization). Kwenye WebGPU na kwenye Neural Engine ya Apple ni ndogo sana ikilinganishwa na ucheleweshaji wa mtandao wa simu ya LLM yenyewe.

Lazima kiendeshe kwenye mazingira mengi kwa sababu Caiioo inapatikana kwenye majukwaa mengi. Mfumo ule ule unajiendesha kwenye viendelezi vya Chrome, macOS na iOS, Android, na kwenye Windows na Linux. Mfano mmoja wa utambuzi, maktaba moja ya regex, kiunganishi kimoja, sera moja — tabia inayofanana kwenye kila sehemu ambapo Caiioo inajiendesha.

Alama

Baada ya awamu kadhaa za majaribio na mafunzo, tulifikia toleo la 16 la modeli zetu. Hapa chini kuna vigezo vitatu (benchmarks), kila kimoja kikipima kitu tofauti.

Seti yetu ya majaribio, maswali 150 ambayo modeli haijawahi kuyaona

Kabla ya kufanya majaribio dhidi ya vigezo vya umma, tuliendesha kichujio chetu cha Personal Data dhidi ya seti ya majaribio ya ndani ambayo tuliifanya iwe nje ya data ya mafunzo — ili kigunduzi kisiwe kimewahi kuona maswali haya hapo awali. Maswali 150 yaliyogawanywa katika makundi manne (vijisehemu vya kodi, nathari ya nyaraka, misemo isiyojulikana kwa makusudi, na lugha 10 zisizo za Kiingereza), pamoja na kundi "hasi" ambalo halina data ya faragha kabisa (ukaguzi wa akili ili kuhakikisha hatufuti kupita kiasi). Mchanganyiko wa regex + ML pipeline:

Sub-bench Imekamatwa Kiwango
code_bench 69 / 74 93.2 %
doc_bench 233 / 247 94.3 %
generalization_bench 123 / 133 92.5 %
multilingual_bench 200 / 216 92.6 %
Benches zote 4 chanya 625 / 670 93.3 %

(Kundi hasi halikuwa na data ya faragha ya kupata. Kichujio kilifunika kitu kimoja ambacho hakikupaswa — jambo linaloendana na nambari za usahihi hapa chini.)

Mtathmini ni mkali: kila kipande cha data ya faragha kinachotarajiwa lazima kitoweke kabisa kutoka kwenye matokeo yaliyofunikwa ili swali lipate alama. Hakuna alama za upendeleo, hakuna "karibu inatosha." Hiyo ni kali zaidi kuliko vigezo vinavyoomba LLM nyingine kuwa mwamuzi (waamuzi wa LLM huwa na tabia ya kuwa na ukarimu). Kwa nambari zinazolingana moja kwa moja dhidi ya mifumo mingine, angalia sehemu ya ulinganifu wa ana kwa ana hapa chini.

PrivacyBenchHIPAA — maswali 40 ya huduma ya afya

Kila swali linaorodhesha taarifa za afya zilizolindwa ambazo lazima zifutwe (majina, nambari za rekodi za matibabu, n.k.) NA ishara ambazo lazima ziwekwe (tarehe, jiografia, umri ikiwa chini ya miaka 90 — sheria ya HIPAA Limited Data Set). Mtathmini hukagua pande zote mbili: je, tuliondoa tulichopaswa kuondoa, na je, tuliacha tulichopaswa kuacha?

Mode PHI iliyofutwa Retained iliyobaki
Limited Data Set (hifadhi tarehe / jiografia / umri ≤89) 79 / 79 (100 %) 34 / 34
Safe Harbor (futa kila kitu ikiwemo tarehe) 99 / 104 (95.2 %)

Submode ya Limited Data Set ni kamilifu kwenye kigezo hiki. Safe Harbor — ambayo ina mengi ya kufuta, hivyo nafasi nyingi za kukosa — inashughulikia 95.2%.

Matokeo ya kategoria kwa kategoria kwenye data yetu wenyewe, sampuli 200 kwa kila mode

Vigezo vya umma huweka kila kitu pamoja. Data yetu ya majaribio ya ndani inatenganisha matokeo kwa kategoria (majina, barua pepe, anwani, na kadhalika) na kuendesha kila moja kwa njia tatu: regex pekee, ML pekee, na zote mbili pamoja. Hiyo inatuambia hasa ni teknolojia gani inakamata aina gani ya kitambulisho — na wapi kila moja inahitaji nyingine. Jaribio la hivi karibuni, 2026-05-20:

Muhtasari katika modes zote tatu za kichujio

Mode Combined recall Precision F2 Samples
Personal Data filter 97.3 % 97.8 % 97.4 200
HIPAA filter — Limited Data Set 92.3 % 92.3 % 92.3 200
HIPAA filter — Safe Harbor 91.9 % 91.5 % 91.8 200

Nambari hizi hazijumuishi URLs, ambazo tunaziacha kwa makusudi — kufuta URL kungeharibu hatua zinazofuata kama "fungua kiungo hiki" au "leta ukurasa huo." Maelezo zaidi yapo kwenye sehemu ya workflow hapa chini.

Picha kuu kabla ya majedwali ya kategoria: katika kila mode, vitambulisho ambavyo kwa kweli vinamtambulisha mtu vinakamatwa kwa au karibu 100% ya wakati. Majina, barua pepe, nambari za simu, anwani za posta, vitambulisho vya serikali, vitambulisho vya biometriska, eneo sahihi la kijiografia, nambari za rekodi za matibabu, tarehe za kuzaliwa, nambari za usalama wa jamii — vilikamatwa kwenye kila sampuli, kila jaribio. Kategoria ambazo tunashuka chini ya 100% zinatabirika: vitambulisho vya kifaa (aina nyingi za miundo katika maandishi halisi), vitambulisho mbalimbali vya kitaasisi (nambari za uaminifu, vitambulisho vya mfanyakazi — tatizo lile lile), na picha (kichujio cha maandishi pekee hakiwezi kuona kilicho ndani ya picha). Hakuna hata moja kati ya hizo ni kitambulisho cha "jina kwenye chati" au "barua pepe kwenye rasimu" ambacho kwa kweli ni muhimu kwa uvujaji. Kategoria zenye hatari kubwa ndizo zinazoaminika.

Personal Data filter

Iliyopangwa kwa combined recall (bora kwanza), kisha kwa daraja la hatari (T1 = nyeti zaidi).

Category Tier Regex recall ML recall (raw) Combined recall Gold n
biometric_id T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
email_address T1 100.0 % (20/20) 100.0 % (20/20) 100.0 % 20
government_id T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
person_name T1 13.3 % (4/30) 96.7 % (29/30) 100.0 % 30
phone_or_fax T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
postal_address T1 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
precise_geolocation T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
birth_date T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
ip_address T2 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
online_handle T2 40.0 % (4/10) 100.0 % (10/10) 100.0 % 10
vehicle_id T2 50.0 % (5/10) 100.0 % (10/10) 100.0 % 10
authentication_secret T4 40.0 % (4/10) 100.0 % (10/10) 100.0 % 10
financial_account T1 90.0 % (18/20) 100.0 % (20/20) 90.0 % 20
institutional_id T3 80.0 % (8/10) 90.0 % (9/10) 90.0 % 10
device_id T3 40.0 % (4/10) 50.0 % (5/10) 80.0 % 10

Ukisoma kote, muundo wa tabaka mbili unazaa matunda. Anwani za posta, tarehe za kuzaliwa, na majina ya watu yanapata alama 0–13% chini ya regex pekee — hakuna umbo la kulinganisha, kwa hivyo ni modeli ya ML pekee inayoweza kuzikamata. Barua pepe, nambari za simu, IPs, vitambulisho vya serikali, vitambulisho vya biometriska, na eneo sahihi la kijiografia vinapata alama 100% chini ya regex pekee — miundo ya juu ambayo modeli ya ML inaipata bila shida. Online handles, vitambulisho vya magari, na siri za uthibitishaji vimechanganyika: regex inakamata miundo ya kawaida, ML inakamata iliyobaki. Combined recall inafikia au kuzidi tabaka lolote lile lililo na nguvu zaidi, katika kila kategoria.

Vitambulisho vya kifaa na vitambulisho mbalimbali vya kitaasisi ni kategoria zilizo chini ya 100%, na tunajua kwanini: hizo zina aina nyingi zaidi za miundo katika maandishi halisi. Tunapendelea kuwa waaminifu kuhusu kategoria ambazo recall inashuka kuliko kujifanya kuwa kichujio ni kamilifu kila mahali.

HIPAA filter — Limited Data Set submode

Submode ya Limited Data Set inahifadhi tarehe, jiografia, na umri wa miaka 89 au chini kwa muundo — hizo ni ishara ambazo HIPAA inaruhusu shirika kuweka kwa ajili ya utafiti halali wa kliniki na uendeshaji.

Category Tier Regex recall ML recall (raw) Combined recall Gold n
biometric_id T1 100.0 % (12/12) 100.0 % (12/12) 100.0 % 12
email_address T1 100.0 % (13/13) 100.0 % (13/13) 100.0 % 13
medical_record_number T1 100.0 % (26/26) 100.0 % (26/26) 100.0 % 26
person_name T1 15.4 % (4/26) 100.0 % (26/26) 100.0 % 26
phone_or_fax T1 100.0 % (13/13) 100.0 % (13/13) 100.0 % 13
social_security_number T1 100.0 % (12/12) 100.0 % (12/12) 100.0 % 12
account_number T2 0.0 % (0/13) 100.0 % (13/13) 100.0 % 13
health_plan_id T2 0.0 % (0/13) 100.0 % (13/13) 100.0 % 13
ip_address T2 100.0 % (12/12) 100.0 % (12/12) 100.0 % 12
license_number T2 0.0 % (0/12) 100.0 % (12/12) 100.0 % 12
vehicle_id T2 25.0 % (3/12) 100.0 % (12/12) 100.0 % 12
device_id T3 41.7 % (5/12) 100.0 % (12/12) 100.0 % 12
photo T2 0.0 % (0/12) 0.0 % (0/12) 0.0 % 12

Picha ni kosa linalojulikana — kichujio cha maandishi pekee hakiwezi kuona kilicho ndani ya picha. Image-PHI ni tatizo tofauti ambalo bado hatujalitoa. Kila kategoria nyingine katika mode hii iko kwenye 100%.

HIPAA filter — Safe Harbor submode

Safe Harbor huondoa kila kitu ambacho submode ya Limited Data Set ingehifadhi — tarehe, umri zaidi ya miaka 89, jiografia. Ili kupata ulinzi mkali zaidi, inaendesha modeli zote mbili za kichujio kwa sambamba: ile mahususi ya HIPAA na ile ya jumla ya data ya kibinafsi.

Category Tier Regex recall ML recall (raw) Combined recall Gold n
age_over_89 T1 100.0 % (18/18) 0.0 % (0/18) 100.0 % 18
biometric_id T1 100.0 % (9/9) 100.0 % (9/9) 100.0 % 9
email_address T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
medical_record_number T1 100.0 % (20/20) 100.0 % (20/20) 100.0 % 20
person_name T1 20.0 % (4/20) 100.0 % (20/20) 100.0 % 20
phone_or_fax T1 100.0 % (10/10) 100.0 % (10/10) 100.0 % 10
social_security_number T1 90.0 % (9/10) 100.0 % (10/10) 100.0 % 10
account_number T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
general_date T2 100.0 % (27/27) 29.6 % (8/27) 100.0 % 27
health_plan_id T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
ip_address T2 100.0 % (9/9) 100.0 % (9/9) 100.0 % 9
license_number T2 0.0 % (0/10) 100.0 % (10/10) 100.0 % 10
vehicle_id T2 10.0 % (1/10) 100.0 % (10/10) 100.0 % 10
device_id T3 22.2 % (2/9) 88.9 % (8/9) 77.8 % 9
photo T2 0.0 % (0/9) 0.0 % (0/9) 0.0 % 9

Safu mbili za kuvutia ni tarehe za jumla (regex 100%, ML 30%) na umri zaidi ya miaka 89 (regex 100%, ML 0%). Tunaruhusu regex kushughulikia zote mbili katika Safe Harbor kwa makusudi: tarehe zina umbo ambalo regex inakamata kila wakati, na hatutaki modeli ya uwezekano (probabilistic model) ianze kukisia kizingiti cha nambari kama ">89". Sheria ya uhakika (deterministic rule) inaaminika zaidi kuliko kuiomba modeli ya ML ijifunze sheria hiyo hiyo.

Nambari za jumla katika kategoria zote

Tukijumlisha yote: pipeline kamili (regex + ML pamoja) inalinganaje na tabaka lolote peke yake?

Mode Layers Recall Precision F2
Personal Data regex only 65.8 % 93.0 % 69.9 %
Personal Data ML only 95.4 % 92.4 % 94.8 %
Personal Data zote (full) 96.9 % 98.0 % 97.1 %
Limited Data Set regex only 55.9 % 95.0 % 60.9 %
Limited Data Set ML only 92.9 % 84.5 % 91.0 %
Limited Data Set zote (full) 92.9 % 89.3 % 92.1 %
Safe Harbor regex only 58.9 % 93.6 % 63.6 %
Safe Harbor ML only 82.4 % 88.3 % 83.5 %
Safe Harbor zote (full) 92.4 % 88.9 % 91.7 %

Safu ya "full" ya kichujio cha Personal Data inashinda matoleo yote ya tabaka moja kwenye kila kipimo — kuchanganya regex (kwa miundo ya juu) na modeli ya ML (kwa muktadha) kwa kweli kunatoa kitu ambacho hakuna tabaka peke yake linaweza kutoa. Kichwa cha habari cha 97.3% mapema kwenye chapisho hili ni nambari inayoakisi kile mtumiaji halisi anapata. Nambari kwenye jedwali hapo juu ni ndogo kidogo kwa sababu tu inajumuisha kategoria ya URL, ambayo tunaihifadhi kwa makusudi ili tusiharibu viungo na tool calls.

Ulinganifu wa ana kwa ana dhidi ya vichujio vingine maalum vya faragha

Ulinganisho wa haki kwa kichujio cha faragha cha kwenye kifaa (on-device) na cha papo hapo kama chetu ni dhidi ya vichujio vingine vya kwenye kifaa na vya papo hapo — si dhidi ya LLMs kubwa zinazohifadhiwa kwenye wingu ambazo huchukua sekunde kadhaa kwa kila ujumbe na zinahitaji safari ya mtandao. Tuliendesha kila mfumo katika daraja hili dhidi ya seti zile zile za majaribio, kwa kutumia sheria zile zile za kulinganisha. Kiwango kile kile kwa kila mtu.

Daraja la wenza:

  • openai/privacy-filter — Kichujio maalum cha faragha cha chanzo wazi cha OpenAI. Takriban vigezo milioni 50, kidogo vya kutosha kuendeshwa kwenye kivinjari chochote cha kisasa.
  • piiranha-v1 — kigunduzi cha vigezo 278M kutoka iiiorg. Leseni yake inakizuia kwa utafiti na tathmini pekee (tunaweza kukipima, lakini hakiwezi kusafirishwa kibiashara).
  • Microsoft Presidio — kifutaji cha chanzo wazi kinachotumiwa zaidi, kikichanganya ulinganishaji wa ruwaza wa jadi na modeli ndogo ya lugha kwa ajili ya muktadha.
  • GLiNER PII family — familia ya viainishaji vidogo vya huluki vya madhumuni ya jumla. Knowledgator inasafirisha matoleo ya small (~44M), base (~86M), na large (~304M); NVIDIA ilitoa toleo la 570M mnamo Oktoba 2025.
  • Caiioo katika modes zote tatu (Personal Data, HIPAA Limited Data Set, HIPAA Safe Harbor).

Recall katika seti zote tano za majaribio, zilizopangwa na Caiioo kwanza:

System PrivacyBench PD-25 Caiioo synthetic PD-200 PrivacyBenchHIPAA-40 Caiioo synthetic PHI-200 Multilingual PD-40 (maeneo 10)
Caiioo — Personal Data 96.2 % (76/79) 99.0 % (198/200) 92.6 % (200/216)
Caiioo — HIPAA Limited Data Set 100.0 % (79/79) 100.0 % (200/200)
Caiioo — HIPAA Safe Harbor 100.0 % (79/79) 100.0 % (200/200)
openai/privacy-filter (50M) 96.2 % (76/79) 83.0 % (166/200) 93.7 % (74/79) 77.0 % (154/200) 94.9 % (205/216)
gliner_pii_nvidia (570M) 94.9 % (75/79) 85.5 % (171/200) 84.8 % (67/79) 85.0 % (170/200) 76.9 % (166/216)
gliner_pii_large (~304M) 72.2 % (57/79) 86.5 % (173/200) 84.8 % (67/79) 93.0 % (186/200) 50.0 % (108/216)
gliner_pii_base (~86M) 87.3 % (69/79) 66.0 % (132/200) 74.7 % (59/79) 66.0 % (132/200) 51.4 % (111/216)
gliner_pii_small (~44M) 88.6 % (70/79) 84.5 % (169/200) 91.1 % (72/79) 83.0 % (166/200) 68.5 % (148/216)
Microsoft Presidio 82.3 % (65/79) 76.5 % (153/200) 84.8 % (67/79) 76.5 % (153/200) 69.0 % (149/216)
piiranha-v1 (~278M) 60.8 % (48/79) 58.5 % (117/200) 43.0 % (34/79) 47.0 % (94/200) 82.4 % (178/216)

Caiioo inaongoza daraja la vichujio maalum kwenye majaribio mawili makubwa zaidi (PD-200 na PHI-200), inalingana au inaongoza kwenye vigezo vya umma, na ni ya pili kwenye lugha nyingi (multilingual). Kwenye jaribio dogo zaidi (PrivacyBench PD-25, maswali 25 tu) Caiioo na openai/privacy-filter zinalingana kwa 96.2%. Kwenye lugha nyingi, openai/privacy-filter bando inaongoza kwa 94.9% huku Caiioo ikiwa na 92.6% — lugha ambayo tuko nyuma zaidi ni Kichina; kwingine kote tuko juu au karibu na juu. Ikiwa uwezo wa lugha nyingi ni muhimu sana, openai/privacy-filter ni mbadala mzuri. Kwa kazi nyingine nyingi katika daraja hili, Caiioo ndiyo chaguo.

Matokeo ya HIPAA ndiyo kichwa cha habari. Modes zote mbili za Caiioo HIPAA zilifikia 100% recall kwenye kila jaribio la HIPAA — kila jina la mgonjwa, kila nambari ya rekodi ya matibabu, kila tarehe ya kuzaliwa, kila nambari ya akaunti ilikamatwa. Mfumo wa pili kwa ubora ni openai/privacy-filter kwa 93.7% kwenye PrivacyBenchHIPAA — pengo la pointi 6.3, kwenye kigezo ambapo kila kosa ni ufichuzi wa ulimwengu halisi.

Nambari ya pili inayofaa kusomwa: over-redaction — kufunika vitu ambavyo havikuwa data ya faragha. Over-redaction si madhara ya faragha, ni gharama ya utumiaji. Ukifunika vitu vingi mno, uwezo wa LLM wa kufikiri unakuwa mbaya zaidi, na jibu linalorudishwa linashuka thamani. Caiioo inafunika bila ulazima mara 1–24 katika seti zote za majaribio. Presidio: 10–51. GLiNER ya NVIDIA: 31–64 kwenye majaribio ya HIPAA pekee. Usahihi (precision) ni muhimu kama recall wakati lengo ni kupata jibu bora zaidi kwa mfiduo mdogo iwezekanavyo.

Vipi kuhusu kutumia tu frontier LLM kama kichujio?

Zinaweza — na kwenye recall ghafi, zinashinda. LLMs kubwa za madhumuni ya jumla (Llama 3.1 8B, Gemma 4, Qwen 3.5 9B, na zinazofanana), zinazoendeshwa iwe kwenye wingu au ndani ya kifaa, zinaweza kupata alama 95–100% katika kila jaribio ikiwemo lugha nyingi. Hilo ni chaguo halisi kwa watumiaji wanaohitaji recall ya juu zaidi na wako tayari kuilipia.

Hata hivyo, mapungufu ni halisi:

  • Ni polepole. Sekunde kadhaa kwa kila ujumbe badala ya milisekunde. Kichujio hukaa mbele ya kila ujumbe ambao mtumiaji anatuma.
  • Aidha ujumbe unatoka kwenye mashine ya mtumiaji, au modeli inatoka. Ili kuchuja kwenye wingu, ujumbe lazima uende huko — jambo linaloharibu kusudi la faragha. Ili kuchuja kwenye kifaa inahitaji kupakua modeli ya 1–17 GB.
  • Inaweza kudanganywa. Modeli ya kuzalisha (generative model) inaweza kushawishiwa, katikati ya ujumbe, isifute (shambulio la "prompt injection"). Kiainishaji kidogo kama chetu hakiwezi.
  • Input ile ile, output tofauti. Modeli za kuzalisha hazitoi jibu lile lile mara mbili kila wakati. Hiyo inaharibu mzunguko wa safari (round-trip) — kufunika wakati wa kutoka na kufunua wakati wa kurudi kunategemea thamani ile ile halisi kila wakati kuwakilishwa na thamani ile ile bandia.

Caiioo imejengwa kwa ajili ya upande mwingine wa biashara hiyo: kichujio kidogo, kinachotabirika, cha chini ya sekunde moja kinachoendeshwa kwenye composer kabla ya mtumiaji kubonyeza tuma, na ambacho kila wakati kinazalisha thamani ile ile bandia kwa thamani ile ile halisi ndani ya mazungumzo, ili mzunguko wa safari ubaki na mshikamano. Jedwali la daraja la wenza hapo juu ni ulinganisho wa haki kwa aina hiyo ya matumizi.

Ushahidi upo kwenye matokeo

Vipimo vya ulinganifu (Benchmarks) ni hatua ya kuanzia, siyo mstari wa kumalizia. Kichujio hiki kimeunganishwa kwenye kipengele kipya cha Caiioo: pseudonymizer — sehemu ambayo kihalisia ipo kati ya mtunzi na modeli.

Hivi ndivyo hutokea mtumiaji anapobonyeza tuma.

  1. Tambua (Detect). Tabaka la regex huanza kufanya kazi — ni la uhakika na lina kasi ya microsecond. Modeli ya ML hufuata kwa chochote kilichobaki. Ikiwa tabaka hizi mbili zinaingiliana kwenye sehemu ile ile ya maandishi, tunatumia sheria rahisi: regex hushinda kwenye miundo ya juu (surface formats), ML hushinda kwenye muktadha.
  2. Tofautisha binafsi dhidi ya wengine (Tag self vs. other). Caiioo hutenganisha vitambulishi vinavyomrejelea mtumiaji na vitambulishi vinavyorejelea watu wengine. Mtumiaji anaweza kuchagua kuficha kimoja tu, au vyote viwili. Majina ambayo mtumiaji ameongeza kwenye kamusi ya binafsi kila wakati huhesabiwa kama "binafsi."
  3. Badilisha (Substitute). Kila thamani halisi hupewa jina mbadala (pseudonym) thabiti na linaloendana na mtindo. "Sarah Goldberg" inakuwa "Maya Hartwell" — na kubaki "Maya Hartwell" kwa mazungumzo yote, ili mantiki ya modeli kuhusu mtu huyo isigawanyike katika zamu tofauti. Jedwali la kutafuta thamani halisi kwenda bandia huwekwa kwenye kifaa cha mtumiaji, likiwa limesimbwa kwa siri (encrypted) kwa ufunguo kutoka kwenye keychain ya jukwaa.
  4. Tuma (Send). Modeli hupokea ujumbe ambao ni bandia kikamilifu. Hakuna kitambulishi halisi kinachovuka mtandao, na kumbukumbu yetu ya ukaguzi (audit log) hurekodi idadi pekee — kamwe hairekodi thamani zenyewe.
  5. Rejesha (Restore). Jibu linalokuja (streaming response) hurudishwa kwenye hali yake ya asili linapowasili. "Maya Hartwell" katika jibu la modeli inakuwa "Sarah Goldberg" kabla ya kufika kwenye skrini, ikionyeshwa na alama ndogo ya mwanga (glow pill) ili mtumiaji aweze kuona kwa haraka ni nini kilicholindwa.
  6. Rejesha hoja za zana pia (Restore tool arguments too). Ikiwa modeli itaita zana — kutuma barua pepe, kufungua tiketi, kuandika kwenye hati — na hoja (arguments) zina thamani bandia, tunabadilisha na kurudisha thamani halisi kabla ya zana kufanya kazi. Modeli hutoa mantiki kupitia thamani bandia; kitendo kinachukua thamani halisi.

Kichujio hiki hakijali ni huduma gani ya AI inayotumika. Inafanya kazi kabla ya ujumbe kufika kwenye modeli, kwa hivyo OpenRouter, Anthropic, Google, OpenAI, na Ollama ya ndani zote hupokea data ile ile iliyofichwa (masked payload). Kuongeza mtoa huduma mpya hakufungui tena mwanya wa faragha.

Nani anayelindwa

Mtumiaji. Jina la mtumiaji, barua pepe, anuani, simu, IP, na vitambulisho vya biometriska — vitu ambavyo, vikichukuliwa pamoja, vinamtambulisha mtu kwa mkusanyaji — haviondoki kwenye kifaa wakati kichujio kimewashwa.

Watu ambao mtumiaji anawazungumzia. Zana nyingi za faragha huzingatia mtu anayeandika, lakini kile wanachopuuza ni 'mkataba wa kijamii' — ukweli kwamba sote tuna wajibu kwa wengine kama tulivyo nao kwetu wenyewe. Kuwasilisha "Tafadhali chambua mwenendo wa Bw. Saunders kwa kutokuwa na uwezo" kwa LLM, ambapo inaweza kurekodiwa katika kumbukumbu za mfumo kwa muda usiojulikana, ni kutowajibika (na kunaweza kuwa kashfa). Kuuliza LLM msaada na Google Sheet iliyo na mawasiliano ya biashara 1,000 kunaweka yote hayo kwenye mfumo wa kuhifadhi data (kwa viwango tofauti, kulingana na 'zero data retention' halisi inayotumika). Kichujio cha Caiioo pia kinahusu watu wa tatu: mteja ambaye mkataba wake unaandaliwa, mgonjwa ambaye rekodi yake inachambuliwa, mfanyakazi mwenzake ambaye barua pepe yake ilibandikwa kwenye muktadha. Hawakutoa idhini kwa LLM ya mbali kuona vitambulisho vyao. Kichujio kinaheshimu hilo kwa msingi; mtumiaji anaweza kubadili kwenda "mimi tu" au "wengine tu" ikiwa mtiririko wa kazi unahitaji hivyo.

Mashirika — biashara, hospitali, makampuni. Nambari za akaunti, nambari za leseni, nambari za rekodi za matibabu, maelezo ya miamala ya kifedha, vitambulisho vya ndani, funguo za API, orodha za wateja. Biashara ina maslahi yale yale ya kupunguza data kama mtu binafsi. Daktari anayetumia Caiioo kuandaa barua ya kuruhusiwa mgonjwa hatumi nambari ya rekodi ya matibabu ya mgonjwa kwa OpenAI. Wakili hatumi nambari ya akaunti ya mteja kwa Anthropic. Mhandisi wa msaada hatumi ufunguo wa API kutoka kwenye kumbukumbu ya mteja kwa Google. Kichujio hakiulizi ikiwa kitambulisho ni cha mtu au shirika — kinakiweka tu kwenye kifaa.

Manufaa ya juu, mfiduo wa chini kabisa

Lengo kuu ni kwamba mtumiaji asipaswi kuhisi kichujio.

Zana nyingi za faragha zinalazimisha chaguo: ficha kwa ukali na uone jibu la mfano likiwa baya, au weka maelekezo yanayoweza kutumika na uone ahadi ya faragha ikimomonyoka. Tulikataa biashara hiyo. Mfano bado unapata maelekezo yaliyoundwa kikamilifu — unaona jina, mahali, tarehe, nambari ya rekodi ya matibabu, yote katika nafasi sahihi za kisarufi. Unaona tu vitu vya uongo. Mantiki yake ni ile ile; ni herufi tu ndizo zilizosafishwa.

Ubadilishaji thabiti ndio unaofanya hilo lifanye kazi. Kwa sababu thamani ile ile halisi kila wakati inalingana na ile ile ya uongo ndani ya mazungumzo — kwenye ujumbe wa mtumiaji, matokeo ya zana yanayorudi yakirejelea jina hilo, jibu la awali la mfano lililolitaja — mfano una mtu, mahali, au kitu thabiti cha kufikiria. Mazungumzo ya zamu nyingi hayachanganyiki. Simu za zana haziharibiki. Wakala wadogo wanarithi ramani ya mazungumzo ya mzazi na kubaki thabiti katika kazi nzima.

Matokeo ambayo mtumiaji anaona ni mazungumzo halisi. Data ambayo mtoa huduma anaona ni hadithi thabiti. Kazi inafanyika katika pengo kati ya mitazamo hiyo miwili, na lengo — lengo pekee — ni kufanya pengo hilo lisionekane.

Kichujio cha faragha kinachozuia kitazimwa. Kichujio cha faragha kinachopotea ndani ya mtiririko wa kazi ndicho pekee kinachostahili kutolewa.

Hicho ndicho kiwango tulichojenga.