Modul 04 · Signature

Slovenský PII detektor

Vlastný jazykový model. Rozpoznáva rodné čísla, IBAN, adresy a ďalšie slovenské osobné údaje v dokumentoch aj databázach.

Problém na trhu

Americké DLP detektory nepoznajú slovenské formáty.

Microsoft Purview, AWS Macie aj Google Cloud DLP detegujú primárne anglicky a medzinárodne — SSN, UK NINO, generické EU IBAN. Open-source Presidio síce pozná SK IBAN prefix (regex SK\d{22}), ale žiaden z US toolov neimplementuje modulo-11 validáciu rodného čísla. Výsledok: 20–40 % falošných pozitív, pretože každé 9-cifrové číslo v texte sa klasifikuje ako potenciálne RČ. SlovakBERT a špecializované SK NER modely v komerčnom DLP bežne nebývajú.

Ako to rieši Audrix

SlovakBERT NER + checksum validácie pre každý SK identifikátor.

Audrix PII detektor kombinuje jazykový model fine-tuned na slovenskom korpuse s regex + checksum validáciou pre každý slovenský identifikátor. Precision nad 95 % na vlastnej validačnej sade. Model beží lokálne na GPU v SK dátovom centre — žiadne dáta sa neposielajú do OpenAI či Anthropic.

Kľúčové referencie

Na čom modul stojí

Máte záujem o cenovú ponuku?

Prejdeme si váš scope. Bez záväzkov.

Kontaktujte nás pre individuálnu konzultáciu. Náš tím vám rád predstaví možnosti riešenia AUDRIX pre vašu organizáciu.

← Späť na všetky moduly