28. apríla 2026 • 2m čítanie

OpenAI má nový model. Odstráni citlivé dáta z dokumentov

Filter súkromia rozpozná citlivé údaje pri práci s AI.

Hlavným prínosom OpenAI Privacy Filter je schopnosť rozpoznať citlivé informácie ešte predtým, ako ich pošlete do AI modelu alebo ako sa dostanú do jeho výstupu. Ide napríklad o osobné údaje, kontaktné informácie či finančné dáta. Zatiaľ si neporadí s obrázkami a ide o čisto textový model, pokiaľ integrácia nástroja využívajúca tento filter nebude obsahovať aj OCR.

Tiež by mal rozpoznať heslá a API kľúče, čo je aktuálne veľká téma a práve tieto údaje bývajú cieľom únikov dát pri skúšaní rôznych AI nástrojov. Model dokáže chápať kontext textu, čím zvyšuje svoju efektivitu oproti klasickým filtrom založeným len na statických vzoroch a šablónach.

Filter tieto údaje automaticky upraví, anonymizuje alebo úplne odstráni. Doteraz ste museli citlivé údaje manuálne začierniť a je to stále najistejší spôsob, ako si chrániť súkromie, napríklad pri zdravotníckych dátach alebo finančných analýzach.

Nový filter by znamenal vyššiu mieru kontroly nad vašimi dátami bez potreby manuálnych úprav, teda napríklad spomenutého začiernenia alebo ručného mazania z dokumentov, než ich nahráte do AI nástroja.

Aj pre bežné počítače

Má celkovo 1,5 mld. parametrov, pričom aktívnych je približne 50 miliónov. Môžete ho spustiť priamo v internetovom prehliadači alebo na bežnom notebooku. Kontextové okno má veľkosť 128K tokenov, takže je vhodné aj na spracovanie rozsiahlych dokumentov v jednom vlákne.

Dostupný pre všetkých

OpenAI Privacy Filter je dostupný vďaka otvorenej licencii Apache 2.0. Vývojári ho môžu použiť vo svojich aplikáciách a tiež ho podľa svojich potrieb prispôsobovať. Napríklad pre oblasť zdravotníctva alebo práva. OpenAI ho publikovala aj na platformách Hugging Face⁠ a Github. Pre firmy je dobrou správou, že ho môžu využívať aj na komerčné účely.

Zdroj: OpenAI

Prečítajte si aj: