Do dvoch mesiacov od svojho vydania dosiahol 100 miliónov aktívnych používateľov, čím sa stal najrýchlejšie rastúcou spotrebiteľskou aplikáciou, aká kedy bola spustená.

Ako je to s našimi osobnými údajmi

Jeho používatelia sú priťahovaní pokročilými možnosťami tohto nástroja – no sú aj znepokojení jeho potenciálom spôsobiť narušenie či zneužitie v rôznych sektoroch.

Oveľa menej diskutovaným dôsledkom sú riziká ochrany súkromia, ktoré ChatGPT predstavuje pre každého z nás. Len približne pred viac ako mesiacom Google predstavil svoju vlastnú konverzačnú AI s názvom Bard a predpokladám, že ďalšie budú určite nasledovať. A veľké technologické spoločnosti aktuálne vyvíjajúce AI sa skutočne významne zapojili do pretekov v zbrojení. Problém je v tom, že je tento „nástroj“ je poháňaný našimi osobnými údajmi.

Hodnota OpenAI neustále rastie

ChatGPT sa opiera o rozsiahly jazykový model, ktorý vyžaduje obrovské množstvo údajov na fungovanie a zlepšovanie. Na čím viac údajov je model trénovaný, tým lepšie dokáže zisťovať vzory, predvídať, čo príde ďalej a generovať temer hodnoverný text.

OpenAI, spoločnosť stojaca za ChatGPT, poskytla nástroju približne 300 miliárd slov systematicky zozbieraných z internetu: knihy, články, webové stránky a príspevky – vrátane osobných informácií získaných bez súhlasu.

Ak ste už niekedy napísali blogový príspevok, recenziu produktu či komentovali článok online, existuje obrovská šanca, že tieto informácie „spotreboval“ ChatGPT.

A už vznikajú problémy…

Zber údajov používaný na trénovanie ChatGPT je problematický z niekoľkých dôvodov.

Za prvé, nikto sa nás výslovne nepýtal, či OpenAI môže používať naše údaje. Ide o porušenie súkromia, najmä ak sú údaje citlivé a možno ich použiť na identifikáciu kohokoľvek z nás, našich rodinných príslušníkov alebo našej polohy.

Za druhé, aj keď sú údaje verejne dostupné, ich použitie môže narušiť to, čo nazývame kontextová integrita. Toto je základná zásada v právnych diskusiách o súkromí. Vyžaduje, aby informácie jednotlivcov neboli odhalené mimo kontextu, v ktorom boli pôvodne vytvorené.

Právo na zabudnutie?

ChatGPT od OpenAI totiž neponúka žiadne postupy pre jednotlivcov, aby skontrolovali, či spoločnosť uchováva ich osobné údaje, alebo aby požiadali o ich vymazanie. Ide o zaručené právo v súlade s európskym všeobecným nariadením o ochrane údajov (GDPR) – hoc dnes sa stále diskutuje o tom, či je ChatGPT v súlade s požiadavkami GDPR.

A toto „právo byť zabudnutý“ je obzvlášť dôležité v prípadoch, keď sú informácie nepresné alebo zavádzajúce, čo sa zrejme zdá byť v ChatGPT bežný jav.

Nemenej dôležitým faktorom môžu byť aj skopírované údaje, na ktorých bol ChatGPT trénovaný,  lebo tieto údaje môžu byť duševným vlastníctvom alebo autorským právom.

Ochrana autorsky chránených údajov

Napríklad, keď som to vyzval, aby nástroj vytvoril niekoľko viet z knihy „NSX-T: Logical Routing and Switching: The Basic Principles of Building Software-Defined Network Architectures with VMware NSX-T“ od autora Iwan Hoogendoorn, uviedol text chránený autorskými právami.

Možno sa mýlim, no predpokladám, že OpenAI nezaplatilo za dáta, ktoré na svoje účely „vysalo“ z Internetu. Čiže sa dá predpokladať, že vy, jednotlivci, majitelia webových stránok a spoločnosti, ktoré ich vytvorili, neboli nijako odškodnené. Toto je obzvlášť pozoruhodné vzhľadom na to, že OpenAI bola nedávno ocenená na 29 miliárd USD, čo je viac ako dvojnásobok jej hodnoty v roku 2021.

Platený model

OpenAI tiež oznámila uvedenie klienta ChatGPT Plus, čo je platené predplatné, ktoré zákazníkom ponúkne nepretržitý prístup k nástroju, rýchlejšie časy odozvy a prioritný prístup k novým funkciám. Tento plán určite prispeje k oveľa väčším očakávaným príjmom v tomto a budúcich rokoch.

Nič z toho by nebolo možné uskutočniť bez údajov, konkrétne bez našich údajov zhromaždených a použitých bez nášho povolenia. Tak ako dnes vlastne poňať „zásady ochrany osobných údajov“ ?

Ďalšie riziko ochrany súkromia zahŕňa údaje poskytnuté ChatGPT vo forme používateľských výziev. Keď nástroj požiadame, aby odpovedal na otázky alebo vykonal úlohy, môžeme neúmyselne odovzdať citlivé informácie a dať ich do verejnej sféry.

Príklad: právnik môže nástroj vyzvať, aby skontroloval návrh rozvodovej zmluvy, alebo ho môže programátor požiadať, aby skontroloval časť kódu. Dohoda a kód, okrem odoslaných esejí, sú teraz súčasťou databázy ChatGPT. To znamená, že môžu byť použité na ďalšie školenie nástroja a môžu byť zahrnuté do odpovedí na výzvy iných ľudí.

Čo všetko OpenAI zhromažďuje?

Okrem iného OpenAI zhromažďuje široký rozsah ďalších používateľských informácií. Podľa zásad ochrany osobných údajov spoločnosti zhromažďuje IP adresu používateľov, typ a nastavenia prehliadača a údaje o interakciách používateľov so stránkou – vrátane typu obsahu, s ktorým sa používatelia stretávajú, funkcií, ktoré používajú, a akcií, ktoré vykonávajú.

A zrejme zhromažďuje tiež informácie o aktivitách prehliadania používateľov v priebehu času a na rôznych webových stránkach. Určite je ohromujúce, že OpenAI uvádza, že môže zdieľať osobné informácie používateľov s nešpecifikovanými tretími stranami bez toho, aby ich informoval, len aby splnil svoje obchodné ciele.

Nenastal už čas „zasiahnuť“ ?

Viacerí odborníci sa domnievajú, že klient ChatGPT je bodom zlomu pre AI – realizáciou obrovského technologického rozvoja, ktorý môže spôsobiť revolúciu v spôsobe, akým pracujeme, učíme sa, píšeme a dokonca myslíme.

Napriek jeho potenciálnym výhodám si musíme uvedomiť, že OpenAI je súkromná, zisková spoločnosť, ktorej záujmy a komerčné imperatívy nemusia byť nevyhnutne v súlade s väčšími spoločenskými potrebami.

Riziká ochrany osobných údajov, ktoré sú spojené s ChatGPT, by už mali zaznieť s varovaním. A ako spotrebitelia rastúceho počtu technológií AI by sme mali byť mimoriadne opatrní, aké informácie zdieľame pomocou takýchto nástrojov.

A ešte maličkosť

Tento príspevok bol realizovaný s významnou pomocou ChatGPT. Počas písania príspevku sa autor  obrátil aj na OpenAI so žiadosťou o komentár, ale do času napísania tohto príspevku neodpovedali. 😊

Július Kováč, peerIT

Značky: