Konverzácia s umelou inteligenciou nie je taká unikátna, ako by sa javilo.
V diskusných skupinách sa objavujú zaujímavé pokusy nielen o tom, ako umelú inteligenciu oklamať, ale aj, ako sa snaží takpovediac oklamať ona nás. Nie je to klamstvo v pravom slova zmysle a dalo by sa povedať, že sa nás môže snažiť programovať. Stačí, keď sa jej opýtajte na číslo medzi 1 a 25. Schválne si vyskúšajte, koľko nástrojov veľkých jazykových modelov vám dá rovnaké číslo. Je to náhoda?
Kto prekabáti toho druhého?
Bezpečnosť nástrojov je neustála téma, nakoľko sa objavujú rôzne techniky ich zneužitia. Väčšinou ide o podvrh nejakým typom požiadavky. Jej úlohou je obísť bezpečnostné mechanizmy a prinútiť ju odpovedať aj na také otázky, na ktoré by štandardne poskytovať odpovede nemala. V minulosti bol zaznamenaný prípad, keď sa veľký jazykový model podarilo oklamať zápisom v ASCII kóde.
Rovnaké číslo 17
Pri tomto pokuse skúste zadať požiadavku na vyššie uvedený rozsah náhodných čísiel. Výsledkom bude číslo 17. Zaujímavosťou na tom je to, že na úspešnosť tohto pokusu potrebujete zadať požiadavku v anglickom jazyku – give a number between 1 and 25. Pri zadaní v slovenčine sa nástrojom darilo lepšie a miera náhody sa nepodobala odpisovaniu jedného od druhého.
ChatGPT, Gemini aj Perplexity asi odpisovali jeden od druhého a zhodli sa na čísle 17. Výnimkou bol Grok3, ktorý dal na prvýkrát číslo 23.




Riziko podvrhnutia odpovedí
Dá sa predpokladať, že v budúcnosti môžu byť nástroje AI zneužívané na vytváranie falošnej mienky na rôzne, avšak zrejme najčastejšie na exponované témy. Je to sčasti podobné ako pri vyhľadávači, ktorý musí mať bezpečnostné mechanizmy, aby sa vám do výsledkov nepridávali falošné stránky. Nie že by to fungovalo stopercentne a vyhľadávacie mechanizmy určujúce, čo sa používateľovi zobrazí, s tým bojujú dodnes.
Predstavte si, že by umelá inteligencia po zadaní otázky na konkrétneho politika, politickú stranu alebo aktuálnu udalosť vo svete dávala podvrhnuté informácie a skreslené údaje. Mnohí používatelia nekontrolujú výstupy z týchto nástrojov a mohli by sa ľahko stať obeťou dezinformačných kampaní.
Zdroj: vlastné
Prečítajte si aj: