ChatGPT-5 si vymýšľa menej – „nehalucinuje“
Zdroj: MOMO36H10 HH / Pixabay
2m čítanie

ChatGPT-5 si vymýšľa menej – „nehalucinuje“

Najnovšia verzia ChatGPT radšej povie, keď niečo nevie.

To je veľký pokrok oproti minulým verziám, ktoré by „halucinovali“. Dôvodom je, že ChatGPT je vytvorený tak, aby vždy poskytol odpoveď. Keď ale nevie, alebo si nie je istý, radšej si niečo vymyslí. Stretnete sa potom s vymyslenými dielami sci-fi poviedok priradené k vymysleným autorom a ďalšími „perlami“.

Nový model si vymýšľa menej

GPT-5 má tiež halucinácie, no je ich výrazne menej a to až o 51 %. Konkrétne išlo o porovnanie medzi modelmi gpt-5-thinking-mini vs. OpenAI o4-mini. Starší model mal len 1 % odpovedí, kedy aj nezodpovedanie pokladal za výsledok. To by bolo lepšie, ako používateľov zavádzať.

Toto ale nemení nič na tom, že GPT treba preverovať. Aj verzia 5 robí chyby a je v nich sofistikovaná. Na 10 riadkoch vám poskytne nepriestrelné fakty, no niekoľkých slovách spraví chybu.

gpt5-vymyslanie
Zdroj: TOUCHIT

Prečo chceme menej halucinácií?

Pri nás používateľoch je to jasné, redšej chcem odpoveď „neviem“ ako množstvo vymysleného textu. Dostať správne výsledky je bežná potreba. Tu však ide aj o niečo menej vznešené – benchmarky.

Firmy s AI sa predháňajú, ktoré z nich majú lepší model. Ak ale budete hodnotiť len podľa správnych odpovedí, výsledné skóre benchmarku bude nadnesené. Odmeňuje sa za správne odpovede, nepenalizuje sa za chybné. Je to podobne ako pri teste.

Niečo zaškrtnete a trafíte sa. Lepšie je triafať, ako testy vôbec nevyplňovať. Zmenou paradigmy sa ale toto mení aj pri AI. Za chybné výsledky pôjdu body opačný smerom – za chybu sa strhnú body a to už potom nie je vhodné na tipovanie.

Lepšie odpovede

GPT-5 je naozaj lepší a vo viacerých prípadoch uvedie, keď nedokáže overiť zdroj. Odpoveď obsahuje aj informáciu o tom, či sa konkrétna informácia potvrdila alebo nepotvrdila.

Toto nie sú úplné novinky a aj staršie modely sa nenechali „pomýliť“ vaším tvrdením a uviedli ho na správnu mieru. Teraz sa to deje častejšie, ak je to potrebné. Máte minimálne o 51 % väčšiu istotu, že odpoveď nie je „vyhalucinovvaná“ nasilu.

Zdroj: OpenAI

Prečítajte si aj: