Model GPT-4o mini nahradí verziu GPT-3.5 Turbo.

Malým jazykovým modelom sa bude dariť a ich vyššie nasadenie sme predpovedali už v minulosti. Je to cesta, ktorou sa vydajú výrobcovia hardvéru a aplikácií. Vďaka menším jazykovým modelom prinesú používateľom vyššiu rýchlosť, a to aj v spojitosti s behom AI aplikácie na ich zariadení. Web ArsTechnica uviedol, že nový model je dostupný okamžite pre používateľov bezplatnej verzie ChatGPT, Plus, Team a o týždeň neskôr ho dostanú používatelia verzie Enterprise.

Mini modelov je viac

Do budúcna sa počíta so schopnosťou modelu Mini interpretovať obsah obrázkov ako aj možnosť ich generovať. Podobne by to malo byť so zvukom a textovými informáciami. GPT-4o mini podporuje 128k token na vstupe a databáza obsahuje znalosti do októbra 2023. Aj iné firmy majú svoje menšie ML, ako napríklad Microsoft Phi-3 alebo Calude 3.5 Sonnet od Anthropic.

OpenAI hovorí, že ide o prvý AI model firmy, ktorý bude využívať techniku zvanú hierarchia inštrukcií. To by malo ochrániť nástroj pred zneužitím a vytváraním rôznych škodlivých kódov. Sám o sebe by mal byť odolnejší aj voči útokom proti sebe samému zo strany používateľa.

Aj keď OpenAI oznámila okamžitú dostupnosť, nemusíte nástroj vidieť v ponuke možností vo vašom účte. V minulosti firma prišla s možnosťou využiť nástroj bez potreby registrácie. Táto možnosť pre nás ale dodnes nie je dostupná. Verzia Mini podľa testov dosahuje dobré výsledky v širokej škále benchmarkov.

GPT-4o_mini_benchmarksZdroj: OpenAI

Hodnotenie a testy

Problémom je, že reálne nevypovedajú o užitočných schopnostiach nástroja. Jedným z nich je HumanEval v kódovaní. Avšak namiesto merania kvality kódu z technologického alebo matematického hľadiska, je tu iné hodnotenie. Ide o posudzovanie výstupu na základe štruktúry a štýlu.

Na grafe vidieť, že modelu Mini sa darí dobre a prekonáva iné AI GPT. Netvrdíme, že novinka nie je lepšia. Len tvrdíme, že metriky použité na vyhodnocovanie na základe hodnotenia používateľov, nemusia verne odzrkadľovať pokrok jazykového modelu. GPT 4o pravidelne prekonáva v testoch verziu Turbo. Avšak podľa Chatbot Arena má model 4o tendenciu vytvárať zdĺhavé výstupy a pridávať obsah, o ktorý ste ho nepožiadali.

Zdroj: ArsTechnica

Prečítajte si aj:

Michal Reiter

Michal Reiter
Publikujem o dianí na internete, súkromí, bezpečnosti a testujem notebooky, smartfóny, audio produkty a ďalšie gadgety.