Prichádza nový model umelej inteligencie, ktorý nakreslí ľudské ruky bez ďalších prstov.

Firma Black Forest Labs, ktorá sa zaoberá témou AI, ukázala svoj prvý balík na generovanie grafiky z textových príkazov s názvom FLUX.1. Ide o firmu, ktorú založili ľudia stojaci za technológiou Stable Diffusion. Model FLUX.1 prichádza na trh po problémoch so Stable Diffusion 3 Medium.

Častou kritikou pri generovaní ľudských modelov býva práve problematika vernosti anatomických detailov. Deformované končatiny alebo ústa či zuby sú bežnou praktikou. Toto by sa malo s príchodom nového modelu zmeniť.

AI má vo všeobecnosti ešte čo doháňať. Problémom býva najmä to, že nedokáže ani vygenerovať text, ktorý jej napíšete. To považujeme za veľkú slabosť a väčšinou nedokážete prikázať AI modelu, aby vygeneroval obrázkový text z vášho príkazu. Ak to urobí, zväčša to skončí nejakou skomoleninou.

Nový model, ktorý založili bývalí inžinieri firmy Stability AI, by mal podľa doterajších tvrdení prekonávať modely, ako sú napríklad Midjourney a DALL-E. Ide o prekonanie v kvalite obrazu a presnosti dodržania textových pokynov. K dispozícii sú 3 verzie – Pro, Dev a Schnell (ako rýchly).

flux family chartZdroj: Black Forest Labs

Podľa skúseností z webu ArsTechnica je vernosť podobná modelom DALL-E od OpenAI. Fotorealizmus pripisujú modelu Midjourney 6. Funguje na technológii zvanej ako hybridná architektúra. Kombinuje rôzne transformačné a difúzne techniky. Celkovo je k dispozícii až 12 miliárd parametrov. Generovanie rúk však nie je jedinou výhodou tohto modelu.

Môžete ho využiť na generovanie akýchkoľvek obrázkov. Avšak práve toto bola veľká slabina a tá by mala byť teraz napravená. A to aj so započítaním, že používatelia budú chcieť generovať ruky v rôznych pózach.

Zatiaľ nie je známe, odkiaľ získala firma tréningové obrázky. Toto je však úskalie je mnohých nástrojov na generovanie obrázkov a textov. Pri otázke, odkiaľ má nástroj tréningové dáta, sa predstavitelia mnohých firiem tvária rozpačito. Do budúcna plánuje Black Forest Labs generovanie videí.

Zdroj: Black Forest Labs, ArsTechnica

Prečítajte si aj:

Michal Reiter

Michal Reiter
Publikujem o dianí na internete, súkromí, bezpečnosti a testujem notebooky, smartfóny, audio produkty a ďalšie gadgety.