Najlepšie výsledky dosiahnete s platenými verziami, začať ale môžete aj zadarmo.

Kreslenie obrázkov prostredníctvom AI ste si zrejme už vyskúšali, alebo o tom minimálne počuli. Dnes sa takéto obrázky dajú celkom spoľahlivo rozlíšiť, pretože nástroje, ktoré sú na to trénované, kopírujú podobné štýly. Naposledy bol takto populárny štýl podľa japonského štúdia Ghibli.

Konkrétne tipy na AI nástroje nájdete nižšie v článku.

Čo dokážu AI nástroje na kreslenie?

Samozrejmosťou je nielen kopírovanie vybraných štýlov, ale aj všeobecne zaužívaných spôsobov vzhľadu výsledného obrázka. O čom je reč? Napríklad o tom, že si môžete nechať vytvoriť grafiku vhodnú do komiksu, fotorealistickú grafiku alebo napríklad anime. Žánrov je naozaj obrovské množstvo a nástroje to vedia viac či menej úspešne implementovať do výsledného výtvoru.

O čo teda ide, keď je to také jednoduché a obrázky nám kreslí umelá inteligencia? Faktom je, že umelá inteligencia niečo nakreslí. Skutočne pokročilé nástroje umožňujú definovať rôzne pohľady, uhly a prostredie alebo celkový nádych fotografie. Špecificky existujú možnosti ako nakresliť portrét, ktorý by sa podobal na fotografiu odfotenú konkrétnym objektívom.

Nástroje tohto typu pomáhajú aj vtedy, keď potrebujete vygenerovať všeobecný obrázok. Je to v posledných mesiacoch často vidieť ako súčasť prezentácií alebo vo forme titulkových obrázkov k článkom na internete. Je to jednoduchšie ako hľadanie na internete, nehovoriac o tom, že mnoho obrázkov je autorsky chránených.

Navyše, často nie je potrebné platiť jednotky či desiatky dolárov za fotografiu z fotobanky a na ilustračný obrázok ku vášmu blogu alebo článku na webe to bude bohato postačovať.

Nielen náhodné generovanie

Umelá inteligencia na kreslenie obrázkov však nie je len o kreslení vymyslených fantázií a môžete ju využiť aj na rôzny návrh dizajnu alebo praktické ukážky v konkrétnej veci v rôznych dizajnoch. Necháte si napríklad nakresliť jeden objekt rôznymi spôsobmi a nakoniec sa rozhodnete, ktorý použijete.

Takéto nástroje vygenerujú zväčša viacero obrázkov a málokedy dostanete len jeden špecifický. V prípade vnorenia tejto funkcie do nástroja ako je ChatGPT dostanete len jeden obrázok, ktorý môžete následne ďalej upravovať.

Ak ale použijete skutočné nástroje na kreslenie obrázkov, dostanete ich v jednej dávke na výber viacero. Bežne sa totiž stáva, že niektoré obrázky sa podobajú na to, čo chcete, no stále to nie je to, čo potrebujete. Vďaka generovaniu viacerých obrázkov naraz si môžete vybrať z väčšieho množstva.

chatgpt_obrazok s letilkami vylietajucimi z polaroid fotografieZdroj: TOUCHIT

Ako fungujú?

S kreslením obrázkov je to podobné ako pri veľkých jazykových modeloch. My ako ľudia máme pocit, že dostávame niečo skutočne unikátne a že tá umelá inteligencia vymyslela niečo, čo tu ešte nebolo. Faktom ale je, že náš ľudský mozog funguje trochu inak a dá sa dobre oklamať. Hoci klamstvo nemusí byť úplne to výstižné slovo, pretože aj ľudia pri tvorivej činnosti kopírujú niečo, čo už niekde videli.

Ani návrh grafiky alebo loga nebude začínať od úplného začiatku a zväčša sa inšpirujete tým, čo tu už bolo. Takto je to aj s nástrojmi AI, ktoré sú natrénované na obrovskom počte súprav obrázkov a ich neurónové siete ďalej vytvárajú podobnosti na základe týchto súprav.

Je to dôležité najmä preto, aby neurónová sieť dokázala vytvoriť obrázok, ktorý dáva zmysel. Keby sme nechali všetko na umelej inteligencii bez toho, aby sme jej najprv vysvetlili, čo je čo, nemali by sme adekvátne výsledky. Nemôžeme chcieť po AI nakresliť dom pri mori, keď v živote žiadny nevidela.

Následne sa dá s výsledkom ďalej pracovať a kombinovať prvky v obrázkoch. Napríklad zmeniť pozadie, odstrániť vybrané objekty alebo pridať ďalšie. Dokonca aj „dokresliť“ to, čo bolo za odstráneným objektom, a to už dopočíta AI. Poznáte to napríklad zo smartfónov Samsung a AI úpravy vašich fotiek v galérii.

Nie vždy sa to podarí a niekedy to usporiadanie celkom nesedí, ale preto sa tieto nástroje vyvíjajú, aby sa s obrázkom dalo ďalej pracovať. V minulosti to fungovalo na princípe jednoduchého vygenerovania obrázka, s ktorým ste už ďalej nepohli. Nuž, keď ste zadali ten istý príkaz znova, dostali ste iný obrázok, nikdy ste nedostali to isté. Doba pokročila a jednotlivé nástroje umožňujú vybrať, ktorý segment na obrázku chcete upraviť.

chatGPTpredplatneZdroj: OpenAI
Zadarmo vs. predplatné ChatGPT

Herná grafika

AI obrázky sa využívajú na rôzne ilustrácie, marketingové vizuály, ale aj v hernom dizajne. Herné štúdiá sa vôbec netaja, že využívajú tento spôsob na vytváranie grafiky. Nejde o nič nové alebo o niečo, čím by zrazu takéto štúdia podvádzali.

Stačí si predstaviť nástroj Terragen a jemu podobné a zistíte, že ani tie rozsiahle scenérie sa vo vašej hre s otvoreným svetom nebudovali pixel po pixeli, ale celý les bol na začiatku vygenerovaný.

Samozrejme, dolaďovanie takéhoto sveta alebo výtvoru vyžadovalo množstvo hodín práce, a to už bola úloha grafika. Bolo by naivné si myslieť, že všetko vytvorí umelá inteligencia. Stále je to len pomocník.

Trendom, ktorý vidíme v roku 2005, je teda zlepšovanie generovania obrázkov, vyššie rozlíšenie aj rozmery samotných obrázkov, rôzny pomer strán, a to najmä integrácia s dostupnými nástrojmi. Adobe Photoshop je typickým príkladom spojenia tradičného softvéru s umelou inteligenciou pri kreslení grafiky.

terragen a ukážka výtvorov ako pohorie, generovanie oblakov alebo scenériíZdroj: PlanetSide.co.uk

Ako si takýto nástroj vyberať?

Predtým, než si vyberiete konkrétny nástroj, zväčša sa rozhodujete podľa ceny a možnosti. Okrem toho zvažujete aj jednoduchosť použitia a kvalitu výstupov. Pokročilejší používatelia si môžu tieto nástroje nainštalovať na vlastný počítač, no potrebujete naozaj silnú grafickú kartu. Napríklad NVIDIA RTX 40 série. Mnohé služby ale fungujú na internete cez webové rozhranie alebo napríklad vo forme aplikácie pre smartfón.

Rýchlosť generovania obrázka sa počíta v sekundách alebo desiatkach sekúnd pri online nástrojoch. Podľa náročnosti a výkonu vášho počítača sa takéto generovanie na vlastnom hardvéri pohybuje v rozsahu desiatok sekúnd až minút.

Na internete sú aj rôzne návody pre konkrétne nástroje ako dosiahnuť želaný stav. Napríklad, ak chcete vytvárať portrétové fotografie, no stále im niečo chýba. Takzvaných promptov a tutoriálov je na internete obrovské množstvo.

Zväčša je ale potrebné zohľadniť fakt, že sú prispôsobené pre konkrétny nástroj. To, že príkaz bude fungovať prakticky v akomkoľvek nástroji, je správne uvažovanie. Otázka je, ako ho vie zapracovať a čo bude výsledkom.

Midjourney

Toto je absolútna špička pri tvorbe obrázkov a takisto aj pri tvorbe krátkych videosekvencií. Využíva pokročilé difúzne modely, avšak nevýhodou môže byť, že nie je dostupný zadarmo. Tento nástroj nemáte možnosť ani len vyskúšať na niekoľkých obrázkoch.

Z toho, čo je verejne dostupné a z toho, ako sa firma prezentuje, je predpoklad, že skúšať ho nebude potrebné a radi si za tento nástroj zaplatíte. Stojí 8 dolárov na mesiac pri ročnej platbe. To vám umožní vygenerovať približne 200 obrázkov mesačne s možným komerčným využitím.

Dokáže vygenerovať fotorealistické obrázky, kopírovať rôzne umelecké štýly, ako napríklad surrealizmus, cyberpunk alebo klasické maliarstvo na plátne, či napríklad zvýšiť kvalitu obrázkov. Je určený pre profesionálov a tomu odpovedajú aj funkcie a celkové možnosti. Tohtoročnou novinkou sú animované sekvencie a tvorba 3D modelov.

Okrem toho ale hovoríme o tom, že môžete kombinovať rôzne obrázky na dosiahnutie konkrétneho štýlu. To znamená, že z jedného obrázka môžete nechať extrahovať štýl, v akom je vyhotovený a z druhého obrázka chcete konkrétny objekt. Toto celé spojíte do výsledného celku s konkrétnym zadaním. Je to skutočne silný nástroj a dalo by sa povedať, že zatiaľ nič lepšie neexistuje.

midjourney ukážka obrázkovZdroj: midjourney

DALL-E 3

Keď už je reč o tom, že nič lepšie ako Midjourney neexistuje, máme tu model Dall-E 3. Ten je vyvinutý od Open AI a nájdete ho aj v nástroji ChatGPT. V minulosti bol súčasťou iba verzie Plus, teda platenej, no dnes v limitovanej podobe môžete generovať obrázky aj vo verzii zadarmo.

Z mojich skúseností je to nástroj, ktorý nejakým zázrakom dokáže odhadnúť, čo presne som konkrétnym príkazom myslel. Obrázky, ktoré poskytuje, sú vynikajúce a málokedy v nich treba niečo meniť.

Treba ale dodať, že moje potreby nie sú vyslovene profesionálne a zväčša potrebujem ilustračný obrázok k niektorej téme. Je ideálny pre začiatočníkov. No a pre všetkých, ktorí už na nástroj ChatGPT používajú alebo si zaň platia. Na bežné použitie asi nemá zmysel platiť ešte ďalší nástroj, ak nie ste vyslovene profesionálny grafik.

Ak teda hovoríme o tom, že je súčasťou veľkého jazykového modelu od tejto firmy, jeho cena je 23 eur na mesiac. Je to štandardná mesačná cena, ktorá sa platí každý mesiac a nie je tu možnosť ročného predplatného za zvýhodnenú cenu. S plateným nástrojom ChatGPT budete môcť v istej miere vytvárať aj videá prostredníctvom ich vlastného nástroja s názvom Sora.

dall-e ukážka na obrázkuZdroj: OpenAI

Stable Diffusion

Ide o open source model, ktorý je vhodný aj na lokálnu inštaláciu. Pamätajte na to, že vaša grafická karta potrebuje minimálne 8 GB operačnej pamäte. Často sa s týmto nástrojom stretnete aj cez samostatné webové služby. Nie je teda nutné ho inštalovať u seba na počítači.

S lokálnou inštaláciou budete môcť generovať obrázky bez toho, aby sa čokoľvek odosielalo na internet. Má obrovské možnosti prispôsobiteľnosti, podporuje generovanie vo vysokom rozlíšení a takisto aj transformácie medzi obrázkami.

Tento nástroj je zadarmo a s výkonnou kartou stojí za to ho používať u seba na počítači. Nevýhodou môže byť, že pre začiatočníkov bude mätúci. Na jednoduché generovanie obrázkov však postačí, akonáhle budete chcieť s obrázkami robiť niečo viac, tento nástroj bude vyžadovať štúdium takzvaných promptov a experimentovanie s nastaveniami.

stable diffusion ukážka rozhrania na počítačiZdroj: Automatic1111

Výhodou je, že generovanie obrázkov si môžete prispôsobiť modelmi, ktoré si stiahnete priamo do počítača – napríklad na stránke Hugging Face. Počítajte s tým, že majú veľkosti niekoľko gigabajtov, no rapídne rozšíria možnosti toho, čo dokážete vygenerovať.

Okrem toho má aj podporu pre nový model FLUX.1, ktorý je vhodný na generovanie superrealistických obrázkov. Dá sa použiť aj v hernom dizajne a pre programátorov, ktorí si chcú vytvárať vlastnú grafiku.

Ďalšie nástroje

Toto boli základné nástroje, ktoré môžete využiť a predstavujú technologickú špičku. To ale neznamená, že na internete nenájdete ďalšie služby, ktoré by v nejakej miere využívali jeden či viacero modelov.

Na generovanie obrázkov môžete využiť napríklad Microsoft Designer, Zoner AI alebo napríklad nástroj Leonardo, ktorý má aj vlastný model. Leonardo je však najmä agregátor viacerých modelov, podobne ako je to napríklad aj pri Stable Diffusion. Ten síce má vlastný model, no dokáže zahrnúť viaceré prispôsobené modely.

LeonardoAI rozhranieZdroj: LeonardoAI

V praxi vás ale zaujíma to, cez aký nástroj sa dá nakresliť obrázok a pokiaľ možno, aby ste za konkrétnu službu nemuseli do istej miery platiť.

Na základné použitie sa dajú vyskúšať veľké jazykové modely, ktoré zvyknú integrovať do svojho rozhrania aj tvorbu obrázkov. Je to jednoduché. Namiesto bežnej otázky prispôsobíte príkaz a zadáte mu požiadavku začínajúcu „nakresli obrázok“. Takto funguje napríklad aj Perplexity a ChatGPT.

Medzi ďalšie nástroje, ktoré rozhodne stoja za vyskúšanie, patrí NightCafe alebo napríklad Dream by Wombo. Tiež sú vhodné webové nástroje Stablecog alebo napríklad Hotspot.ai.

Prečítajte si aj:

Michal Reiter

Michal Reiter
Publikujem o dianí na internete, súkromí, bezpečnosti a testujem notebooky, smartfóny, audio produkty a ďalšie gadgety.

Máte pripomienku alebo otázku k článku? Napíšte nám na redakcia@touchit.sk alebo priamo autorovi článku. Ďakujeme.