Máte dobrú náladu? Rozosmútilo vás niečo? Do ostrej prevádzky začali vstupovať prvé úspešné automatické systémy, ktoré to dokážu rozpoznať. Z marketingového hľadiska je váš aktuálny emočný stav veľmi cenná informácia a pokiaľ ju firmy majú šancu získať, môžu ju úspešne použiť pre svoj prospech. Nie každému sa to však bude páčiť.

Technológie na automatické rozpoznávanie emócií a nálad môžu na prvý pohľad pôsobiť ako niečo, čo je ešte desaťročia ďaleko a čo patrí maximálne tak do nejakého sci-fi filmu. Opak je však pravdou. Dvere do tejto éry sú v súčasnosti dokorán otvorené, a to všetko vďaka pokroku v technológiách automatickej identifikácie a klasifikácie audiovizuálnych dát.

Tie v posledných rokoch vystrelili v úspešnosti do oblakov vďaka použitiu hlbokých neurónových sietí. Prvé úspešné nasadenie takýchto systémov do prevádzky máme dávno zo sebou a v nasledujúcich rokoch môžeme očakávať ich postupné rozširovanie a ďalšie zlepšovanie. Ide o jednu z technológií, ktorá dlho vyzerá veľmi smiešne a nepoužiteľne, až jedného dňa prelomí hranicu presnosti a pomerne rýchlo sa začne extrémne dobre triafať priamo do čierneho, pričom už nebude cesty späť.

Výstup emočného softvéru firmy Affecitiva

Pre automatickú detekciu nálad ľudí existuje množstvo využití s rozličnými stupňami užitočnosti. Nemožno však ignorovať to, že ten najlákavejší, ktorý bude minimálne v dohľadnej budúcnosti hnať vývoj v tejto oblasti ďalej dopredu, je práve marketing. Či už ste momentálne smutní, šťastní alebo nahnevaní, tieto stavy nevyhnutne ovplyvňujú nielen vaše aktuálne správanie, ale aj proces vášho rozhodovania. Znalosť toho, ako sa práve cítite je niečo, čo sa dá dobre využiť pre predaj, rozšírenie povedomia o značke, alebo akékoľvek iné ovplyvnenie vašich myšlienkových pochodov.

„Neurónová sieť dokáže rozlíšiť spontánny úsmev od toho núteného.“
Veľké technologické firmy v súčasnosti investujú do tejto oblasti nemalé peniaze, pretože nepochybne pôjde v budúcnosti o jeden zo základných pilierov marketingu. Z tohto dôvodu je vidieť aktivitu najmä Googlu a Facebooku, ktorí majú na reklame postavený svoj biznis. Ich podiel na svetovej digitálnej reklame je pritom masívny a v súčasnosti cez nich tečie viac ako 100 miliárd dolárov ročne, čo je zhruba polovica toho, čo za internetovú reklamu svet utratí (v prípade Googlu by malo ísť tento rok o zhruba 73 miliárd a Facebooku 34 miliárd dolárov).

O technológie rozpoznávania emócií však majú záujem aj iní IT giganti a pokročilý vývoj v tomto smere vidíme hlavne u Microsoftu, ktorý patrí spoločne s Googlom k svetovej špičke spracovávania obrazových informácií pomocou neurónových sietí. V poslednej dobe badať v tejto súvislosti takisto nemalú aktivitu na strane Apple.

Okrem týchto firiem existuje pravdaže veľké množstvo menších, ale veľmi aktívnych spoločností a startupov, ktoré sa zaoberajú prakticky výhradne týmito technológiami. Pri úspechoch pritom nezriedkavo končia v zuboch už spomenutých štyroch IT gigantov, a to formou akvizície. V minulom roku napríklad Apple kúpil spoločnosť Emotient, zameriavajúcu sa na rozpoznávanie pocitov z výrazov v tvári. Emotient používa patentovanú metódu na zber 100 000 fotografií tvárí denne, pričom ich softvérová technológia v základe rozpoznáva výrazy pre radosť, smútok, prekvapenie, hnev, strach, zhnusenie, záujem či naopak opovrhnutie.

Detekcia prekvapenia a úsmevu aplikáciou IntraFace, ktorú spoločne s materským startupom FacioMetrics pohltil akvizíciou Facebook

Cieľom je vytvorenie systému schopného rozpoznávať tieto prejavy v reálnom čase a v rôznom prostredí a polohách tváre ako takej. Nejde teda len o prípady, keď sa osoba priamo pozerá do kamery (čo je vzhľadom na pozíciu kamier v smartfónoch, notebookoch či TV totožné s pozeraním sa na obrazovku), ale takisto o osoby mimo priameho záberu, ktoré sú snímané napríklad statickou kamerou obchodu. Apple nezverejnil údaj, koľko za Emotient zaplatil, ani na aké účely plánuje jeho technológie využívať.

Záujem o tieto technológie každopádne narastá a v súčasnosti sa predpokladá, že trh systémov na rozpoznávanie emócií narastie do roku 2020 na hodnotu 20 miliárd dolárov a do roku 2022 na takmer 30 miliárd dolárov.

Ako je možné pocity rozpoznať?

Externé rozpoznanie interných pocitov ľudí nie je žiadna mágia, ani čítanie myšlienok. Koniec koncov, sami to robíme neustále. Z výrazu tváre iných osôb obvykle vieme veľmi dobre rozpoznať, či je nejaký človek veselý, smutný alebo nahnevaný, pričom podobne úspešní sme aj pri vnímaní citových prejavov v hlase.

Rozčúlenosť, váhavosť či iné prejavy rozpoznáme dokonca aj vtedy, keď osoba hovorí v jazyku, ktorému nerozumieme. Ideálne je pravdaže oba tieto prejavy kombinovať do spoločného audiovizuálneho vnemu, čím zvyšujeme svoju úspešnosť. Ďalšou možnosťou ako odhadnúť emócie je často písomný prejav, kde je situácia značne zložitejšia. To všetci zrejme poznáme aj z vlastnej skúsenosti, keď zle odhadneme tón a úmysel napríklad z e-mailu či internetovej diskusie a situáciu zbytočne vyhrotíme neadekvátnou reakciou.

Natočenie tváre je možné od zmeny mimiky pomerne ľahko detegovať

Zautomatizovanie týchto úloh, kde namiesto človeka emócie rozpoznáva softvér, je však komplikovaná záležitosť. Najmä, ak chceme aby bol úspešný za rozličných podmienok. V súvislosti s tvárou ide o základný problém počítačového videnia (computer vision), pri ktorom sa rozpoznáva niekoľko typických geometrických prvkov.

Rozlíšiť tvár od ostatých objektov v okolí patrí k tým jednoduchším úlohám, pretože tvár má dobre identifikovateľné znaky, ktoré sa prakticky nemenia (dve oči, pod nimi nos a ústa). Obrovské množstvo súčasných fotoaparátov má základnú detekciu tváre už dlhé roky zabudovanú vo svojom softvéri, pričom často pridávajú aj detekciu úsmevu.

Cielenie na šťastných, smutných či aktuálne emočne nalomených používateľov bude pre firmy nepochybne lákavé.
Tváre sú pravdaže rôzneho tvaru aj veľkosti, pričom nejde len o odlišnosti z hľadiska toho, že niektorí ľudia majú tvár guľatú a iní podlhovastú, ale aj to, že na niektorej sú prítomné okuliare, na inej fúzy. V praxi sú takisto na fotografiách alebo videách tváre rôzne natočené a namiesto priameho pohľadu do objektívu sa otáčajú do strán, alebo dohora či dolu. Detekcia natočenia sa vykonáva podľa toho, ktorá zo strán tváre je väčšia ako druhá, pričom sa berie do úvahy takisto miznutie jedného oka a zmena tvaru nosa, ktorý sa dá považovať za stred tváre. Na základe deformačného modelu sa následne určí, v akej pozícii tvár je, z čoho je možné ďalej odvodzovať, ako sa budú jednotlivé prejavy tvárovej mimiky odlišovať od priameho pohľadu.

K výrazu, z ktorého je naše emócie možné odpozorovať, prispieva predovšetkým pohyb úst, obočia a roztvorenie očí. Počítač tvár rozdelí na niekoľko základných bodov, pričom im pridelí dva základné atribúty. Do jednej skupiny patria tie, ktoré sa pri výrazoch hýbu (ako napríklad kútiky úst pri úsmeve) a do druhej tie, čo sa nehýbu takmer vôbec (nos, vnútorný a vonkajší roh očí).

To je použité ako referencia, vďaka ktorej je možné určiť, kedy sa hýbe celá tvár natočením hlavy a kedy sa menia len výrazy v tvári. Aj keď ľudia sú schopní prejavov veľkého spektra emócií, moderná psychológia definuje len šesť základných výrazov tváre – šťastie, smútok, prekvapenie, strach, zhnusenie a hnev.

Všetky subtílnejšie prejavy sa dajú zaradiť do jednej z týchto hlavných kategórií, alebo ich kombinácie. Systémy na rozpoznávanie si pritom nevšímajú len geometrické zmeny hlavných signalizačných prvkov, ktorými sú pohyby úst, očí a obočia, ale aj zmeny v rámci zjavenia sa špecifických tvarov, ktoré na tvári štandardne nie sú. Ide napríklad o zjavenie výrazných vrások uprostred čela pri zvraštení obočia v súvislosti s hnevom alebo zhnusením.

Microsoft Emotion API

V minulosti sa detekčné systémy výrazov tváre museli manuálne nastavovať štýlom, pri ktorom sa do programu napevno zadalo, ako vyzerajú. Ak sme teda chceli, aby softvér rozpoznal úsmev, museli sme vytvoriť popis, že je to pohyb bodov namapovaných na kútiky úst, ktoré sa posunú smerom do bokov a dohora.

Takéto systémy sú síce vhodné do fotoaparátov na jednoduchú detekciu, ale na podrobné zisťovanie emočného stavu sa nehodia. Všetko sa zmenilo po roku 2010 vďaka obrovskému pokroku vo vývoji pokročilých systémov umelej inteligencie, založených na konvolučných hlbokých neurónových sieťach. V ich prípade sa nezadáva to, ako sa jednotlivé body v prípade úsmevu posúvajú.

Systém sa to učí sám na obrovskom množstve príkladov, ktoré sa mu poskytnú v rámci tréningu. V základe ide o veľké množstvo fotografií, ktoré sú slovne popísané ľuďmi. Program teda podľa popisu vie, že na týchto tisíckach fotografií sa niekto usmieva, na ďalšej tisícke sa zas celkom iní ľudia mračia a podobne. Konvolučná neurónová sieť pri tréningu hľadá vlastné postupy a konfigurácie, na základe ktorých fotografiu dobre odhaduje sama. Mení pritom svoje vlastnosti až dovtedy, kým sa do popisov nezačne triafať. Následne je takto vytvorená sieť konfrontovaná s fotkami, ktoré nikdy nevidela a ktorých popisy nepozná, pričom sledujeme ako je úspešná.

Pokročilé neurónové siete, trénované na kvalitných dátach, v súčasnosti dosahujú výsledky veľmi podobné človeku. V roku 2015 sprístupnil Microsoft na webe svoje Emotion API, určené pre vývojárov softvéru, ktorí ho môžu začleniť do svojho produktu napojením na cloud Microsoft Azure. Súčasťou stránky je aj jednoduchý dialóg, pomocou ktorého môžete odoslať akúkoľvek fotografiu z internetu či svojho počítača do systému, ktorý vám behom okamihu ukáže výsledok. Dostanete tak dobrý prehľad toho, na akej úrovni systém je. Výsledky sú extrémne dobré, pričom zďaleka nejde len o rozoznávanie prehnaných emočných póz z ilustračných snímok z fotobánk, ale aj o regulárne fotografie z bežného života. Pri spustení sa objavilo mnoho žurnalistických hodnotení, ktoré poukazovali na to, že systém rozhodne nie je bez chyby, pričom poukázali na príklady, v rámci ktorých sa systém očividne splietol.

Chyba detekcie nemusí byť vždy relevantná

Problémom bolo, že ľudia si neuvedomili, že dané chyby obvykle neboli spôsobené zlým rozpoznaním z výrazu tváre. Typickým príkladom je fotografia kanadského hokejistu krátko po strelení gólu na olympiáde vo Vancouveri, ktorý zabezpečil Kanade zisk zlatej medaily. Podľa systému Microsoftu je hokejista Sidney Crosby predovšetkým nahnevaný (zhoda 90 %) a trochu vystrašený (0,5 %). Všetci však vieme, že to nie je pravda a je naopak šťastný, pričom radostne gól oslavuje. V takýchto situáciách si však musíme uvedomiť, že zapracovávame do nášho odhadu kontext.

Ak fotku ukážete ľudom, ktorí netušia z akého momentu pochádza, celkom určite sa nemalé množstvo odpovedí prikloní aj k tomu, že nejde o oslavu gólu, ale o momentku z hokejovej pästiarskej bitky, pri ktorej sa zhadzujú rukavice. Skúste si následne predstaviť, že fotografiu orežete len na modrý štvorček, v ktorom je tvár a začnete ukazovať rôznym ľudom iba tú.

Tu už je nesporné, že táto momentka vyzerá značne nahnevano a nie je vôbec bláznivé odhadovať, že práve túto odpoveď najčastejšie dostanete. To je však nevyhnutný dôsledok toho, že fotografia je len jeden okamih v čase, ktorý jednoducho môže zavádzať. Tento fakt je nezriedkavo zneužívaný v prípade fotografií z rôznych udalostí, ako sú napríklad stretnutia politikov, potýčky pri demonštráciách a podobne. Stačí vytvoriť obrovské množstvo fotografií a následne už nie je problém vybrať takú, ktorá mylne vyvolá dojem, že sa strany ignorovali, že jedna vyzerá povýšene, druhá naopak zmätene a podobne. Ide o slabinu odhadnutia emočnej situácie zo zamrznutej momentky, ktorou trpia nielen automatické systémy, ale aj ľudia.

Odpoveďou je pravdaže kontinuálny záber. Hokejista môže síce na momentke pôsobiť nahnevano, ale ak by sme videli celý záznam udalosti, o jeho radosti by nebolo absolútne žiadnych pochýb. Moderné systémy na detekciu emócií v reálnom čase sú práve tento prípad. Môžu totiž reagovať na to, ako sa tvár mení kontinuálne pri zábere z kamery. Nemusí ísť len o prípad, keď sa do kamery smartfónu pozeráte, ale aj situácie, keď vás zachytí mestská kamera bez toho, aby ste si to všimli, (prípadne ide napríklad o prejav herca vo filme).

Priamy výstup Microsoft Emotion API v rámci bežných používateľských fotografií

Úspešnosť systémov v takýchto prípadoch mnohých ľudí zaskočí, najmä ak sa dozvedia, že neurónová sieť dokáže rozlíšiť napríklad spontánny úsmev od toho núteného, ktorý je len pózou. Falošný úsmev je totiž obvykle hladký, rýchly a krátky. Ten skutočný má množstvo intenzít, pomalší nástup, dlhšiu trvácnosť a vo všeobecnosti ovplyvňuje náš výraz na dlhšiu dobu.

Dobrým rozpoznávacím znamením je okrem iného aj sval, ktorý máme okolo očných jamiek, pretože pri jeho aktivácii reálnym úsmevom a veselou náladou dochádza k zdvihnutiu líc a vytváraniu špecifických vrások pri vonkajších kútikoch oka. Tento sval sa obvykle neaktivuje v prípadoch, že ľudia sa smejú zo slušnosti alebo z donútenia. Pravdaže, platí to len pri štandardných situáciách. Správnym tréningom, čo môže byť napríklad prípad hereckých lekcií či iného špecializovaného výcviku, sa tieto prejavy môžeme naučiť vyvolávať cielene.

Reklama vyčkávajúca na slabé miesto

Asi nebudete prekvapení, že ste ochotnejší nakupovať v momente, keď máte dobrú náladu, ako keď ste enormne nahnevaní a prskáte nadávky na celý svet. Nie vždy to pravdaže platí, pretože niektoré negatívne emočné stavy, ako napríklad smútok, môžu šancu na nákup konkrétnych predmetov otvárať výrazne viac.

Rozpoznávanie vášho citového rozpoloženia v reálnom čase preto otvára nové možnosti veľmi precízne cielenej reklamy. Niektoré použitia môžu pôsobiť na pohľad šľachetne, pričom ide napríklad o reklamu, ktorá by vám po detegovaní zlej nálady ponúkla kúpenie lístku na vystúpenie stand-up komika, ktorý dnes večer vystupuje vo vašom meste. Iné naopak môžu pôsobiť zákerne. Stačí si predstaviť situáciu, pri ktorej by si reklamný systém všimol, že nejaká žena drží diétu a vynecháva všetky sladkosti, ale je viac náchylná k ich nákup v momente, keď je smutná. Začne jej preto reklamu na čokoládu ukazovať v čase, keď plače a kráča vedľa relevantného obchodu.

Pri úplnom integrovaní týchto procesov je v základe možné reklamu, webovú stránku či celkový postup konkrétneho predaja meniť v reálnom čase, podľa toho, v akom stave momentálne ste, alebo ako ste reagovali pred pár sekundami na niektorý zo svojich vnemov. Pre akúkoľvek firmu vedúcu marketingovú kampaň ide akoby o stelesnenie sna. Marketingovú stratégiu je totiž možné meniť dynamicky a v reálnom čase podľa aktuálnej nálady každého návštevníka zvlášť, v snahe dosiahnuť čo najväčší efekt.

To, že emócie hrajú významnú rolu v našom rozhodovacom procese nie je žiadny odhad, ale výsledok mnohých vedeckých štúdií. Za tými najvýznamnejšími stojí portugalsko-americký neurovedec Antonio Damasio, pričom okrem iného vychádza aj z praktických testov ľudí s poškodenými časťami mozgu, ktoré sa starajú o emócie. Takíto ľudia, ktorí emócie prakticky necítia, vykazujú extrémne ťažkosti aj pri tých najjednoduchších rozhodovacích procesoch. Tieto fakty vplývajú aj na to, že emocionálne sa rozhodujeme aj v prípadoch, keď sa nám zdá, že sa rozhodujeme racionálne. Rozhodnutie je totiž obvykle v prvom rade založené na emocionálnych faktoroch a až následne je dodatočne odôvodnené racionálnymi časťami nášho mozgu.

Z tohto dôvodu je reklama vyvolávajúca emócie úspešnejšia, ako tá, ktorá sa zakladá na čisto racionálnych princípoch. Marketingový experti Hamish Pringle a Peter Field vo svojej knihe Brand Immortality (Nesmrteľnosť značky) analyzovali 1400 úspešných reklamných kampaní, pričom zistili, že emocionálny obsah má na zákazníkov až v dvakrát väčší efekt, ako racionálny. Firmám priniesli emocionálne reklamné kampane razantný nárast zisku v 31 % prípadov, oproti 16 % pri racionálnych kampaniach. Čisto emocionálne kampane sú dokonca obvykle úspešnejšie, ako kombinované emocionálno-racionálne kampane (veľký finančný úspech dosiahli v 26 % prípadov).

Ak emočné reklamy majú omnoho väčší efekt ako tie racionálne, pričom ich budeme smerovať presne do nálady a emočného stavu, pre aké sú vytvárané, ich úspešnosť výrazne narastie do veľkých výšin. Je preto jasné, že si od nich firmy veľa sľubujú. Nástup tejto éry si netreba predstavovať tak, že systémy budú zrazu z ničoho nič hneď všadeprítomné a budú podľa emócií upravovať všetko.

Cloud Vision API Googlu

Podľa spoločnosti Affectiva (demo môžete vyskúšať na jej webovej stránke) slúžia súčasné systémy hlavne na zistenie toho, ako používatelia reagujú na jednotlivé reklamné akcie a ako emócie ovplyvňujú ich rozhodnutia. Nachádzame sa v ére experimentov a prvých testov toho, ako je najvýhodnejšie tieto technológie používať. V poslednej dobe experimenty (na dobrovoľných kontrolných skupinách) v tejto súvislosti vykonávali firmy ako Mars, Coca Cola, Honda, P&G či Unilever. S firmou Affectiva nadviazal spoluprácu napríklad aj v USA extrémne populárny výrobca cereálií Kellogg, pričom s pomocou jej nástrojov monitoroval dobrovoľníkov, ktorým púšťal niekoľko variácií reklamy na svoj nový produkt.

Aj keď podľa bežných postupov sa zdalo, že najvhodnejším maskotom nových cereálií bol kreslený had, pretože vyvolal v divákoch najviac smiechu, emočná analýza ukázala, že efekt bol veľký len pri prvom pozretí. Ľudia najpozitívnejšie (i keď značne subtílnejšie) reagovali na maskota v podobe mimozemšťana, ktorý bol populárny pri opakovaných videniach. Firma sa tak rozhodla pre toho. Logickou nadstavbou takéhoto postupu je, že v budúcnosti sa v rámci internetovej reklamy, zobrazovanej napríklad na banneri alebo v podobe videa pred YouTube skečom, použije práve ten variant, na ktorý najlepšie reagovali ľudia v emočnom stave, v ktorom sa momentálne nachádzate vy.

Zber dát môže mať pravdaže rôzne podoby a používateľom tento účel nemusí byť vždy zrejmý. Typickým príkladom je nedávne zabudovanie jednoduchej emočnej odpovede pomocou smajlíka v rámci Facebooku. Používatelia namiesto jednoduchého „lajku“ môžu použiť reakciu ako Super, Haha, Žasnem, Je mi to ľúto a Štve ma to (v origináli Love, Haha, Wow, Sad a Angry). Ide o primitívny a napriek tomu účinný zber kontrolných dát, ktoré sa dajú použiť na kalibráciu neskorších automatických systémov.

Detekcia úsmevu identifikačným mechanizmom firmy Sightcorp

Facebook má obrovskú výhodu v tom, že osobné dáta pre cielenú reklamu obvykle nemusí získavať, pretože jeho používatelia mu ich poskytnú sami zadaním do svojich profilov (napríklad pohlavie, vek, záujmy). Tieto dáta následne Facebook môže porovnávať s ostatnými aktivitami daných používateľov na webe a ich reakciami na konkrétny obsah, čím je možné vytvárať veľmi presné zaraďovanie do marketingových skupín.

V rámci jednotlivca nemajú emočné smajlíky prakticky žiadny zmysel, ale pri stovkách miliónoch používateľov, ktorí ich nepochybne každodenne využívajú, je z nich možné v rámci Big Data extrahovať veľmi zaujímavé informácie. Ide napríklad o to, ako sa mení správanie ľudí v prípade, že ľudia na príspevok reagujú negatívne, ďalej či takýto prejav zvýši stupeň komentovania a zmení jeho charakter a či jedna negatívnosť ovplyvňuje pravdepodobnosť vzniku ďalších. To všetko môže slúžiť ako vstupná brána k pokročilým systémom, ktoré budú emócie detegovať automaticky.

Facebook experimentuje s detekčnými systémami aj neverejne

Facebook v priebehu minulého roku kúpil spoločnosť FacioMetrics, čo bol startup, založený expertmi z univerzity Carnegie Mellon. Ich hlavným produktom bola aplikácia IntraFace, ktorá sa zameriavala na rozpoznávanie emócií používateľa pozerajúceho sa do kamery. Po odkúpení aplikácia zmizla z obchodov iOS aj Androidu a nie je jasné, či má Facebook záujem využívať túto konkrétnu technológiu a zlepšiť ju, alebo nakupoval hlavne talenty pre vývoj vlastného systému, na ktorom pracuje. V tejto súvislosti je zaujímavá trojica patentov, ktoré boli Facebooku udelené v máji tohto roku (na patentový úrad boli však prihlásené už v roku 2015).

Prvý sa zaoberá automatickým snímaním tváre používateľa prednou kamerou smartfónu, detekciou emócií a pridaním tejto informácie do správ. V základe ide o nahradenie informácie, ktorú dnes plnia smajlíky, pretože pri písaní príspevku alebo zdieľaní nejakej informácie by sa do nej automaticky pridal pocitový stav používateľa, podobne ako sa dnes do fotky pridajú GPS súradnice. Ďalšie dva patenty sa naopak zaoberajú pasívnym sledovaním prednou kamerou, ktorého si používateľ nie je vedomý (aby výsledok neovplyvnil), pričom sa sledujú zmeny výrazov v tvári podľa toho, aký obsah Facebook zobrazuje.

Manuálne vyjadrenie emócií „lajkom“ nepribudlo vo Facebooku náhodne

Je celkom isté, že nasadenie takýchto systémov v blízkej budúcnosti sa mnohým ľudom nebude páčiť. Bude zaujímavé sledovať, ako firma k ich implementácii prejde. Je pritom vhodné podotknúť, že Facebook ako taký už niekoľkokrát ukázal, že sa mu černejšia etika neprieči a zastáva názor, že používatelia dávajú k čomukoľvek súhlas potvrdením podmienok služby. Asi najväčší prípad tohto typu vyplával na povrch pred troma rokmi, pričom sa týkal ovplyvňovania 700 000 používateľov cielenou zmenou ich steny príspevkov. Šlo o experiment, pri ktorom firma sledovala, ako je možné ovplyvniť správanie a emócie ľudí formou uprednostňovania pozitívne alebo naopak negatívne ladeného obsahu. Facebook to nepovažoval za nič neetické a výsledky experimentu publikoval v rámci jednej zo svojich výskumných prác.

Najnovšie vyvolal Facebook podobnú nevôľu v máji tohto roku, avšak tentoraz nie vo vlastnej réžii. V Austrálii totiž unikla na verejnosť privátna prezentácia schopností Facebooku, určená pre jednu z najväčších austrálskych bánk. Podľa reportu, pod ktorým bola podpísaná dvojica vedúcich predstaviteľov austrálskej pobočky Facebooku, je firma v súčasnosti schopná identifikovať tínedžerov, ktorí sa momentálne cítia „neisto“, „bezcenne“ a „potrebujú zvýšiť sebadôveru“. Je nesporné, že mnohé typy produktov na takéto momenty priamo vyčkávajú a majú najväčšiu šancu predaja.

Šlo o výsledok štúdie, v ktorej sa prezentovali úspešné možnosti cielenia na mladých ľudí z Austrálie a Nového Zélandu. Na základe analýzy ich príspevkov a aktuálnych fotografií detekčné systémy Facebooku dokázali určiť, ktorí ľudia sa cítia stresovane, nervózne, hlúpo, bezcenne a neúspešne. Zber dát sa pritom zameral na mladých ľudí navštevujúcich stredné školy (dáta pochádzali od 1,9 milióna používateľov), vysoké školy (1,5 milióna) a od ľudí nedávno zaradených do pracovného procesu (3 milióny analyzovaných používateľov).

Reakcia Facebooku na neželané zverejnenie bola pomerne zvláštna, pretože firma poskytla prakticky dve protichodné vyjadrenia. V tom prvom sa Facebook ospravedlnil a oznámil, že otvoril v tejto súvislosti vyšetrovanie, ktorého cieľom je v rámci austrálskej pobočky nájsť pochybenia a potrestať vinníkov. O niekoľko dní však firma na svojej stránke vydala oznámenie, ktoré už žiadne ospravedlnenie ani potrestanie vinníkov nespomínalo a namiesto toho pozostávalo z toho, že články austrálskych a svetových médií, ktoré experimenty popisovali, sú zavádzajúce a firma žiadne cielenie reklamy na emočný stav tínedžerov neposkytuje.

Emočná analýza firmy Kairos

Facebook sa ďalej k experimentu vyjadril s tým, že jeho cieľom bolo len „pomôcť reklamným spoločnostiam pochopiť, ako sa ľudia prejavujú“. V tejto súvislosti je dobre spomenúť, že austrálske denníky priniesli aj reporty o tom, že v dokumentoch nešlo o jediné zvláštne ponúkané cielenia, ktoré ešte nie sú dostupné každej firme a zo získanej (ale kompletne nezverejnenej) prezentácie vyplýva, že firma poskytuje niektorým záujemcom aj možnosť cielenia na „sebavedomých ľudí, spokojných s vlastným telom“ a takisto na ľudí, ktorí „aktuálne cvičia v snahe schudnúť“.

Pokiaľ firmy ako Facebook nenarazia na nejaký nečakaný odpor, systémy na detekciu emočného stavu sa celkom určite plynulo zavedú a zakorenia do celkom základných vlastností služby. Podobne  ako sú v súčasnosti cielené reklamy založené napríklad na základe histórie prehliadania, vyhľadávania a „lajkovania“, v blízkej budúcnosti sa medzi ne pridá významný faktor aktuálnej nálady a jej zmien v priebehu času. Firmy zadávajúce reklamné kampane budú nepochybne z týchto možností nadšené, pretože cielenie na šťastných, smutných či aktuálne emočne nalomených používateľov bude lákavé.

Pravdaže, Facebook v základe tieto používateľské osobné detaily svojim zákazníkom (zadávateľom reklamy) neprezrádza. Ide totiž o produkt, ktorý má a za ktorý chce inkasovať peniaze neustále. Namiesto odoslania toho, že ten a onen človek je šťastný a treba naň teraz cieliť reklamu, prebieha proces tak, že nejaká spoločnosť si zadá na Facebooku reklamnú kampaň a zacieli ju napríklad na vekovú skupinu ľudí vo veku 20 až 30 rokov, ktorí sa práve teraz usmievajú alebo sú inak šťastní. Facebook sa už postará o zvyšok, posielajúc reklamu práve k ľudom, ktorí zadaniu odpovedajú. Tak to prebieha v súčasnosti s cielením na základné parametre ako vek, záujmy, vzdelanie či manželský stav a nie je dôvod myslieť si, že to v emočnej ére bude inak.

Na ceste k lepším asistentom a vnímavejšej elektronike

Aj keď marketing bude aspoň v najbližšej dobe vlajkovou loďou vývoja emočných technológií, tak ich použiteľnosť siaha do omnoho väčšieho spektra úloh. Medzi tie dnes najviac spomínané patrí hlavne automatická reakcia inteligentných domácností alebo inej časti IoT, pri ktorej systém domu či auta môže používateľovi napríklad pustiť hudbu podľa toho, akú má náladu.

Reálna užitočnosť týchto vecí je otázna. Tápanie vývojárov a skúšanie doposiaľ neprebádaných kútov dobre demonštruje napríklad automobilka Bentley, ktorá v aplikačnom obchode Apple pre mobilné systémy iOS uverejnila aplikáciu Bentley Inspirator. Tá po spustení začne poloautomatickú konfiguráciu auta Bentayga SUV, pričom zaznamenáva používateľské reakcie z hľadiska výrazov v tvári a podľa jeho náladovej odozvy (používateľ vyzerá spokojný, nespokojný, nahnevaný a podobne) konfiguráciu mení alebo naopak ponecháva.

Detekčnými aplikáciami je možné sledovať nielen jednotlivca, ale aj kompletnú odozvu publika

Spoločnosť Eyeris, ktorá vyvíja pre detekciu emócií systém EmoVu napríklad oznámila, že jej systém už používa pri výsluchoch niekoľko amerických „trojpísmenných agentúr“. Z toho sa dá odvodzovať hlavne FBI a CIA, ktoré takéto technológie môžu používať na detekcie drobných zmien mimiky v tvári človeka pri výsluchu a jeho reakcie na konkrétne otázky.

Výkonný riaditeľ Eyerisu pritom vidí jasnú budúcnosť v tom, že technológie jeho spoločnosti sa dostanú do kamier mobilných zariadení a televízorov a budú môcť slúžiť napríklad na hodnotenie reakcií na filmy, seriály či ich konkrétne scény, čo napomôže pri odporúčaní vhodného obsahu pre ďalšie pozeranie, alebo pre vytváranie štatistík pozitívnej odozvy pre filmových tvorcov. Podľa firmy nejde o zásah do súkromia, pretože funkcie by boli aktivované len so súhlasom používateľa. Na druhú stranu ale treba povedať, že takýto súhlas môže byť ukrytý aj do „podmienok používania služby/produktu“ a bez odsúhlasenia sa skrátka používateľ nepohne ďalej.

Rozpoznávanie emócií sa môže takisto začať výraznejšie používať v súvislosti s hlasovými asistentmi, ako je Amazon Echo, Google Home či Microsoft Cortana. V tomto prípade sa nálady rozpoznávajú z hlasu, pričom hlavným lákadlom pre ich zavedenie je lepšie pochopenie zadaných výrazov a predovšetkým detekcia narastajúcej frustrácie používateľa v prípade nevhodnej reakcie zariadenia.

Detekcia smútku identifikačným mechanizmom firmy Sightcorp

Vyspelé rozpoznávanie emočného stavu z hlasu a výrazov je takisto nevyhnutné pre éru pokročilej robotiky a robotických asistentov, ktorí musia rozpoznať význam viet v pravom kontexte. Asistenčný robot, ktorý by nedokázal rozlíšiť, že človek je veľmi rozrušený, rozhorčený či inak veľmi naklonený od regulárneho stavu, by mohol situáciu nechtiac ešte viac zhoršovať.

Či už behom budúcich dekád alebo storočí, jedného dňa budeme chcieť pokročilých robotických asistentov používať pri starostlivosti o chorých či nemohúcich, vyžadujúcich neprestajnú opateru a robot bez pokročilých afektových systémov (schopných city nielen vnímať, ale aj umelo prejavovať), by bol zrejme nepoužiteľný.

Emočné systémy môžu v budúcnosti nájsť uplatnenie aj v rámci boja s niektorými zdravotnými komplikáciami. Na pozadí telefónu bežiaca aplikácia môže hľadať špecifické správanie, signalizujúce vážne depresie, alebo skoré príznaky napríklad Alzheimerovej choroby a podobne. Často pri tom ide len o také jednoduché veci, ako meranie frekvencie a intenzity úsmevu používateľa. Podobne je možné hľadať aj príznaky mozgovej príhody (mŕtvice), pri ktorej je úsmev často nesymetrický. V relevantných prípadoch by tak zariadenie mohlo zalarmovať používateľa, ktorý si svojho stavu vôbec nie je vedomý a ponúknuť zavolanie pomoci.

Emočnú analýzu sa snažia zapojiť do procesu aj automobilky

Použitie týchto systémov je vskutku široké a čriepky pozvoľného nástupu vidíme už dnes. Bude zaujímavé sledovať, ako sa akceptovanie alebo neakceptovanie týchto technológií bude na verejnosti prejavovať. Z hľadiska vývoja každopádne už nie je cesty späť. V nasledujúcich dekádach už možno automatické hodnotenie našej nálady bude robiť skoro každá vyspelá elektronika a budeme to akceptovať bezmyšlienkovito tak ako fakt, že to dnes biologicky robia všetci cudzí ľudia, s ktorými sme denne v kontakte.

Značky:

František Urban

František Urban
Zameriavam sa najmä na prehľadové a analytické články z oblasti najrôznejších technológií a ich vývoja. Nájdete ma takisto pri diagnostike HW a SW problémov.