Ľudia dokážu pomerne spoľahlivo rozpoznať v rušnom dave aj jeden hlas.

Problém nastáva v prípade, pokiaľ je potrebné, aby vás dokázal rozpoznať inteligentný reproduktor, alebo iné inteligentné zariadenie kvôli príjmu povelov.  Pokiaľ je napríklad na večierku väčší ruch, bežne vás nedokáže inteligentný reproduktor spoľahlivo odfiltrovať pre príjem príkazov.

Google však ponúka prekvapivo jednoduché riešenie. Jeho výskumníci vyvinuli učiaci sa AI systém, ktorý dokáže vyberať konkrétne hlasy pri snímaní tváre ľudí počas toho, ako rozprávajú. Predstavený model neurónovej siete s cieľom rozpoznať jednotlivé osoby sa naučil izolovať hlasy aj v prípade, že sú vyberané z rušného prostredia.

Vo videu je vidieť, že umelej inteligencii sa úspešne darí filtrovať hlasy aj v prípade, že si ľudia skáču do reči. Umelá inteligencia v tomto prípade dokáže vytvoriť veľmi čistú stopu pre obidva hlasy. Deje sa to aj v prípade, že si osoba čiastočne zakrýva tvár.

Spoločnosť Google v súčasnosti hľadá uplatnenie tejto funkcie vo svojich produktoch. Medzi najhorúcejších kandidátov patria hlasové služby. Takáto možnosť izolácie by bola určite praktická aj v prípade nahrávanie videa, kedy by vznikol čistejší a konkrétnejší záznam.

Používanie tejto funkcie môže vo viacerých prípadoch naraziť na problém ochrany osobných údajov. Pre spoľahlivé používanie tejto funkcie je potrebné neustále monitorovanie tváre človeka, ktorého hlas chcete z davu izolovať. Nie každému sa to ale môže páčiť.

zdroj: engadget

Prečítajte si aj:

Recenzia Huawei P20 Pro: Nová éra mobilnej fotografie je tu

Značky: