Projekt „Own My Voice“ umožňuje používateľom vlastniť jedinečné a prirodzené hlasy
Spoločnosť Xiaomi, ktorá sa zaoberá spotrebnou a inteligentnou elektronikou, a ktorej jadrom sú smartfóny a inteligentný hardvér s prepojením na oblasť IoT (internet vecí), predstavila svoju najnovšiu aplikáciu zdokonalených algoritmov a vlastnej rečovej technológie. Technológia spontánneho prevodu textu na hlas „Text-To-Speech“, ktorú vyvinula spoločnosť Xiaomi AI Lab, sa používa na generovanie jedinečného a personalizovaného hlasu pre používateľa s poruchami reči.
Takýto používateľ teraz môže komunikovať s ostatnými pomocou „svojho vlastného hlasu“ namiesto typického monotónneho elektronického hlasu. Tento úspešný test, ktorý je súčasťou predvýskumného projektu „Own My Voice“ pod vedením technického výboru spoločnosti Xiaomi, demonštruje odhodlanie spoločnosti Xiaomi, že s filozofiou „Tech for Good“ chce dosiahnuť svoje ciele: umožniť každému na svete užívať si lepší život prostredníctvom inovatívnych technológií.
Prečo Xiaomi spustilo tento projekt?
Spoločnosti Xiaomi záleží na ľuďoch a snaží sa napĺňať ich rozmanité potreby prostredníctvom technologických inovácií. Počúvala túžbu mnohých ľudí s poruchami reči vlastniť svoj jedinečný hlas na každodennú komunikáciu a vytvorila tím pre projekt „Own My Voice“. Zhu Xi, gestor technologického výboru Tech for Good, Xiaomi Corporation, povedal: „Sme nadšení, že nám technologické inovácie umožňujú preskúmanie viacerých hodnôt, napríklad aj reagovať na požiadavky používateľov na vytvorenie si vlastnej identity.“
Ako spoločnosť Xiaomi realizovala tento projekt?
S cieľom vytvoriť čo najvhodnejší a najviac personalizovaný hlas pre príjemcu, získal projektový tím, v rámci spoločnosti Xiaomi, viac ako 200 dobrovoľníkov, ktorí darovali svoje hlasy. Na porovnanie vlastností hlasov darovaných dobrovoľníkmi s vlastnosťami hlasu príjemcu použili algoritmus porovnávania hlasových odtlačkov. Touto metódou našli najvhodnejší hlas ako východiskový zvuk hlasovej referencie pre príjemcu. S ohľadom na personalizáciu a ochranu súkromia bol vybraný skutočný hlas manipulovaný komplexnou akustickou úpravou, aby vytvoril nový a originálny zvuk hlasu.
Potom použili technológiu spontánneho prevodu textu na hlas „Text-To-Speech“ na trénovanie modelu umelej inteligencie, vďaka čomu tento nový hlas postupne získal prirodzený rytmus a intonáciu, ktoré dokážu pravdivo vyjadriť emócie a tón človeka.
Projekt „Own My Voice“ kombinuje rôzne najpokročilejšie algoritmy s vlastnou rečovou technológiou spoločnosti Xiaomi, aby sa zabezpečila špecifickosť, bezpečnosť a vysoká prirodzenosť syntetizovaného hlasu, čím sa vytvorila nová myšlienka o syntéze reči na mieru pre používateľov s poruchami reči.
Aký je prínos tohto projektu?
Základom tohto projektu je skupina odborníkov na rečové technológie z laboratória Xiaomi AI Lab. Od roku 2017 publikovali 37 príspevkov o reči v zborníkoch zo špičkových medzinárodných konferencií, ako je napríklad Medzinárodná konferencia o akustike, reči a spracovaní signálov (ICASSP). Úspech projektu „Own My Voice“ závisí najmä od nimi vyvinutej technológie spontánneho prevodu textu na hlas „Text-To-Speech“.
Táto technológia v podstate umožňuje, aby sa syntetizovaný hlas svojou intonáciou, pauzami, rýchlosťou a ďalšími vlastnosťami podobal skutočnému ľudskému hlasu. Monotónny a neprirodzený pocit z elektronického hlasu sa tak nahrádza prirodzenejším. V súčasnosti sa táto technológia uplatňuje v mnohých inteligentných zariadeniach Xiaomi s hlasovým AI asistentom. Projekt „Own My Voice“ je ukážkou toho, že technológia Text-To-Speech sa môže vo veľkej miere uplatniť aj v oblastiach prístupnosti a zlepšiť používateľský zážitok.
Zhu Xi dodal: „Ak si všimneme potreby minoritných skupín a budeme ich riešiť v počiatočnej fáze, proces šírenia technológií by sa mohol výrazne skrátiť. To umožní, aby sa výhody nových technológií stali prístupnými pre používateľov so špeciálnymi potrebami bez oneskorenia.“
V ďalších krokoch bude spoločnosť Xiaomi naďalej získavať spätnú väzbu od príjemcov hlasu a skúmať realizovateľnosť tohto projektu v širšom rozsahu. Spoločnosť Xiaomi bude pokračovať vo vývoji technológii, ktorá pomáha ľudom so špeciálnymi potrebami.