Prekladač Google sa vďaka neurónovej sieti blíži presnosti ľudského prekladu

Prekladač Google funguje už 10 rokov. Čo začalo jednoduchým systémom prekladania fráz sa teraz vyvinulo do efektívnej neurónovej siete.

Google pred desiatimi rokmi využíval vo svojom prekladači techniku PBMT (Phrase Based Machine Translation), ktorá bola vo svojej dobe jednou z najpokročilejších. Technika sa spoliehala na rozdrobenie vety na kratšie frázy, ktoré sa potom strojovo prekladali, prakticky nezávisle na sebe.

Pred pár rokmi sa posunuli na technológiu RNN (Recurrent Neural Networks), ktorá sa učila mapovať logiku medzi vstupom a výstupom. Prekladala sa rovno celá veta, nie len jednotlivé frázy. Pri menších prekladoch bola táto metóda efektívnejšia, preklad bol presnejší, ale zároveň bola omnoho náročnejšia na výpočtový výkon.

Teraz Google vyvinul technológiu GNMT (Google Neural Machine Translation), o ktorej si môžete podrobne prečítať v tomto akademickom článku. Nová technika prekladu berie do úvahy celú vetu, pričom postupuje vo vete slovo po slove a každé slovo kóduje ako vektor, ktorý sa mení podľa významu všetkých predchádzajúcich slov. Každé slovo má inú „váhu“, podľa ktorej systém usudzuje, ktoré slová sú relevantné a čo treba vlastne dekódovať.

Nová technológia prekladu je rýchlejšia a efektívnejšia, ako predošlé metódy. Okrem toho dokáže pracovať s obrovským množstvom dát a dosahuje presnosť približujúcu sa ľudskému prekladu. Testovanie, pri ktorom kvalitu prekladu posudzovali bilingválni prekladatelia, ukázalo, že s použitím novej technológie sa počet chýb v preklade znížil o 55 % – 85 % v závislosti od jazykového páru.

Google toto dokázal s pomocou svojej open source neurónovej siete Tensorflow, ktorá využíva špecifické čipy TPU ( Tensor Processing Unit). Kým dnes sa v odvetví strojového učenia používajú najmä GPU čipy, Google už rok používa svoje vlastné TPU čipy a tvrdí, že sú až 10 krát efektívnejšie.

Zdroj: www.tomshardware.co.uk