Zhrnutie
- Slovenčina je jedným z ďalších jazykov, ktoré budú využívať technológiu prekladu založeného na neurónových sieťach.
- Väčšina prekladov bude presnejšia a priblíži sa prirodzenej hovorovej reči.
- Zlepšenie bude viditeľné najmä pri použití na preklad dlhších viet, pretože ich teraz prekladáme ako celok, a nielen ako jednotlivé frázy ako tomu bolo doteraz. Vďaka tomu dlhšie odstavce budú preložené Prekladačom s lepším pochopením textu.
Cieľom Googlu je sprístupňovať informácie čo najviac ľuďom na svete. Až polovica všetkého obsahu na internete je v anglickom jazyku, ale iba 20 % svetovej populácie angličtinu ovláda na nejakej úrovni. Strojové učenie mení od základov skoro všetky služby a projekty, na ktorých Google pracuje a práve Prekladač je skvelou ukážkou, aký pokrok sa dá vďaka nemu dosiahnuť.
O čo ide:
- Táto novinka znamená doteraz najvýraznejšie zlepšenie a zodpovedá pokroku, ktorým strojové preklady prešli za posledných 10 rokov.
- Neurónový preklad je 3. generáciou strojového prekladu (po RBMT / rule-based a SMT/PBMT / statistical/phrase-based). Prekladač Google bol prvých 10 rokov založený na frázovom prekladaní (PBMT).
- Novým zistením je, že neurónová technológia spracováva jazyky lepšie, keď sa ich učí niekoľko naraz. Dá sa to prirovnať k tomu, že aj človek sa jednoduchšie naučí cudzí jazyk, ak už pozná niektorý z príbuzných jazykov. V prípade Prekladača – napríklad máme omnoho viac dát pre hindčinu než pre jej príbuzné jazyky maratčinu a bengálčinu. Keď sa ich systém učí všetky naraz, všetky tri jazyky sa zlepšia viac ako keby sa ich učil individuálne.
- Za rozvojom vedy okolo „neurónového strojového prekladu“ (Neural Machine Learning) stojí mnoho softvérových vývojárov. Googlu sa podarilo vyvinúť vlastné špecializované čipy pre preklad a vizuálne rozpoznávanie, tzv. TPUs (Google Tensor Processing Units) a spolu s inovatívnymi nápadmi svojich inžinierov dokázal priniesť túto novú technológiu masám.
- Neurónové preklady sú odteraz dostupné pre vybrané jazyky na väčšine platforiem Prekladača Google: v aplikáciách, na webovej stránke a tiež vo Vyhľadávači Google.
Čo je nové na tomto systéme prekladu?
- Obidva, neurónový aj štatistický systém strojového prekladu, vychádzajú z obrovského množstva dát z oficiálnych prekladov rovnakých dokumentov do viacerých jazykov. Na ich základe určujú, aký vzťah je medzi jazykmi. Rozdiel je v tom, ako každý z týchto systémov využíva vložené dáta. Neurónový systém sa neučí jazyky samostatne, ale sám sa učí ako prekladať zadané texty tak, aby čo najviac zodpovedali textom, ktoré mu boli poskytnuté ako základ pre učenie. Kým štatistický systém porovnáva vložené dáta podľa vopred zadaných gramatických vzorcov.
Prekladač Google – globálne štatistiky:
- viac ako jedna miliarda uskutočnených prekladov za deň
- každý deň sa preloží 140 miliárd slov
- viac ako 500 miliónov používateľov mesačne
- dostupný pre 103 jazykov, čo predstavuje až 99 % používateľov internetu
- len 8 % dopytov na preklad pochádza z USA
Značky: google