Pôsobí na vás e-shop na adrese www.303080.com dôveryhodne, alebo objednávka z takejto lokality smrdí nejakým podvodom? Nedeľník TOUCHIT vážne i nevážne. Nezviazané IT témy na tisíc spôsobov.

Skúste si úprimne odpovedať. Akoby ste zareagovali, keby vám nejaký človek nadiktoval svoj e-mail vo formáte 983541@163.com? Nuž, asi by sa na vašej tvári objavila nejaká kyslá grimasa, pretože by ste si pomysleli, že vám dáva nejakú dočasnú adresu určenú na spam.

Ak by ste spúšťali nejakú webovú službu a húfne by sa vám na nej začali registrovať maily práve v takomto formáte, zrejme by ste ihneď hlasno kričali, že to sú jasné automaticky generované účty nejakých botov a začali by ste ich hromadne mazať.

Následne by ste len zakrútili hlavou nad tým, že ako môže byť nejaký spamer takto naivný, keď to na vás skúša s takto očividnými neplatnými adresami.

Veď ako inak by to mohlo byť? Žiadny normálny človek by si predsa nevytvoril pre seba mail v takomto formáte. Alebo žeby to bolo inak? Žeby tu bolo niečo s čím nepočítate, pretože vám to ani vo sne nenapadlo?

MY SME TÍ PÁ A PI, Z MAČACEJ PLANÉTY

Aj keď sa to možno zdá neuveriteľné, milióny ľudí takéto e-maily používa a stovky tisíc firiem takto nazýva aj svoje veľmi populárne stránky, e-shopy či webové služby.

Príkladom môže byť napríklad obrovský herný čínsky portál 4399.com, veľký e-shop 3.cn, alebo veľký predajca ojazdených áut na adrese 92.com. Ste v Číne a potrebujete si kúpiť lístok na vlak? Zamierte na stránku 12306.cn.

Nie, nie je to preto, že by sa v tejto obrovskej krajine už minuli všetky rozumné domény. Dôvodom tejto situácie je jazyková, respektíve abecedná bariéra.

Pre nás ako Slovákov je tento fakt značne skrytý, pretože drvivá väčšina internetového a technologického sveta patrí pod rovnakú písomnú sféru ako my. Ak navštevujeme zahraničné stránky, ako napríklad americké YouTube.com, alebo nemecké Spiegel.de, možno síce nerozumieme, čo tieto slová znamenajú, ale stále ich vieme ľahko prečítať a takisto si ich zapamätať, pretože sú písané latinkou.

Viac ako polovica populácie sveta ale toto šťastie nemá a „významný“ internet je pre nich akoby z inej planéty. Zhruba 1,5 miliardy ľudí používa prioritne znaky čínskej „abecedy“, respektíve logogramy, z ktorých vychádza písmo v Číne, Japonsku, Kórei a v ďalších východoázijských krajinách.

Ďalšia miliarda ľudí na Zemi používa Dévanágarí, ktorým sa píše v Indii a Nepále, no a ďalších 700 miliónov ľudí prioritne píše arabsky. Netreba zabudnúť pravdaže ani na zhruba 250 miliónov ľudí z Ruska, Bulharska či Ukrajiny, ktorí používajú Cyriliku.

To, že technologickému svetu za posledné storočie dominuje západná sféra a to, že internet a web vznikol v USA a Európe, sa nevyhnutne podpísalo na jeho podobe.

Keď sa na prelome tisícročí internet a hlavne web začal presadzovať skutočne vo veľkom po celom svete, webové či e-mailové adresy bolo možné písať len tak, ako ich píšeme my. Latinkou a arabskými číslami.

Ako Slováci sme si síce nemohli zvoliť adresu www.vyšperkovaná-stránka.sk, avšak zvykli sme si, že v tom počítačovom svete sa mäkčene a dĺžne nepoužívajú. Dodnes považujeme komunikáciu v štýle „ahoj, ako sa mas“ za úplne normálnu, rovnako ako adresu „frantisek.kovac@schranka.sk“.

Lenže pre Číňanov, Japoncov, Kórejčanov alebo Rusov či Egypťanov to také ľahké nebolo. Predstavte si, že chcete používať populárne svetové služby, ako napríklad Google vyhľadávač, alebo YouTube a majú takéto adresy, ktoré do prehliadača vy ako Slovák musíte nevyhnutne zadať:

To ale nie je všetko. Nejde pri tom len o adresy špičkových webových služieb, ktoré chcete používať. Ide aj o vaše domáce adresy. My sme si mohli napísať adresy ako www.zoznam.sk, alebo www.slovensky-rozhlas.sk, ale iné štáty, ktoré latinku nepoužívali, to urobiť nemohli.

Museli si pre svoje domovské stránky voliť názvy v latinke. Aj keď sa to dnes už zmenilo (i keď len čiastočne, k čomu sa ešte dostanem), pri úvodom rozširovaní webu a internetu na prelome storočí museli tvorcovia zatnúť zuby a pre svojich návštevníkov mať weby písané čudesnými „klikihákmi“.

Dodnes je pritom vo východoázijských krajinách úplne normálne, že v TV či na tlačených bilbordoch firma nepropaguje svoju webovú stránku ako „nájdete nás na adrese www.firma.sk“, ale štýlom, nájdete nás zadaním „firma na výmenu potrubia Bratislava“ do vyhľadávača. Týmto postupom sa totiž domáci návštevníci môžu písaniu latinky úplne vyhnúť. Skrátka len napíšu výraz vo svojom jazyku a kliknú na prvý výsledok hľadania.

Dôvodom, prečo tieto krajiny dávajú prednosť číslam, je ich ľahšie zapamätanie. Napríklad drvivá väčšina čínskej 1,4 miliardovej populácie neovláda žiadny západný jazyk. Názvy stránok a webových služieb písané v latinke na nich pôsobia rovnako cudzo a klikihákovo, ako pre nás 中文字体.

Avšak v prípade čísiel to neplatí. Čínština síce má vlastné znaky pre čísla, ale adoptovanie arabských čísel je v tejto krajine už dlhodobé a siaha späť niekoľko storočí.

Dnes sa s nimi Číňania stretávajú v rámci školského systému a takisto v rámci každodenného života. Arabské čísla sa používajú v Číne pri telefonovaní, na značeniach liniek autobusov a vlakov, alebo na poštových adresách či v dátumoch. Podobná vec platí aj pre iné ázijské krajiny, ako napríklad Japonsko.

Japonský bilbord s dobre známymi arabskými číslami /Foto: soranews24/

Aj keď Slovákom alebo iným obyvateľom štátov s latinkou sa číselné sekvencie pamätajú obvykle horšie ako slová, v prípade, že čísla poznáte a písmená nie, to je naopak.

Ak vám dám na výber, či si chcete zapamätať „13951“ alebo slovo „Vrana“. Určite dáte prednosť tomu druhému. A to platí aj v prípade, že ide o slovo ktoré nepoznáte. Adresa kukumalak.com, je pre vás stále viac zapamätateľná, ako 185439215.com, aj keď sa skladá z rovnakého počtu znakov.

Keby som vám ale dal na výber medzi „13951“ a vranou napísanou v čínštine „乌鸦“, už by ste si zrejme zvolili čísla, pretože by ste si už neboli istý, či tvary čínskych znakov budete môcť v budúcnosti spoznať, alebo ich nebodaj zopakovať napísaním na čínskej klávesnici.

A to platí nielen pre Čínu, Japonsko či Rusko, kde arabské čísla naozaj používajú. Platí to aj pre krajiny, kde arabské čísla nepoužívajú, pretože čísiel je stále len 10, zatiaľ čo písmen až 26 (anglická abeceda).

Zaujímavé je, že ázijské krajiny sa s číslami ešte aj foneticky hrajú, čím zapamätávanie zvyšujú. Napríklad obrovský čínsky e-shop Alibaba používa v domácom prostredí doménu 1688.com. Prečítanie týchto čísiel totiž znie v čínštine zhruba ako „jov-ljou-ba-ba“, čo znie dosť podobne ako Alibaba.

Čínsky videoportál 6.cn si vystačí so zapamätaním jedného čísla, pričom prečítanie šestky navyše v čínštine znie podobne ako slovo pre video streaming. Naopak čínsky portál na vyhľadávanie práce 51job.com znie pri prečítaní čísla 51 v čínštine podobne ako „chcem-job.com“, teda „chcem-prácu.com“.

Iné firmy zas využívajú toho, že ľudia si pamätajú ich telefónne čísla. Napríklad telekomunikační poskytovatelia China Telecom a China Unicom nemajú svoje prioritné weby so svojimi menami, ale so svojimi dobre známymi telefónnymi číslami zákazníckeho servisu (10086.cn a 10010.cn).

PREČO INÉ KRAJINY NEPOUŽÍVAJÚ PRIORITNE VLASTNÉ ZNAKY?

Prečo teda Číňania, Japonci, Indovia či Rusi nepoužívajú adresy písané vo vlastných jazykoch? Veď stránky a služby ako také vo vlastných jazykoch majú, tak prečo nie ich adresy?

Nuž, v počiatku internet a web nič také neumožňoval. Bolo možné použiť len základné znaky anglickej abecedy a čísla. To bolo všetko. Koniec koncov, veď aj my Slováci sme sa museli zaobísť bez našich rozširujúcich písmen ako š č ť ž.

Situácia sa začala meniť v prvej dekáde tohto storočia, kedy vošla do prevádzky doménová úprava v podobe IDN, teda medzinárodných doménových mien (Internationalized domain name). K štandardizovaniu došlo v roku 2003, avšak podpora tohto riešenia na úrovni aplikácii a celkovej ochoty relevantných softvérových firiem bola v nasledujúcich rokoch doslova žalostná.

V prvej dekáde tohto storočia používanie IDN vyžadovalo rôzne pluginy prehliadačov, pričom integrácia v rámci webových praktík často neexistovala. Dokonca aj na začiatku druhej dekády, konkrétne v roku 2012, ešte 85% webových služieb adresy v IDN formáte ani nerozoznávalo ako reálne (pri vkladaní odkazov, uploadovaní dát a podobne).

Čínska Alibaba na svojej prirodzenej domovskej adrese 1688.com

Okrem toho, všetko prišlo značne neskoro. U nás o toto rozšírenie doménového systému záujem príliš nebol, pretože by vlastne len nútilo firmy k tomu, aby si zakúpili svoje domény 2×. S mäkčeňmi-dĺžňami a bez nich. Už dávno sme si pritom zvykli na to, že tieto písmená sa v názvoch adries nevyskytujú a spôsobilo by to vlastne len zmätky, keď by niekto mal zakúpenú adresu len s mäkčeňmi, ale už nie bez nich.

Naproti tomu v nelatinkových končinách, predovšetkým vo východnej Ázii o tieto adresy záujem aj bol, avšak problémom bolo, že zavedený systém riešil problematiku len z časti. Zmena sa totiž týkala len názvov stránok, zatiaľ čo úvodné www či koncovky TLD v podobe COM, či domácich CN a RU museli byť stále v latinke a to až do ďalšej zmeny v roku 2009.

Ešte v roku 2012 označil svetový report EURid-UNESCO zavádzanie IDN vo svete ako nekonzistentné a značne neuspokojivé, o čom jasne hovorili aj štatistiky. Z 252 miliónov registrovaných domén spadalo pod IDN len 5 miliónov, teda 2 % adries, čo rozhodne nezodpovedalo stavu sveta, v ktorom polovica populácie latinku nepoužíva.

Ako sa vyvinula situácia za posledných 8 rokov? Nie je to o nič viac ružovejšia. V roku 2020 evidujeme 360 miliónov registrovaných adries, z čoho 9 miliónov je v IDN formáte. Ich popularita teda narástla z 2% na 2,5%. Teda skoro vôbec.

Je pravdou, že totálne rozšírenie sa ťažko odhaduje len z počtu domén ako takých, pretože až 80 % registrovaných adries je „zaparkovaných“ a nepoužívajú sa. Na druhú stranu si ale netreba robiť ilúziu, že v rámci IDN domén je situácia nejako diametrálne odlišná. Rozšírenie je skrátka malé.

Dnes už síce prehliadače a operačné systémy nelatinkové webové adresy podporujú štandardne, ale to nie je ešte výhra. Napríklad podpora nelatinkových e-mailov je stále žalostná. Aj keď nelatinkové maily boli štandardizované v roku 2012, v Rusku či Indii sme začali vidieť ucelené snahy zaviesť takéto adresy v azbuke, respektíve v devanagari až v roku 2016. Prvé ucelené pokusy v Južnej Kórei dokonca až v roku 2018.

Tomu sa hovorí fakt „s krížom po funuse“, pretože väčšina populácie dávno bola donútená používať e-mailové adresy v latinke.

Mimochodom, to, že v posledných rokoch už nelatinkové krajiny takéto maily používajú na domácom internete neznamená, že ich môžu používať inde.

Dnes je stále rozšírenou praxou kontrolovať validitu emailovej adresy formou latinky, takže ak sa nejaký úbožiak z Indie alebo Kórei pokúsi na nejakej západnej populárnej službe registrovať so svojim nelatinkovým e-mailom, aj tak mu formulár napíše, že zadaný e-mail je neplatný.

ŠŤASTIE, KTORÉ SI OBVYKLE ANI NEUVEDOMUJEME

IDN, respektíve nelatinkové adresy stránok a e-mailu ale pravdaže nevymažú realitu, ktorou je, že webovým službám dominuje západný svet, predovšetkým USA.

V tomto máme ako Slováci šťastie, pričom väčšina z nás si tento fakt ani nikdy neuvedomí. Z našej každodennej skúsenosti je svet skrátka latinkový. Vieme pravdaže, že ľudia z Ázie používajú rôzne „klikiháky“, ale pokiaľ do ich krajiny necestujeme, alebo sa nechceme naučiť ich jazyk, tak nás to skrátka nezaujíma.

Ako Slováci s ne-latinkov v našich životov prakticky vôbec nie sme konfrontovaní. Naproti tomu, miliardy ľudí z Číny, Indie, Japonska, či arabských krajín toto šťastie nemajú. Ak sa o dianie v rámci technológií, sveta alebo hoc aj show biznisu chcú zaujímať, latinke sa skrátka nevyhnú.

Koľko krát sa vám v živote stalo, že vám niekto poslal odkaz na nejakú webovú stránku, alebo nejaké video a tá vyzerala nejako takto:

Zrejme ani raz. Polovici populácie sa to ale stáva bežne, pričom tým klikihákom a „rozsypaným čajom“ je obvykle angličtina.

Toto šťastie pritom pre nás platí nielen na webe ako takom, ale aj v rámci softvéru. Objavila sa nejaká super nová sociálna sieť? Nový komunikačný program, nová hudobná alebo video služba? Jasné, nie je slovenská, ale byť v cudzom jazyku pre nás obvykle značí „byť v angličtine“.

Aj keď angličtinu vôbec neovládate, stále cítite jej vplyv a aj bez akéhokoľvek štúdia viete význam jednoduchých slov ako EXIT, START alebo YES.

Ak skúšate inštalovať nový neznámy program, prinajhoršom bude v angličtine a viete ho aspoň vypnúť, alebo v základe ovládať klikaním na relatívne známe slová.

A aj keď im nerozumiete, stále ich viete prečítať, takže medzi nimi môžete ľahko vizuálne rozoznávať. Napríklad slovo IKLARTA vidíte teraz po prvý raz, ale rýchlo ho rozpoznáte v rôznom kontexte a poľahky ho napíšete napríklad aj do prekladača.

Nikdy sa vám nestalo, že novo nainštalovaný program vyzeral po spustení nejako takto a nevedeli ste ho skoro ani vypnúť, nie to ešte používať.

Nazrieť do tohto mätúceho sveta ale môžete. Určite ste sa stretli už so situáciou, keď ste museli jazyk nejakého programu alebo služby prepnúť ručne do nášho či iného známeho jazyka. Jednou z dizajnérskych/programátorských slušností pri týchto úlohách je, že pri výbere sú jazyky ako také napísané sebou samým. Pretože ak nie sú, ste v koncoch.

Jasné, v latinke ste za vodou, pretože spoznáte anglické „Slovak“, nemecké „Slowakisch“, alebo aj francúzske „Slovaque“ či fínske „Slovakki“.

Ale čo tie nelatinkové? Spoznali by ste slovenčinu aj v arabčine „السلوفاكية“ alebo v japončine „スロバキア“? Že nie? Vitajte vo svete chudákov z nelatinkových končín. Tí to zažívajú bežne keď im západní dizajnéri ich jazyk ponúkajú ako „čínština“ či „korean“.

Túto „zábavu“ pocítite na vlastnej koži hlavne vtedy, keď si v nejakom programe prepínate jazyk z angličtiny do slovenčiny, alebo dostupnej češtiny, pričom sa ukliknete tesne vedľa a aktivujete napríklad čínštinu. Aj keď okno s výberom iných jazykov máte stále otvorené, neviete prečítať, ktorý je ten váš.

Pred mnohými rokmi som sa v nejakej zábavnej internetovej diskusii stretol s popisom jedného Čecha, ktorý s takýmto spätným prepnutím do čínštiny bojoval, pričom experimentovaním prišiel na to, že čeština je – pavúk pod stieračom, kadibúdka s nohami, kopec s anténou

Túto poučku dodnes viem naspamäť a dokonca som ju už aj dvakrát použil. Raz keď mi jeden človek doniesol na opravu počítač s Windows, ktorý si „omylom“ do čínštiny prepol a druhý raz pri návšteve Číny pri pripájaní na verejnú Wi-Fi sieť. S takýmito problémami pritom používatelia z nelatinkovej polovice sveta bojujú pomerne pravidelne.

A nám to pritom pokojne aj celý život nepríde na um.

Jedna moja priateľka pred pár rokmi cestovala do Grécka. Aj keď nevedela po anglicky či nemecky skoro nič, bola zvyknutá cestovať po celej Európe a vždy sa nejako posunkovo dorozumela.

Sprievodcom jej bol v dávnej dobe hlavne elektronický slovník a neskôr aplikácia v smartfóne, kde potrebné výrazy skrátka zadala a preložila si ich.

Ešte v ten istý deň ako dorazila do Atén mi ale pobavene napísala, že zabehnutý postup v tejto krajine nefunguje. Tie grécke slová totiž nemá ako do toho prekladača napísať.

Na diaľku som jej vtedy v smartfóne doinštalovával grécku klávesnicu a vysvetľoval jej, ako sa medzi ňou a tou našou prepínať. Bola to pekná ukážka toho, ako nás tento problém za bežných podmienok vôbec ani nenapadne a zaskočí nás.

Veď predsa písať vieme, no nie? Tak aký problém môže nastať.

Google už dnes síce ponúka možnosť optického rozpoznávania znakov a na text môžete namieriť rovno fotoaparát, ale o tejto funkcii pravdaže musíte najprv vôbec vedieť. A ak viete, záleží od svetelných podmienkach a podklade, pretože OCR nie je použiteľné za všetkých podmienok. Poľahky sa preto tento „problém“ prihodí ľudom aj dnes.

Dnes nám pripadá samozrejmé, že angličtina je svetový komunikačný jazyk. Vždy mi prišlo zaujímavé premýšľať nad tým, ako dlho to ešte potrvá. Nič totiž netrvá večne.

Ak dnes ideme do Číny, prakticky očakávame, že sa dohovoríme po anglicky. Sme dokonca zaskočení, ak napr. taxikár nevie po anglicky ani slovo. Veď predsa vozí turistov a anglicky vedieť má.

Podobnú vec by sme ale nikdy nepovedali o slovenských či amerických taxikároch, na ktorých by početní čínski turisti či biznismeni začali hovoriť po čínsky a následne sa čertili, že prečo im nerozumejú ani slovo.

Humorné je, ak by ste taxikárovi v Bratislave alebo New Yorku ukazovali adresu miestneho hotela napísanú ako:

宜必思中心酒店
萨莫卡7013/38

Smejete sa? No nesmejte. Čínskym taxikárom totiž ľudia často ukazujú adresu v štýle:

Pavilion Hotel
4002 Hua Qiang Bei Lu, Futian District

Len si myslíme, že je to v poriadku. Že je to normálne. Veď ako inak by to mohlo byť.

A ten pán s emailovou adresou 983541@163.com je len nejaký čudák alebo úbožiak, čo nevie, že do serióznej komunikácie takáto adresa nepatrí…

Nedeľník TOUCHIT hľadajte na našom webe ako inak než v nedeľu. Ak ste predchádzajúce zmeškali, nájdete ich všetky pod rovnomenným kľúčovým slovom.

František Urban

František Urban
Zameriavam sa najmä na prehľadové a analytické články z oblasti najrôznejších technológií a ich vývoja. Nájdete ma takisto pri diagnostike HW a SW problémov.