Kilo, mega, giga, tera, peta, exa, zetta, yotta…. a ďalej? Tak to sa ešte nevie. Pozrite sa so mnou na nové návrhy. Nedeľník TOUCHIT vážne i nevážne. Nezviazané IT témy na tisíc spôsobov.

Napadá vás niečo? Nuž. Výrazy ako megabajt, gigabajt či terabajt pozná každý. Slovné predpony nám umožňujú ľahko rozlišovať inak obrovské čísla a o ich užitočnosti niet žiadnych pochýb.

Tieto predpony boli vytvorené pre metrický systém a vďaka logickosti a premyslenosti ich adoptovalo v počiatkoch vývoja aj informačné odvetvie v súvislosti s kapacitami pamätí a iných úložísk (násobky bitov a bajtov, ako základných jednotiek informácie).

O prideľovaných predponách rozhoduje Medzinárodný úrad pre miery a váhy, skrátene BIPM, z francúzskeho Bureau international des poids et mesures, ktorý bol založený už v roku 1875 na základe dohody o metrických konvenciách. Reprezentuje ho toto frajerské logo:

Metrické prípony sa vždy odvodzujú od čísla 1000 (resp. 10), čo platí aj v prípade jednotiek, používaných v odvetví počítačov. Procesor s frekvenciou 3400 MHz tak má frekvenciu 3,4 GHz. Nikdy inak. Rovnako je tomu aj u frekvencií Wi-Fi či iných prvkov.

Výnimkou je počítanie kapacity, kde sa v mnohých prípadoch používa dvojková sústava, ktorá nám dáva dobre známe násobky v podobe 2, 4, 8, 16, 32, 64, 128, 256, atď. Výrobcovia HDD a SSD túto historickú naviazanosť dlhodobo ignorujú a používajú desiatkovú sústavu, čo vedie k rozdielom v udávanej kapacite produktov.

To, prečo je to tak a aké historické podhubie k tomuto rozporu viedlo nájdete podrobnejšie rozpísané v mojej sérii článkov Čo je prečo tak – Prečo výrobcovia odmietajú počítať kapacitu SSD/HDD rovnako a zmení sa to niekedy?

V tomto článku ale tento rozpor zahoďme a ignorujme. To či je v rámci kapacít správne násobiť číslo desiatkou alebo dvojkou (1000 alebo 1024) je v tejto debate celkom irelevantné.

Za hranicou magického yottabajtu /podkladová ilustrácia: Byte Magazine 1982/

Dôležité je, že IT odvetvie, konkrétne jeho segment úložísk a dát, bude vôbec ako prvé naozaj potrebovať novú predponu, ktorá ešte v metrickej sústave nie je definovaná.

Nejde o to, že by nikto nikdy nepoužil väčšie číslo. Veľké čísla sa v rámci matematiky, vedy či skrátka technických odvetví ale nepotrebujú vždy pomenovávať. Stačí nám skrátený zápis vo forme 10niečo, kde to niečo je číslo, ktoré prakticky vyjadruje počet núl, ktoré za jednotkou či iným číslom nasledujú.

Ak teda potrebujeme rýchlo napísať 1 000 000 000 000 000 000 000 000, napíšeme 1024 a je hotovo. Nepotrebujeme tomu nutne hovoriť Septilion, alebo YottaNiečo.

Potreba samostatného pomenovania vyvstáva v súvislosti, ak sa nejaký násobok už hromadne používa na verejnosti a v bežnej reči. Slovo na označenie daného čísla či objemu/hodnoty je vtedy skrátka už užitočné a je vhodné ho vytvoriť.

AKO SA POMENOVÁVALI SÚČASNÉ PREDPONY A PODĽA ČOHO?

V súčasnosti požívané predpony boli definované pri vytváraní metrického systému, pričom obvykle vychádzajú z antickej gréčtiny, zriedkavejšie z latinčiny. Pravidlom je, aby označenie bolo unikátne a nemohlo byť zamieňané za iné svojim skráteným zápisom.

V základe sa začali preberať staroveké pomenovania čísiel, pričom deka pochádza z rímskeho slova decimus, teda desať. Nasleduje predpona hekto, ktorá morfuje grécke slovo Έκατόν/hekaton, v preklade sto. No a napokon tu máme slovo tisíc, teda predponu kilo, ktorá pochádza z gréckeho slova χίλιοι (chili s ozajstným ch).

Tieto slová boli adoptované Antoine Lavoisierom a jeho výskumnou skupinou v roku 1795 a následne zaradené do predpôn metrického systému v roku 1799. Tisíc gramov je preto kilogram, tisíc metrov kilometer a tisíc hertzov kilohertz.

Kapacitné obludárium /Podkladová ilustrácia: Noger Chen/

Táto číselná podobnosť už ale následne končí. Ďalšia predpona v poradí, ktorou je Mega, už toto pravidlo porušuje. Pochádza z gréckeho μέγας, čo sa číta ako megas a v preklade to znamená skrátka len veľký (nie milión, akoby sa dalo predpokladať).

Nasledujúci výraz Giga vychádzajúci z gréckeho jigas (γίγας), čo znamená obor, alebo priamo z jadra slova odvedený gigant. Nasledujúci výraz Tera má zas pôvod v gréckom slove monštrum (Teras).

Inak povedané, naše staré známe megabajty, gigabajty a terabajty sú poriadnym antickým obludáriom.

POSLEDNÉ ROZŠÍRENIA SYSTÉMU BOLI V ROKU 1975 A 1991

Gigabajty a terabajty nám síce pre označenie kapacít domácej elektroniky a počítačov stačia, ale ak už sa pohneme smerom k serverovniam a dátovým centrám, je to už málo a potrebujeme ďalšie tisícnásobky.

Medzinárodný úrad pre miery a váhy tak začal odvodzovať nové, pričom začal používať grécke a rímske slová pre jednotkové čísla. Ďalšie násobky v poradí v podobe  Peta, Exa, Zetta a Yotta teda vychádzajú zo starovekého pomenovania čísiel 5, 6, 7 a 8, čo sa použilo ako mocniny tisícky (10005, 10006, 10007, 10008).

Prvé rozširovanie názvoslovia sa odohralo v roku 1975, kedy sa stanovili nové predpony Peta a Exa. Používame ich pri petabajtoch a exabajtoch, čo sú kapacity dátových centier a veľkých IT spoločností, ktoré ich prevádzkujú.

Peta pochádza z gréckeho πέντε, teda penta označujúceho päťku (pentagon, pentagram). Odobralo sa z neho však písmeno T. Rovnaký princíp sa použil na nasledujúcej predpone Exa, ktorá pochádza z gréckeho ἕξ teda héx, ktoré označuje šestku (používa sa aj v slovách ako hexagon). Z neho sa odobralo úvodné H, čo nám dalo Exa a teda aj exabajt.

Zatiaľ posledné rozšírenie systému sa odohralo v roku 1991, kedy pribudla Zetta a Yotta. Tisíc exabajtov je teda v základe 1 zettabajt. No a 1000 zettabajtov je 1 yottabajt.

Predpona Zetta pochádza z rímskeho slova Septem, teda sedem (10007). Nie z gréckeho písmena Zeta, akoby sa mohlo zdať. Kvôli odlišnosti má preto dve T a správne píšeme teda zettabajt. Yotta sa zase vracia nazad do starovekého grécka a je odvodená od starogréckeho οκτώ (októ), teda osem.

Z tejto relatívne nedávnej dvojice je v rámci IT odvetvia potrebná predpona Zetta, konkrétne pre spomenutý Zettabajt. Toto obrovské číslo sa používa pre celkovú dátovú kapacitu všetkých digitálnych dát ľudstva. V súčasnosti ide o 33 zettabajtov, pričom ešte v roku 2015 to bola len tretina tejto hodnoty. V minulej dekáde sme dokonca rátali dáta ľudstva ešte „len“ na exabajty.

Podľa prognóz analytickej spoločnosti IDC do roku 2025 poskočíme na 175 zettabajtov. Z tohto vývoja môžeme očakávať, že do sféry Yottabajtov vojdeme niekedy okolo roku 2030, takže začína byť rozumné obhliadať sa po nových označenia predpôn.

Predpony ktoré používame dnes sme stanovili už takmer pred 30 rokmi, takže nejde o žiadne sťahovanie nohavíc pred brodom. Tie nové síce fyzicky budeme potrebovať o zhruba 20 rokov, ale ešte omnoho skôr ich bude treba pre potreby literatúry, trhových prognóz a podobne.

Už dnes sa totiž vo vedeckých prácach a odbornej literatúre yottabajt bežne používa a v niektorých prípadoch už nestačí. No a keďže nové spoločné označenia nemáme, ľudia si pochopiteľne začali vymýšľať vlastné, výsledkom čoho je nesúrodý guláš.

Ako ukážka bordelu môže slúžiť divoký názvov – brontobajt, ktorý začali ľudia používať nielen pre tisíc yottabajtov, ale zároveň aj pre milión yottabajtov. Je teda nadmieru jasné, že nové predpony už potrebujeme, pretože situácia by sa v nasledujúcich rokoch už len a len zhoršovala.

Nuž ale tie výmysly rôznych jednotlivcov sú často zaujímavé a bude zábavné sledovať, či sa niektorý z nich naozaj uchytí. Pozrime sa pri tom na tie najšialenejšie a zároveň aj na tie seriózne, ktoré majú reálnu šancu prijatia do metrického systému.

BUDEME BRONTOBAJTOVAŤ? HEH, TO ANI NÁHODOU!

Ako ukážka šialeného návrhu predpony, ktorý niektorí ľudia začali používať pre 1000 yottabajtov, je hellabajt.

Pochádza už z roku 2010, pričom ide o výsledok petície vytvorenej na Kalifornskej univerzite. Ide o narážku na modernú angličtinu, konkrétne slang z oblasti San Francisca a Sillicon Valley, kde výraz Hella hovorovo označuje „kopu“, respektíve poriadne veľké množstvo.

Vhodnejší preklad so zachovaním dojmu je použitie českého hovorového slova „mrtě“, ktorý na Slovensku v niektorých oblastiach takisto ľudia občas používajú (bolo tam mrtě ľudí, alebo napr. na jazere lietalo mrtě komárov).

V poslednej dekáde sa hellabajty objavili aj v niektorých populárnych magazínoch, ako napríklad  v San Francisco Chronicle, či vo Wired a dokonca aj v niektorých odborných publikáciách, ale obvykle len v nevážnej podobe. Za „najvážnejšie“ prijatie je možné považovať integráciu do webovej Google kalkulačky.

Asi mi ale dáte za pravdu, že výraz Mrtěbajt by žiadna komisia nikdy neuzákonila a rovnako je tomu aj pri hellabajte. Je jedno ako to niekomu pripadá vtipné. Šanca na to, že sa tento prefix stane súčasťou metrického systému a medzinárodných štandardov je – nulová.

Mierne serióznejšie, ale stále prakticky nereálne sú predpony Bronto a Geop, ktoré tvoria brontobajt (1027, tisíc yottabajtov) a geoptbajt (1030, milión yottabajtov). Popravde, dnes už sa je prakticky nemožné dopátrať, kde tieto nezmysly vznikli a kto ich vymyslel.

V hojnejšej miere sa začali používať v španielskych a indických textoch po roku 2006, ale najstarší reálny výskyt, ktorý má indexovaný Google, pochádza z roku 2003 z Texaskej univerzity (za predpokladu, že je časová známka správna, pretože ostatné „staršie“ sú očividne neplatné).

Hlavne brontobajt nabral v poslednej dekáde popularitu na webe a nájdeme ho občas aj v odbornejšej tlači. Pravdepodobnosť, že by sa toto označenie dostalo medzi oficiálne predpony metrického systému, je takisto nulová.

Predpona ako taká má síce v metrickom systéme precedens, pretože očividne pochádza zo starej gréčtiny (βροντή – bronté), ale to ešte nič neznamená. Toto slovo poznáme z dinosaurieho názvu Brontosaurus, čo znamená „hromový jašter“.

 /Ilustrácia: Dan Collins/

Pomenovanie podľa hromu síce nie je koncepčne až tak vzdialené od  „moštier a oblúd“ v podobe mega, giga a tera, ale tieto pomenovania sú už pasé a takmer určite dostane prednosť niečo čo bude pripomínať číslo 9.

Podobne je to aj s nasledovným výrazom Geopbyte, ktorý sa po boku brontobajtu objavuje od úplného počiatku, pričom sa očividne zahráva s gréckym slovom gaja/Γαῖα/Gē, označujúcim zem. Predponu geo nájdeme v geológii, geopolitike, geodézii a podobných, svetom či zemou sa zaoberajúcich disciplínach.

Pravdaže, naivný neznámy návrhár akosi zabudol, že písmeno G už je v rámci predpôn použité a 10 gigabajtov (10 GB) by tak vyzeralo ako 10 Geopbajtov (10 GB). Ale tak, na zasmiatie je to dobré.

OK. Nechajme teda tento amaterizmus už na pokoji a pozrime sa na pokusy, ktoré majú aspoň nejakú šancu na prijatie. Ide o také, ktoré pokračujú v existujúcej hierarchii a využívajú grécke alebo rímske čísla 9, 10 a prípadne 11 (10009, 100010, 100011).

Staro gréčtina používa pre čísla 9, 10 a 11 výrazy ennea, deka a endeka, pričom to stredné už samozrejme v súvislosti s číslom 10 používame (dekagram je desať gramov).

Mnoho ľudí tak nezávisle navrhlo predpony ako Xena, Weka, Vendeka, ktoré z nich doplnením písmena vznikajú. Všimnite si pritom, ako sa ich prvé písmo doplňuje podľa známeho vzoru. Keďže Zetta a Yotta začiatočným písmenom pripomínajú koniec abecedy (Z, Y), tento návrh nasledovných mien v tejto myšlienke pokračuje a od konca abecedy zostupuje ďalej písmenami X, W a V.

Bojovníčka Xena útočí na svoj nový bajt /Ilustrácia: Julius Gopez/

Mali by sme teda Xenabajty, Wekabajty a Vedekabajty.

Alternatívou navrhnutou ďalšími ľuďmi je úprava na xono, weco, vundo, ktorá vychádza zas z latinčiny (novem/nona pre číslo  9, dec pre číslo 10 a undec pre číslo 11), čo by ním dalo Xonobajty, Wecobajty a Vundobajty.

REALITA JE ZNAČNE KOMPLIKOVANEJŠIA, NEDÁTE SI QUECCU?

Aj keď uvedené názvy sú už značne logickejšie a zodpovedajú určitým doterajším zákonitostiam, majú stále nemalé slabiny. Na možné komplikácie pekne poukázal Richard J. C. Brown z britských Národných fyzikálnych laboratórií, ktorý sa ich v januári tohto roku vo svojej práci pokúsil odstrániť.

Ani v jeho prípade nie je žiadna záruka, že Medzinárodný úrad pre miery a váhy tieto návrhy prijme. Po prvý krát ale ide o skutočne precízne námety, ktoré plne odpovedajú doterajším postupom a zároveň odstraňujú nedostatky amatérskych či vtipných návrhov.

Brown poukázal napríklad na to, že postupnosť abecedy k počiatočným písmenám X, W a V je problematická. Špeciálne X môže byť totiž mätúce a v súvislosti s číslami za ktorými nasleduje sa môže spliesť za znamienko ×. Teda napríklad 15×B. Neznalý človek by zároveň mohol skratku XB v angličtine čítať ako „Exbajt“, čo pripomína exabajt.

Písmená W a V sú zase v rámci metrickej sústavy použité pre Volt a Watt. Podobne problematické je písmeno U, ktoré sa používa jednak ako značka pre atómovú hmotnostnú konštantu, ale hlavne pripomína písmeno μ, teda mikro, ktoré sa už ako predpona používa. Ďalšie písmeno v podobe T už pravdaže obsadila predpona Tera – TB/terabajt.

Brown teda navrhol, aby sme poskočili zostupne až na písmená R a Q. Ktoré sú v rámci metrickej sústavy takmer nepoužívané. Následne navrhol deviatu mocninu tisícky (10009, teda v skrátenom zápise 1027) čiastočne odvodzovať od gréckeho slova „ennea“ a rímskeho „novem“, čo sú slová pre číslo deväť.

Navrhol tak predponu Ronna (do mínusu Ronto), po ktorej by nasledovala predpona Quecca (do mínusu Quecto). Tá je zas odvedená od gréckych a rímskych slov deca, decem.

Vo výsledku by tak 1000 yottabajtov (1000 YB) tvorilo jeden ronnabajt (1 RB) a tisíc ronnabajtov zas jeden queccabajt (QB).

Ako je vidieť, problematika je značne hlbšia, ako by sa mohlo zdať. Popustenie fantázie a rôzne narážky sú zábavné, ale treba dodržať internú konzistenciu a logiku, aby všetko mohlo prakticky fungovať. Metrický systém je víťazstvom logiky a dohôd. Po humorný bordel sa chodí inam (viď. prastarý imperiálny systém mier založený na zrnách, klasoch a ľudských údoch).

Je trošku hanbou, že Medzinárodný úrad pre miery a váhy v tomto ohľade zaspal. Problematika úložísk totiž vôbec ako prvá dospela do stavu, kedy sú tieto nové prípony už žiaduce. Vymýšľanie nezmyslených brontobajtov, geopbajtov či hellabajtov, ktoré sa začínajú za posledných desať rokov šíriť v najrôznejších publikáciách, je toho dôkazom.

Predpony metrického systému skrátka treba riešiť vždy výrazne skôr, než sú potrebné, pretože v čase kedy už potrebné začnú byť sa objaví množstvo neoficiálnych náhrad, ktoré následne zbytočne vyvolávajú zmätky.

Treba ich bez odkladu ustanoviť dnes či aspoň v dohľadnej dobe. Včera už bolo neskoro.

Nedeľník TOUCHIT hľadajte na našom webe ako inak než v nedeľu. Ak ste predchádzajúce zmeškali, nájdete ich všetky pod rovnomenným kľúčovým slovom.

Značky:

František Urban

František Urban
Zameriavam sa najmä na prehľadové a analytické články z oblasti najrôznejších technológií a ich vývoja. Nájdete ma takisto pri diagnostike HW a SW problémov.