Niekde tie dáta musíme dať a prečo ich nedať do niečoho, čo aspoň ako tak drží po hromade. Poďte sa s nami pozrieť na retročriepku dnes už na obdiv vystaveného exponátu, na ktorom to celé Google impérium začalo.

Písal sa rok 1996 a dvaja doktorandi študujúci na Stanfordovej univerzite, Sergej Brin a Larry Page, sa práve rozhodli vyskúšať svoj nový a následne prelomový vynález – zoraďovací algoritmus PageRank, hodnotiaci relevantnosť a hodnotnosť webových stránok na základe kľúčových slov a prelinkovania odkazov v rámci webu.

Vytvorili ho v rámci svojej doktorandskej práce, pričom jeho úlohou bolo zoradiť stránky na základe nových a dovtedy nepoužívaných faktorov, ktoré sa na problematiku vyhľadávania pozerali celkom inak, ako vtedajšie nástroje prevádzkované firmami ako Yaohoo či AltaVista.

Aj keď samotný vývoj prebiehal na fakultných počítačoch Stanfordovej univerzity, ktoré boli sponzorované rôznymi organizáciami ako NSF, DARPA či NASA, tak následná prevádzka algoritmu si vyžadovala niečo celkom iné:

Poriadny dátový server, ktorý na univerzite skrátka dostupný nebol.

Dátové úložisko s veľkou kapacitou sa tak Larry Page a Sergej Brin rozhodli zriadiť pod vlastnou taktovkou a tak nejako na kolene si ho skrátka poskladať.

KOĽKO MEGA KOCIEK VLASTNE POTREBUJEME?

Problémom je, že internet je rozsiahly. V polovici 90. rokov minulého storočia síce nedosahoval ani len percento súčasného objemu, avšak z hľadiska relevantného zárezu do jeho pavučiny z jediného miesta a počítača šlo o obrovskú úlohu.

Vyhľadávač v tej dobe operoval výhradne s textom, ktorý v surovej podobe bez akéhokoľvek formátovania príliš veľa miesta nezaberá. Milión písmen sa v základe zmestí zhruba do 1 MB.

/Foto: Steve Jurvetson/

No lenže milióny sú v rámci internetu nič a pri indexovaní stránok sa milióny rýchlo menia na miliardy a tie pribúdajúce megabajty a následne gigabajty niekam musíte dať.

Page a Brin pre svoj testovací server zvolili v tej dobe najväčší 3,5“ HDD, ktorý bol bežne na trhu. Mal kapacitu 4 GB, pričom na dnešné peniaze stál zhruba 1000 eur.

Nakúpili ich celkom 10, pričom pri pohľade na cenovky vám bude asi jasné, že v rozpočte im už veľa peňazí príliš nezostalo.

Nosnú konštrukciu, ktorá by umožňovala bezpečné osadenie ich dátového zapojenia a elektrického napájania sa tak rozhodli postavať svojpomocne.

Vzali dieliky lega a postavili základnú konštrukciu skrinky s priehradkami, kde disky poukladali. V prednej a zadnej časti urobili okienka pre zasunutie ventilátorov a všetko pripojili k základnej doske a napájaciemu zdroju.

Prvý Google server, vystavený v rokoch 2003 až 2010 v suteréne budovy Gatesovho centra pre počítačové vedy, na fakulte Standfordovej univerzity, kde pôvodne vznikol krátko po jej otvorení. Mimochodom, to slovíčko „Gatesovho“ je naozaj pomenované po Billovi Gatesovi, ktorý sponzoroval výstavbu fakulty darom šiestich miliónov dolárov. /Foto: Stanford/

Ako môžete vidieť na fotografii, bočnicu tohto serveru tvorí priesvitný plát polyetylénu, ktorý poznáte aj ako vyplňovaniu hmotu z rôznych  balíkov. Dobre cez ňu vidieť rysovať sa dva rady 4 GB diskov po piatich kusoch.

Všetko to bolo dohromady pozliepané lepiacou páskou.

MEGA BLOKY AKO SYMBOL NOVEJ MEGA ÉRY

Pre detailistov treba podotknúť, že označenie „lego“ je v tomto texte použité len z hľadiska hovorovej reči. Tak aby si každý vedel ihneď predstaviť o čo vlastne ide.

Už na pohľad je vidieť, že kocky sú v skutočnosti väčšieho formátu, na úrovni Dupla, určeného pre menšie deti.

Keď začnete po ich pôvode a výrobcovi viac pátrať, tak podľa dvoch figúrok sediacich v hornej časti serveru zistíte, že v skutočnosti bola použitá stavebnica Mega Blocks, od kanadskej firmy Ritvik (ktorú mimochodom v roku 2014 odkúpil hračkársky gigant Mattel).

Konkrétne sa použil model stavebnice z prelomov 70 a 80. rokov minulého storočia. Vzhľadom na to, že Page aj Brin sa narodili v roku 1973, je dosť dobre možné, že išlo o odložené kocky z detstva jedného z nich.

HOR SA K VYHĽADÁVACEJ DOMINANCII

Celý lego Megablok server fungoval bezchybne. Nový softvér a algoritmus dokázal zaindexovať 24 miliónov webových stránok týždenne, čo bolo na tú dobu naozaj úctyhodné číslo.

Vytvorené textové indexy sa následne používali na relevantné vyhľadávania. Efekt PageRanku bol enormný a prakticky žiadny iný výstup vyhľadávača na trhu sa mu nemohol rovnať. Zastarané rázcestníky, do ktorých boli stránky ukladané ručne ako do veľkej knižnej kartotéky, razom stratili na sile a význame. Otvorila sa nová éra.

Po roku 2010 sa na obdiv vystavený server presťahoval do novo postaveného Inžinierskeho vývojového centra Jen-Hsun Huanga, (takisto v areáli Snadfordovej Univerzity), kde ho môžete vidieť vystavený dodnes /Foto: Stanford/

Na základe úspechov so svojim „lego serverom“ založili Larry Page a Sergej Brin v roku 1998 firmu Google, ktorá behom nasledujúcej dekády začala indexovať miliardy stránok a bilióny a biliardy parametrov, ukladajúc indexy na stále rastúcich stovkách, tisíckach a napokon miliónoch serverov.

Ich vyhľadávací mechanizmus behom nasledujúcich rokov začal dominovať svetu. A to až tak, že výraz „googlovať“ sa pre túto činnosti stal prakticky synonymom.

Ďalšie drobné čriepky z IT histórie hľadajte na našom webe vždy v štvrtok večer a takisto pod rovnomenným kľúčovým slovom.

František Urban

František Urban
Zameriavam sa najmä na prehľadové a analytické články z oblasti najrôznejších technológií a ich vývoja. Nájdete ma takisto pri diagnostike HW a SW problémov.