2. diel - SEO - Internetové vyhľadávače a PageRank Nové
V minulej lekcii, SEO - Úvod do optimalizácie webov pre vyhľadávače , sme si uviedli základy optimalizácie pre vyhľadávače, organickú návštevnosť, kľúčové slová a ciele SEO.
V tomto SEO tutoriáli si vysvetlíme, ako fungujú internetové vyhľadávače a prečo nestačí, aby webová stránka iba existovala. Ukážeme si rozdiel medzi katalógom a fulltextovým vyhľadávačom, prejdeme si pojmy prechádzanie, indexácia a radenie výsledkov a predstavíme si algoritmus PageRank.

Katalógy
Na začiatku internetu bolo webových stránok málo. Najjednoduchším riešením bolo ručne zostaviť ich zoznam. Takémuto zoznamu hovoríme katalóg.
Katalóg fungoval podobne ako telefónny zoznam firiem. Autor webu svoju stránku pridal do príslušnej kategórie a používatelia potom prechádzali témy ručne. Týmto spôsobom kedysi fungovali aj niektoré veľké webové služby. Známym svetovým katalógom bol DMOZ, ktorého prevádzka sa skončila v roku 2017.
Katalógy mali jednu veľkú nevýhodu. Musel ich spravovať človek alebo komunita ľudí. Keď začal web rýchlo rásť, ručné zaraďovanie prestalo stačiť. Každý deň vznikali nové stránky, staré sa menili a niektoré zanikali. Internet preto potreboval systém, ktorý dokáže web objavovať automaticky.
Historicky mohli katalógy pomôcť novému webu získať prvé odkazy. Dnes má zmysel hlavne kvalitný odborový katalóg alebo overená databáza firiem. Hromadná registrácia do nekvalitných katalógov naopak môže pôsobiť neprirodzene a webu skôr uškodiť.
Fulltextové vyhľadávače
Moderné vyhľadávače nečakajú, kým im autor webu stránku ručne pridá do zoznamu. Samy prechádzajú web, sledujú odkazy a ukladajú informácie o nájdených stránkach. Tomuto typu vyhľadávania hovoríme fulltextové vyhľadávanie.
Fulltextový vyhľadávač nepracuje len s názvom webu alebo kategóriou. Analyzuje samotný obsah stránky. Zisťuje, aké texty stránka obsahuje, aké má nadpisy, kam odkazuje a ako súvisí s ostatnými stránkami.
Z pohľadu SEO je dôležité, že vyhľadávač stránku najprv musí objaviť, prečítať a pochopiť. Ak stránka nie je technicky dostupná alebo nemá zrozumiteľný obsah, vyhľadávač s ňou bude pracovať horšie.
Práca vyhľadávača so stránkou
Vyhľadávač funguje trochu ako obrovská knižnica. Knihu nestačí len mať niekde v regáli. Knihovník ju musí nájsť, zaradiť a pri otázke čitateľa vybrať práve tie knihy, ktoré mu najlepšie pomôžu. Vyhľadávač pracuje podobne. Najprv stránky objavuje, potom si ukladá informácie o ich obsahu a nakoniec vyberá výsledky, ktoré najlepšie zodpovedajú dopytu.
Vyhľadávač musí stránku najprv nájsť, potom si o nej uložiť informácie a nakoniec rozhodnúť, kedy ju ponúkne používateľovi. So stránkou preto pracuje v troch hlavných krokoch: prechádzanie (crawling), indexácia (indexing) a radenie výsledkov (ranking).

Prechádzanie
Prvou fázou je prechádzanie. Túto prácu vykonáva robot, ktorému sa hovorí aj crawler, bot alebo spider. Robot prechádza internet, otvára stránky a sleduje odkazy. Pri Googli sa tento robot volá Googlebot, pri Sezname SeznamBot.
Predstavme si robota ako návštevníka, ktorý prechádza mesto podľa cedúľ. Keď na jednej budove nájde ukazovateľ k ďalšej ulici, vydá sa tým smerom. Odkazy na webe fungujú podobne. Pomáhajú robotovi objavovať nové stránky a chápať vzťahy medzi nimi.
Vyhľadávač môže nové URL adresy objaviť cez odkazy, pomocou súboru
sitemap.xml alebo cez nástroj pre webmasterov, napríklad Google
Search Console. Odoslanie stránky však neznamená, že ju vyhľadávač
automaticky zaradí do výsledkov. Vždy záleží aj na kvalite obsahu,
technickom stave webu a rozhodnutí samotného vyhľadávača.
Indexácia
Druhou fázou je indexácia. Vyhľadávač analyzuje obsah stránky a rozhoduje, či ju uloží do indexu. Index je rozsiahla databáza informácií o stránkach, ktoré robot objavil a vyhľadávač ich spracoval.
Index v knižničnom prirovnaní zodpovedá kartotéke. Neobsahuje len názov knihy, ale aj informácie o téme, obsahu a súvislostiach. Nestačí teda, že robot stránku navštívil. Stránka sa do výsledkov dostane až vtedy, keď ju vyhľadávač zaindexuje.
Indexácii môže brániť aj naše vlastné nastavenie. Keď napríklad do
HTML stránky vložíme tag
<meta name="robots" content="noindex">, hovoríme
vyhľadávaču, aby stránku do indexu nezaraďoval. Prechádzanie niektorých
častí webu môže obmedzovať aj súbor robots.txt.
Súbor robots.txt rieši hlavne prechádzanie
stránky robotom. Naopak hodnota noindex v HTML tagu
<meta> rieši zaradenie stránky do indexu. Tieto nástroje
používame opatrne, aby sme omylom nezablokovali dôležité stránky.
Radenie výsledkov
Treťou fázou je radenie výsledkov, po anglicky ranking. Keď používateľ zadá dopyt, vyhľadávač v indexe nájde stránky, ktoré s dopytom súvisia. Potom ich zoradí tak, aby hore zobrazil najrelevantnejšie výsledky.
Stránke s výsledkami vyhľadávania sa niekedy hovorí SERP, z anglického Search Engine Results Page. V praxi ide o stránku, ktorú používateľ vidí po zadaní dopytu do vyhľadávača.
Vyhľadávač pri radení nepracuje s jediným faktorom. Hodnotí napríklad zhodu obsahu s dopytom, kvalitu stránky, použiteľnosť, jazyk, lokalitu používateľa, dôveryhodnosť zdroja a odkazy z iných webov. Z pohľadu SEO preto nestačí byť v indexe. Stránka musí byť pre konkrétny dopyt aj dostatočne relevantná.
PageRank
Jedným z najznámejších algoritmov Googlu je PageRank. Názov súvisí so spoluzakladateľom Googlu Larrym Pageom. PageRank bol historicky zásadný, pretože priniesol jednoduchú myšlienku: odkaz z jednej stránky na druhú môžeme chápať ako odporúčanie.
Keby vyhľadávač hodnotil iba výskyt slov na stránke, bolo by jednoduché výsledky zmanipulovať. Stačilo by opakovať vyhľadávaný výraz mnohokrát. PageRank pridal ďalší pohľad. Začal sledovať, ktoré stránky odporúčajú iné stránky pomocou odkazov.
Predstavme si odbornú konferenciu. Keď rečníka odporučí niekoľko uznávaných odborníkov, budeme mu pravdepodobne veriť viac než človeku, o ktorom nikto v odbore nepočul. PageRank pracuje s podobnou myšlienkou. Odkaz z dôveryhodnej stránky má väčšiu váhu než odkaz z náhodného a nekvalitného webu.
Princíp PageRanku
Základný princíp PageRanku hovorí, že stránka získava hodnotu z odkazov, ktoré na ňu vedú. Nezáleží však len na počte odkazov. Dôležitá je aj kvalita a autorita stránok, z ktorých odkazy prichádzajú.
Skratka GPR na obrázku znamená Google PageRank. Čísla pri jednotlivých stránkach nám pomáhajú predstaviť si, že niektoré stránky majú väčšiu váhu než iné:

Hodnota PageRanku sa často vysvetľuje ako prelievanie hodnoty cez odkazy. Stránka, ktorá odkazuje na ďalšie stránky, časť svojej hodnoty odovzdáva ďalej. Ak odkazuje na mnoho rôznych miest, hodnota sa medzi odkazy rozdeľuje.
Tento princíp pomáha pochopiť aj význam interných odkazov. Interné odkazy pomáhajú vyhľadávaču objavovať dôležité stránky a chápať ich vzťahy. Ak na dôležitú stránku nevedie žiadny vnútorný odkaz, vyhľadávač ju môže považovať za menej významnú.
Verejné hodnoty PageRanku
Kedysi bolo možné sledovať verejnú hodnotu PageRanku na stupnici od 0 do 10. Táto metrika sa zobrazovala napríklad pomocou nástrojových líšt v prehliadači. Mnoho ľudí ju vtedy bralo ako jednoduché číslo, ktoré malo vyjadrovať silu webu.
Google však verejné zobrazovanie PageRanku zrušil. Dnes už presnú hodnotu PageRanku nezistíme a staré hodnoty majú iba historický význam.
Zmysel má teda chápať princíp PageRanku, nie hľadať konkrétne číslo. Odkazy stále pomáhajú vyhľadávačom rozpoznávať vzťahy medzi stránkami a dôveryhodnosť zdrojov.
PageRank v súčasnom SEO
PageRank dnes neberieme ako jediný ukazovateľ úspechu. Moderné vyhľadávače hodnotia mnoho signálov naraz. Napriek tomu je princíp odkazov ako odporúčaní stále dôležitý.
Google PageRank v priebehu rokov výrazne upravil. Princíp práce s odkazmi však zostáva súčasťou hodnotenia výsledkov. Neznamená to, že by sme mali SEO stavať len na získavaní odkazov. Kvalitný obsah, technický stav webu, užitočnosť stránky a dôveryhodnosť zdroja sú rovnako dôležité súčasti celého obrazu.
V praxi sa niekedy používajú metriky nástrojov tretích strán, napríklad Domain Rating od Ahrefs alebo Domain Authority od Mozu. Tieto hodnoty môžu pomôcť s orientačným porovnaním webov, ale nie sú súčasťou algoritmu Googlu. Nemožno ich teda zamieňať za skutočné hodnotenie webu vo vyhľadávaní.
Z hľadiska SEO je dôležitejšie premýšľať o tom, či web získava odkazy prirodzene, či má užitočný obsah a či naň odkazujú relevantné zdroje. PageRank nám pomáha pochopiť, prečo odkazy historicky hrali takú veľkú rolu.
Záver
Vyhľadávače fungujú v troch základných fázach: prechádzajú web, ukladajú informácie do indexu a radia výsledky podľa relevancie. Katalógy boli dôležité historicky, ale moderné vyhľadávanie stojí hlavne na automatickom prechádzaní a hodnotení obsahu. PageRank ukázal, že odkazy môžu fungovať ako odporúčania medzi stránkami. Dnes už jeho verejnú hodnotu nemeriame, ale princíp odkazovej autority zostáva pre SEO dôležitý.
V budúcej lekcii, SEO - Algoritmy Google a kvalita výsledkov , si vysvetlíme, ako algoritmy vyhľadávačov ovplyvňujú radenie výsledkov. Ukážeme si, ako súvisí relevancia, užitočný obsah, dôveryhodnosť zdroja a hlavné aktualizácie Googlu s tým, ktoré stránky sa zobrazia vo výsledkoch vyhľadávania.

David sa informačné technológie naučil na