2. diel - SEO - Internetové vyhľadávače a PageRank Nové

V minulej lekcii, SEO - Úvod do optimalizácie webov pre vyhľadávače , sme si uviedli základy optimalizácie pre vyhľadávače, organickú návštevnosť, kľúčové slová a ciele SEO.

V tomto SEO tutoriáli si vysvetlíme, ako fungujú internetové vyhľadávače a prečo nestačí, aby webová stránka iba existovala. Ukážeme si rozdiel medzi katalógom a fulltextovým vyhľadávačom, prejdeme si pojmy prechádzanie, indexácia a radenie výsledkov a predstavíme si algoritmus PageRank.

Ilustračná fotografia k SEO a vyhľadávaniu na webe - SEO - Optimalizácia webov pre vyhľadávače

Katalógy

Na začiatku internetu bolo webových stránok málo. Najjednoduchším riešením bolo ručne zostaviť ich zoznam. Takémuto zoznamu hovoríme katalóg.

Katalóg fungoval podobne ako telefónny zoznam firiem. Autor webu svoju stránku pridal do príslušnej kategórie a používatelia potom prechádzali témy ručne. Týmto spôsobom kedysi fungovali aj niektoré veľké webové služby. Známym svetovým katalógom bol DMOZ, ktorého prevádzka sa skončila v roku 2017.

Katalógy mali jednu veľkú nevýhodu. Musel ich spravovať človek alebo komunita ľudí. Keď začal web rýchlo rásť, ručné zaraďovanie prestalo stačiť. Každý deň vznikali nové stránky, staré sa menili a niektoré zanikali. Internet preto potreboval systém, ktorý dokáže web objavovať automaticky.

Historicky mohli katalógy pomôcť novému webu získať prvé odkazy. Dnes má zmysel hlavne kvalitný odborový katalóg alebo overená databáza firiem. Hromadná registrácia do nekvalitných katalógov naopak môže pôsobiť neprirodzene a webu skôr uškodiť.

Fulltextové vyhľadávače

Moderné vyhľadávače nečakajú, kým im autor webu stránku ručne pridá do zoznamu. Samy prechádzajú web, sledujú odkazy a ukladajú informácie o nájdených stránkach. Tomuto typu vyhľadávania hovoríme fulltextové vyhľadávanie.

Fulltextový vyhľadávač nepracuje len s názvom webu alebo kategóriou. Analyzuje samotný obsah stránky. Zisťuje, aké texty stránka obsahuje, aké má nadpisy, kam odkazuje a ako súvisí s ostatnými stránkami.

Z pohľadu SEO je dôležité, že vyhľadávač stránku najprv musí objaviť, prečítať a pochopiť. Ak stránka nie je technicky dostupná alebo nemá zrozumiteľný obsah, vyhľadávač s ňou bude pracovať horšie.

Práca vyhľadávača so stránkou

Vyhľadávač funguje trochu ako obrovská knižnica. Knihu nestačí len mať niekde v regáli. Knihovník ju musí nájsť, zaradiť a pri otázke čitateľa vybrať práve tie knihy, ktoré mu najlepšie pomôžu. Vyhľadávač pracuje podobne. Najprv stránky objavuje, potom si ukladá informácie o ich obsahu a nakoniec vyberá výsledky, ktoré najlepšie zodpovedajú dopytu.

Vyhľadávač musí stránku najprv nájsť, potom si o nej uložiť informácie a nakoniec rozhodnúť, kedy ju ponúkne používateľovi. So stránkou preto pracuje v troch hlavných krokoch: prechádzanie (crawling), indexácia (indexing) a radenie výsledkov (ranking).

Schéma práce vyhľadávača so stránkou - SEO - Optimalizácia webov pre vyhľadávače

Prechádzanie

Prvou fázou je prechádzanie. Túto prácu vykonáva robot, ktorému sa hovorí aj crawler, bot alebo spider. Robot prechádza internet, otvára stránky a sleduje odkazy. Pri Googli sa tento robot volá Googlebot, pri Sezname SeznamBot.

Predstavme si robota ako návštevníka, ktorý prechádza mesto podľa cedúľ. Keď na jednej budove nájde ukazovateľ k ďalšej ulici, vydá sa tým smerom. Odkazy na webe fungujú podobne. Pomáhajú robotovi objavovať nové stránky a chápať vzťahy medzi nimi.

Vyhľadávač môže nové URL adresy objaviť cez odkazy, pomocou súboru sitemap.xml alebo cez nástroj pre webmasterov, napríklad Google Search Console. Odoslanie stránky však neznamená, že ju vyhľadávač automaticky zaradí do výsledkov. Vždy záleží aj na kvalite obsahu, technickom stave webu a rozhodnutí samotného vyhľadávača.

Indexácia

Druhou fázou je indexácia. Vyhľadávač analyzuje obsah stránky a rozhoduje, či ju uloží do indexu. Index je rozsiahla databáza informácií o stránkach, ktoré robot objavil a vyhľadávač ich spracoval.

Index v knižničnom prirovnaní zodpovedá kartotéke. Neobsahuje len názov knihy, ale aj informácie o téme, obsahu a súvislostiach. Nestačí teda, že robot stránku navštívil. Stránka sa do výsledkov dostane až vtedy, keď ju vyhľadávač zaindexuje.

Indexácii môže brániť aj naše vlastné nastavenie. Keď napríklad do HTML stránky vložíme tag <meta name="robots" content="noindex">, hovoríme vyhľadávaču, aby stránku do indexu nezaraďoval. Prechádzanie niektorých častí webu môže obmedzovať aj súbor robots.txt.

Súbor robots.txt rieši hlavne prechádzanie stránky robotom. Naopak hodnota noindex v HTML tagu <meta> rieši zaradenie stránky do indexu. Tieto nástroje používame opatrne, aby sme omylom nezablokovali dôležité stránky.

Radenie výsledkov

Treťou fázou je radenie výsledkov, po anglicky ranking. Keď používateľ zadá dopyt, vyhľadávač v indexe nájde stránky, ktoré s dopytom súvisia. Potom ich zoradí tak, aby hore zobrazil najrelevantnejšie výsledky.

Stránke s výsledkami vyhľadávania sa niekedy hovorí SERP, z anglického Search Engine Results Page. V praxi ide o stránku, ktorú používateľ vidí po zadaní dopytu do vyhľadávača.

Vyhľadávač pri radení nepracuje s jediným faktorom. Hodnotí napríklad zhodu obsahu s dopytom, kvalitu stránky, použiteľnosť, jazyk, lokalitu používateľa, dôveryhodnosť zdroja a odkazy z iných webov. Z pohľadu SEO preto nestačí byť v indexe. Stránka musí byť pre konkrétny dopyt aj dostatočne relevantná.

PageRank

Jedným z najznámejších algoritmov Googlu je PageRank. Názov súvisí so spoluzakladateľom Googlu Larrym Pageom. PageRank bol historicky zásadný, pretože priniesol jednoduchú myšlienku: odkaz z jednej stránky na druhú môžeme chápať ako odporúčanie.

Keby vyhľadávač hodnotil iba výskyt slov na stránke, bolo by jednoduché výsledky zmanipulovať. Stačilo by opakovať vyhľadávaný výraz mnohokrát. PageRank pridal ďalší pohľad. Začal sledovať, ktoré stránky odporúčajú iné stránky pomocou odkazov.

Predstavme si odbornú konferenciu. Keď rečníka odporučí niekoľko uznávaných odborníkov, budeme mu pravdepodobne veriť viac než človeku, o ktorom nikto v odbore nepočul. PageRank pracuje s podobnou myšlienkou. Odkaz z dôveryhodnej stránky má väčšiu váhu než odkaz z náhodného a nekvalitného webu.

Princíp PageRanku

Základný princíp PageRanku hovorí, že stránka získava hodnotu z odkazov, ktoré na ňu vedú. Nezáleží však len na počte odkazov. Dôležitá je aj kvalita a autorita stránok, z ktorých odkazy prichádzajú.

Skratka GPR na obrázku znamená Google PageRank. Čísla pri jednotlivých stránkach nám pomáhajú predstaviť si, že niektoré stránky majú väčšiu váhu než iné:

Zjednodušená schéma Google PageRanku - SEO - Optimalizácia webov pre vyhľadávače

Hodnota PageRanku sa často vysvetľuje ako prelievanie hodnoty cez odkazy. Stránka, ktorá odkazuje na ďalšie stránky, časť svojej hodnoty odovzdáva ďalej. Ak odkazuje na mnoho rôznych miest, hodnota sa medzi odkazy rozdeľuje.

Tento princíp pomáha pochopiť aj význam interných odkazov. Interné odkazy pomáhajú vyhľadávaču objavovať dôležité stránky a chápať ich vzťahy. Ak na dôležitú stránku nevedie žiadny vnútorný odkaz, vyhľadávač ju môže považovať za menej významnú.

Verejné hodnoty PageRanku

Kedysi bolo možné sledovať verejnú hodnotu PageRanku na stupnici od 0 do 10. Táto metrika sa zobrazovala napríklad pomocou nástrojových líšt v prehliadači. Mnoho ľudí ju vtedy bralo ako jednoduché číslo, ktoré malo vyjadrovať silu webu.

Google však verejné zobrazovanie PageRanku zrušil. Dnes už presnú hodnotu PageRanku nezistíme a staré hodnoty majú iba historický význam.

Zmysel má teda chápať princíp PageRanku, nie hľadať konkrétne číslo. Odkazy stále pomáhajú vyhľadávačom rozpoznávať vzťahy medzi stránkami a dôveryhodnosť zdrojov.

PageRank v súčasnom SEO

PageRank dnes neberieme ako jediný ukazovateľ úspechu. Moderné vyhľadávače hodnotia mnoho signálov naraz. Napriek tomu je princíp odkazov ako odporúčaní stále dôležitý.

Google PageRank v priebehu rokov výrazne upravil. Princíp práce s odkazmi však zostáva súčasťou hodnotenia výsledkov. Neznamená to, že by sme mali SEO stavať len na získavaní odkazov. Kvalitný obsah, technický stav webu, užitočnosť stránky a dôveryhodnosť zdroja sú rovnako dôležité súčasti celého obrazu.

V praxi sa niekedy používajú metriky nástrojov tretích strán, napríklad Domain Rating od Ahrefs alebo Domain Authority od Mozu. Tieto hodnoty môžu pomôcť s orientačným porovnaním webov, ale nie sú súčasťou algoritmu Googlu. Nemožno ich teda zamieňať za skutočné hodnotenie webu vo vyhľadávaní.

Z hľadiska SEO je dôležitejšie premýšľať o tom, či web získava odkazy prirodzene, či má užitočný obsah a či naň odkazujú relevantné zdroje. PageRank nám pomáha pochopiť, prečo odkazy historicky hrali takú veľkú rolu.

Záver

Vyhľadávače fungujú v troch základných fázach: prechádzajú web, ukladajú informácie do indexu a radia výsledky podľa relevancie. Katalógy boli dôležité historicky, ale moderné vyhľadávanie stojí hlavne na automatickom prechádzaní a hodnotení obsahu. PageRank ukázal, že odkazy môžu fungovať ako odporúčania medzi stránkami. Dnes už jeho verejnú hodnotu nemeriame, ale princíp odkazovej autority zostáva pre SEO dôležitý.

V budúcej lekcii, SEO - Algoritmy Google a kvalita výsledkov , si vysvetlíme, ako algoritmy vyhľadávačov ovplyvňujú radenie výsledkov. Ukážeme si, ako súvisí relevancia, užitočný obsah, dôveryhodnosť zdroja a hlavné aktualizácie Googlu s tým, ktoré stránky sa zobrazia vo výsledkoch vyhľadávania.

Článok pre vás napísal David Hartinger

Užívateľské hodnotenie:

Ešte nikto nehodnotil, buď prvý!

David je zakladatelem ITnetwork a programování se profesionálně věnuje 15 let. Má rád Nirvanu, nemovitosti a svobodu podnikání.

David sa informačné technológie naučil na Unicorn University - prestížnej súkromnej vysokej škole IT a ekonómie.

Aktivity

Najčastejšie vyhľadávané