Mikuláš je tu! Získaj 90 % extra kreditov ZADARMO s promo kódom CERTIK90 pri nákupe od 1 199 kreditov. Len do nedele 7. 12. 2025! Zisti viac:
NOVINKA: Najžiadanejšie rekvalifikačné kurzy teraz s 50% zľavou + kurz AI ZADARMO. Nečakaj, táto ponuka dlho nevydrží! Zisti viac:

11. diel - Rozdelenie dát - Základné rozdelenie

V predchádzajúcom kvíze, Kvíz - Dátové formáty, databázy a životný cyklus dát, sme si overili nadobudnuté skúsenosti z predchádzajúcich lekcií.

V tejto lekcii sa pozrieme na to, ako sa dáta rozprestierajú, a zameriame sa na takzvané normálne (Gaussovo) rozdelenie. Na rozdiel od ukazovateľov z minulej lekcie, ktoré boli len jedným číslom popisujúcim vzorku, sa teraz zameriame na opis rozdelenia vzorky graficky. To je ďalší spôsob, ako sa o skúmaných dátach dozvieme viac. A my ako analytici o dátach samozrejme chceme vedieť maximum :)

Ako rozdelenie dát ovplyvňuje analýzu

V dátovej analýze sa často zaujímame o to, ako sú hodnoty v našom súbore rozprestreté. Niektoré veličiny majú väčšinu hodnôt sústredenú okolo stredu, iné sú výrazne asymetrické alebo majú extrémne odchýlky. Tomu hovoríme rozdelenie dát. Rozdelenie ovplyvňuje nielen to, ako dáta vizualizujeme, ale hlavne aké metódy môžeme použiť – napríklad, či môžeme počítať priemer, aplikovať štatistické testy alebo modelovať vzťahy medzi premennými.

Normálne rozdelenie a jeho typický tvar

Jedným z najbežnejších rozdelení dát je takzvané normálne rozdelenie, často označované aj ako Gaussovo. Vyznačuje sa tým, že väčšina hodnôt sa sústredí okolo priemeru, zatiaľ čo smerom k okrajom ich frekvencia rýchlo klesá. Na grafe tak vzniká charakteristická zvonová krivka, ktorá je symetrická voči stredu. Pokiaľ dáta sledujú normálne rozdelenie, môžeme o nich ľahko robiť odhady a používať bežné štatistické metódy.

Zvonová krivka ilustrujúca normálne rozdelenie:


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh iba za 1 350 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 45 článkom (31 lekcií, 7 testov, 7 praktických cvičení) tohoto kurzu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tutoriále dátovej analýzy sa pozrieme na to, ako sa dáta rozprestierajú, a zameriame sa na tzv. normálne (Gaussovo) rozdelenie.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Jan Rypáček
Avatar
Jan Rypáček
Aktivity