12. diel - Rozdelenie dát - Základné rozdelenie
V minulej lekcii, Úvod do štatistiky - Miery variability, sme sa zoznámili so základnými štatistickými ukazovateľmi, ako sú rozptyl a smerodajná odchýlka.
V tejto lekcii sa pozrieme na to, ako sa dáta rozprestierajú, a zameriame
sa na takzvané normálne (Gaussovo) rozdelenie. Na rozdiel od
ukazovateľov z minulej lekcie, ktoré boli len jedným číslom opisujúcim
vzorku, sa teraz sústredíme na opis rozdelenia vzorky graficky. Je to ďalší
spôsob, ako sa o skúmaných dátach môžeme dozvedieť viac. A my ako
analytici o dátach samozrejme chceme vedieť maximum 
Ako rozdelenie dát ovplyvňuje analýzu
V dátovej analýze sa často zaujímame o to, ako sú hodnoty v našom súbore rozprestreté. Niektoré veličiny majú väčšinu hodnôt sústredenú okolo stredu, iné sú výrazne asymetrické alebo majú extrémne odchýlky. Tomu hovoríme rozdelenie dát. Rozdelenie ovplyvňuje nielen to, ako dáta vizualizujeme, ale hlavne aké metódy môžeme použiť – napríklad či môžeme počítať priemer, aplikovať štatistické testy alebo modelovať vzťahy medzi premennými.
Normálne rozdelenie a jeho typický tvar
Jedným z najbežnejších rozdelení dát je takzvané normálne rozdelenie, často označované aj ako Gaussovo. Vyznačuje sa tým, že väčšina hodnôt sa sústreďuje okolo priemeru, zatiaľ čo smerom k okrajom ich početnosť rýchlo klesá. Na grafe tak vzniká charakteristická zvonová krivka, ktorá je symetrická voči stredu. Ak dáta sledujú normálne rozdelenie, môžeme pri nich ľahko vykonávať odhady a používať bežné štatistické metódy.
Zvonová krivka ilustrujúca normálne rozdelenie:
...koniec náhľadu článku...
Pokračuj ďalej
Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Kúpiť iba tento kurz
Získaj okamžitý prístup ku kurzu bez
časového obmedzenia.
1 350 kreditov
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
- Prístup k jednotlivým lekciám podľa spôsobu obstarania.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
V tutoriáli dátovej analýzy sa pozrieme na to, ako sa dáta rozprestierajú, a zameriame sa na tzv. normálne (Gaussovo) rozdelenie.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.