Mikuláš je tu! Získaj 90 % extra kreditov ZADARMO s promo kódom CERTIK90 pri nákupe od 1 199 kreditov. Len do nedele 7. 12. 2025! Zisti viac:
NOVINKA: Najžiadanejšie rekvalifikačné kurzy teraz s 50% zľavou + kurz AI ZADARMO. Nečakaj, táto ponuka dlho nevydrží! Zisti viac:

17. diel - Transformácia dát - Normalizácia a štandardizácia

V predchádzajúcej lekcii, Štatistická analýza v biznise - Hypotézy a regresie , sme sa venovali testovaniu hypotéz a regresnej analýze.

V dnešnom tutoriále Úvodu do dátovej analýzy sa zameriame na techniky normalizácie a štandardizácie. Pri analýze dát je dôležité, aby sme dáta mohli navzájom správne porovnávať. To nemusí byť jednoduché, ak majú rôzne stĺpce rôzne rozsahy hodnôt.

Normalizácia

Normalizácia je proces, ktorý nám pomáha upraviť dáta tak, aby boli v porovnateľnom meradle.

Predstavme si, že máme dáta o priemernej mesačnej mzde v rôznych krajoch a zároveň priemerné náklady na bývanie v týchto krajoch. Obe čísla sú v rovnakej mene, takže sa ponúka ich porovnať. Sú ale v rôznom rozsahu – mzdy sa pohybujú napríklad medzi 25 000 a 45 000 Sk, zatiaľ čo náklady na bývanie medzi 8 000 a 20 000 Sk. Aby sme ich mohli spravodlivo analyzovať, napríklad pri výpočte dostupnosti bývania, musíme ich normalizovať do rovnakého rozsahu, napríklad 01.

Normalizácia nám umožní tieto dáta zjednotiť, aby sme ich mohli efektívnejšie analyzovať a porovnávať.

Min-Max normalizácia

Najčastejšie používanou metódou normalizácie je Min-Max normalizácia. Tá prevedie všetky hodnoty v dátach tak, aby najmenšia hodnota bola 0 a najväčšia 1. Predstavme si, že máme sadu známok od 1 do 5. Min-Max normalizácia by známku 1 previedla na 0, známku 5 na 1 a ostatné známky na hodnoty medzi 0 a 1 (napr. známka 3 by bola 0,5). Týmto spôsobom sa všetky dáta zjednotia do rovnakého rozsahu. To je užitočné, keď chceme porovnať hodnoty v inom meradle, napr. s inou školou, kde je hodnotenie v percentách a tiež by 1 0


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh iba za 1 350 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 45 článkom (31 lekcií, 7 testov, 7 praktických cvičení) tohoto kurzu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tutoriále dátovej analýzy sa zoznámime s transformáciou dát pomocou normalizácie a štandardizácie as odľahlými hodnotami.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Jan Rypáček
Avatar
Jan Rypáček
Aktivity