19. diel - Transformácia dát - Normalizácia a štandardizácia
V minulej lekcii, Čistenie dát, sme sa venovali čisteniu dát, teda identifikácii a odstraňovaniu chýb pri dátovej analýze.
V dnešnom tutoriáli Úvodu do dátovej analýzy sa zameriame na techniky normalizácie a štandardizácie. Nakoniec sa pozrieme na odľahlé hodnoty.
Motivácia
Pri analýze dát je dôležité, aby sme dáta mohli navzájom správne porovnávať. To nemusí byť jednoduché, ak majú rôzne stĺpce rôzne rozsahy hodnôt.
Normalizácia
Normalizácia je proces, ktorý nám pomáha upraviť dáta tak, aby boli v porovnateľnej mierke.
Min-max normalizácia
Najčastejšie používanou metódou normalizácie je min-max
normalizácia. Tá prevedie všetky hodnoty danej premennej tak, aby
najmenšia hodnota bola 0 a
najväčšia 1.
Príklad – Známky
Predstavme si, že máme sadu známok od 1 do 5:

Min-max normalizácia by známku 1 previedla na
...koniec náhľadu článku...
Pokračuj ďalej
Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Kúpiť iba tento kurz
Získaj okamžitý prístup ku kurzu bez
časového obmedzenia.
1 350 kreditov
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
- Prístup k jednotlivým lekciám podľa spôsobu obstarania.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
V tutoriáli dátovej analýzy sa zoznámime s transformáciou dát pomocou normalizácie a štandardizácie a s odľahlými hodnotami.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.