19. diel - Filtrovanie dát
V predchádzajúcej lekcii, Vytváranie funkcií typu ufunc a práca s nimi , sme sa naučili vytvárať vlastné
funkcie typu ufunc
a tiež sme si ukázali použitie funkcií
reduce()
a accumulate()
, ktoré ďalej rozširujú
možnosti použitia ufunc
.
V nasledujúcom tutoriále knižnice NumPy v Pythone si vysvetlíme postup pri filtrovaní hodnôt polí pomocou polí booleovských hodnôt. Ukážeme si možnosti, ktoré nám v tomto prípade dáva knižnica NumPy.
Filtrovanie dát
Začneme tým, že si ujasníme pojem „filtrovanie“. Princíp filtrovania v základe implementuje aj natívny Python a často sa s ním stretneme aj pri používaní knižnice Pandas. Najlepšie si filtrovanie vysvetlíme na príklade z dátovej vedy. Majme teda niekoľko polí, kedy každé obsahuje iný typ hodnôt. Dohromady vytvárajú takú malú "databázovú" tabuľku. Napríklad mená študentov v triede a dátumy ich narodenia:
studenti_jmena = np.array([ 'Terka', 'Jakub', 'Evžen' ]) studenti_rok = np.array([ 2006, 2005, 2006 ])
Teraz budeme chcieť nájsť len študentov, ktorí sa narodili v roku 2006.
Na to slúži práve filtrovanie. Vytvoríme pole rovnakej dĺžky, ako je
počet položiek v originálnom poli, ale na každú pozíciu pomocou
True/False
doplníme, či spĺňa našu podmienku. Pomocou tohto
boolean poľa potom jednoducho "profiltrujeme" originálne pole a vytvoríme
nové. To už bude mať iba požadované hodnoty. Pre našu konkrétnu
minidatabázu chceme dosiahnuť hodnoty [True, False, True]
. Je
viac spôsobov, ako takéto pole vytvoriť. Ukážeme si dva jednoduché:
...koniec náhľadu článku...
Pokračuj ďalej
Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Kúpiť tento kurz
Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
- Neobmedzený a trvalý prístup k jednotlivým lekciím.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
V tutoriále knižnice NumPy si vysvetlíme postup pri filtrovaní hodnôt polí pomocou polí booleovských hodnôt.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.