26. diel - NumPy - Filtrovanie dát
V predchádzajúcej lekcii, NumPy - Výber dát - Pohľad a kópie, sme si vysvetlili rozdiel medzi pohľadmi a kópiami pri slicingu v NumPy.
V dnešnom tutoriáli knižnice NumPy v Pythone si vysvetlíme postup pri filtrovaní hodnôt polí pomocou polí booleovských hodnôt. Porovnávame si filtrovanie natívnym Pythonom s filtrovaním pomocou knižnice NumPy.
Filtrovanie natívnym Pythonom
Začneme tým, že si ujasníme pojem filtrovanie dát. Princíp filtrovania v základe implementuje aj natívny Python a často sa s ním stretneme aj pri použití knižnice Pandas. Najlepšie si filtrovanie vysvetlíme na príklade z dátovej vedy.
Príklad
Majme teda niekoľko polí, kedy každé obsahuje iný typ hodnôt. Dohromady vytvárajú takú malú "databázovú" tabuľku. Napríklad mená študentov v triede a dátumy ich narodenia:
students_names = np.array([
'Emily',
'James',
'Oliver'
])
students_year = np.array([
2006,
2005,
2006
])
Teraz budeme chcieť nájsť len študentov, ktorí sa narodili v roku
2006. Na to slúži práve filtrovanie.
V natívnom Pythone si vytvoríme zoznam booleovských
hodnôt (list) rovnakej dĺžky, ako je počet položiek v
pôvodnom poli. Na každú pozíciu zoznamu doplníme True alebo
False podľa toho, či hodnota spĺňa našu podmienku. Pomocou
tohto boolean zoznamu potom môžeme filtrovať pôvodné dáta.
Pre našu konkrétnu minidatabázu chceme dosiahnuť hodnoty
[True, False, True]. Je viac spôsobov, ako takýto zoznam
vytvoriť. Ukážeme si dva spôsoby:
...koniec náhľadu článku...
Pokračuj ďalej
Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Kúpiť tento kurz
Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
- Neobmedzený a trvalý prístup k jednotlivým lekciím.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
V tutoriáli knižnice NumPy v Pythone si vysvetlíme postup pri filtrovaní hodnôt polí pomocou polí booleovských hodnôt.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.