Mikuláš je tu! Získaj 90 % extra kreditov ZADARMO s promo kódom CERTIK90 pri nákupe od 1 199 kreditov. Len do nedele 7. 12. 2025! Zisti viac:
NOVINKA: Najžiadanejšie rekvalifikačné kurzy teraz s 50% zľavou + kurz AI ZADARMO. Nečakaj, táto ponuka dlho nevydrží! Zisti viac:

26. diel - NumPy - Filtrovanie dát

V predchádzajúcej lekcii, NumPy - Výber dát - Pohľad a kópie, sme si vysvetlili rozdiel medzi pohľadmi a kópiami pri slicingu v NumPy.

V dnešnom tutoriáli knižnice NumPy v Pythone si vysvetlíme postup pri filtrovaní hodnôt polí pomocou polí booleovských hodnôt. Porovnávame si filtrovanie natívnym Pythonom s filtrovaním pomocou knižnice NumPy.

Filtrovanie natívnym Pythonom

Začneme tým, že si ujasníme pojem filtrovanie dát. Princíp filtrovania v základe implementuje aj natívny Python a často sa s ním stretneme aj pri použití knižnice Pandas. Najlepšie si filtrovanie vysvetlíme na príklade z dátovej vedy.

Príklad

Majme teda niekoľko polí, kedy každé obsahuje iný typ hodnôt. Dohromady vytvárajú takú malú "databázovú" tabuľku. Napríklad mená študentov v triede a dátumy ich narodenia:

students_names = np.array([
                            'Emily',
                            'James',
                            'Oliver'
                        ])

students_year = np.array([
                            2006,
                            2005,
                            2006
                        ])

Teraz budeme chcieť nájsť len študentov, ktorí sa narodili v roku 2006. Na to slúži práve filtrovanie.

V natívnom Pythone si vytvoríme zoznam booleovských hodnôt (list) rovnakej dĺžky, ako je počet položiek v pôvodnom poli. Na každú pozíciu zoznamu doplníme True alebo False podľa toho, či hodnota spĺňa našu podmienku. Pomocou tohto boolean zoznamu potom môžeme filtrovať pôvodné dáta.

Pre našu konkrétnu minidatabázu chceme dosiahnuť hodnoty [True, False, True]. Je viac spôsobov, ako takýto zoznam vytvoriť. Ukážeme si dva spôsoby:


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom iba za 1 325 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 36 článkom (28 lekcií, 8 testov) tohoto kurzu.

Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tutoriáli knižnice NumPy v Pythone si vysvetlíme postup pri filtrovaní hodnôt polí pomocou polí booleovských hodnôt.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Miloš Halda
Avatar
Autor se věnuje především bioinformatice a s ní souvisejícím tématům. Nevyhýbá se OOP jazykům, statistice a nástrojům pro analýzu dat.
Aktivity