POSLEDNÁ ŠANCA: Získaj IT rekvalifikačný kurz za 0 € v rámci programu NPO. Dotácie končia už 9. 7.!
Zarábaj až 6 000 € mesačne! Akreditované rekvalifikačné kurzy od 0 €. Viac informácií.

16. diel - ChatGPT - Čistenie a anonymizácia dát Nové

V predchádzajúcej lekcii, ChatGPT - Praktické využitie na analýzu dát , sme si ukázali, ako pomocou ChatGPT generovať textové správy a triediť textové odpovede.

V dnešnej lekcii sa zameriame na to, ako ChatGPT pomáha s čistením dát, konkrétne so zjednotením, kategorizáciou a opravou textových údajov. Ručná úprava dát býva zdĺhavá. ChatGPT umožňuje rýchlo a bez programovania odstrániť nekonzistencie, opraviť preklepy a zjednotiť výrazy. Stačí jasne zadať požiadavku v prirodzenom jazyku.

Zjednotenie názvov

Užívateľ zadal zoznam názvov miest, ktoré obsahujú rôzne varianty zápisu (napr. rôzne veľkosti písmen, preklepy alebo doplnkové informácie ako číslovky). Cieľom bolo zjednotiť tieto názvy do jednotného formátu tak, aby každé mesto bolo reprezentované iba jednou štandardizovanou verziou (Praha, Brno, Ostrava). Funkčnosť si prvýkrát vyskúšame na jednoduchom príklade, čistenie väčšej tabuľky dát si ukážeme na konci lekcie:

Představme si, že máme data se stejnými názvy měst, ale v různých variantách a s chybami:

Původní záznam
Praha
praha
Praha 1
Brno
brno
BRNO
Ostrava
ostava (překlep)

Sjednoť tyto názvy měst do jednotného tvaru (Praha, Brno, Ostrava)!

Výsledok:


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh iba za 375 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 22 článkom (22 lekcií) tohoto kurzu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tutoriále si ukážeme, ako využiť ChatGPT pri čistení a príprave dát – najmä pri identifikácii kategórií, zjednotení výrazov a návrhoch pravidiel.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Jan Rypáček
Avatar
Jan Rypáček
Aktivity