Mikuláš je tu! Získaj 90 % extra kreditov ZADARMO s promo kódom CERTIK90 pri nákupe od 1 199 kreditov. Len do nedele 7. 12. 2025! Zisti viac:
NOVINKA: Najžiadanejšie rekvalifikačné kurzy teraz s 50% zľavou + kurz AI ZADARMO. Nečakaj, táto ponuka dlho nevydrží! Zisti viac:

14. diel - LLM - Dátové korpusy

V predchádzajúcej lekcii, LLM - Princíp fungovania a architektúra, sme hovorili o princípe fungovania LLM, zbere dát, tréningu, optimalizácii a architektúre.

V tejto lekcii umelej inteligencie si predstavíme zostavovanie dátových korpusov pre LLM. Zameriame sa na kľúčové faktory, ktoré ovplyvňujú kvalitu a efektivitu dátových korpusov, vrátane kvality a rôznorodosti dát, etiky, anotácie, validácie a generovania syntetických dát.

Dátové korpusy pre LLM

Dátové korpusy sú súbory textových alebo multimediálnych dát, ktoré využívame na vývoj a trénovanie technológií NLP. Korpusy umožňujú vyhodnotiť presnosť a výkonnosť jazykových modelov na základe reálnych dát. Lingvisti využívajú korpusy na analýzu a štúdium jazykových štruktúr, frekvencie slov, idiómov a iných jazykových javov.

Dátový korpus - Základy umelej inteligencie

Zber dát

Zber dát na tvorbu dátových korpusov je kľúčovým krokom, ktorý výrazne ovplyvňuje kvalitu a použiteľnosť korpusu. Existuje niekoľko metód zberu dát:


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Obmedzená ponuka: Nauč sa všetko a ušetri

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom za exkluzívnu cenu 945 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto výhodného balíčku získaš prístup ku všetkým 29 článkom (17 lekcií, 7 testov, 5 praktických cvičení) s kontrolou a certifikáciou a ešte naviac ušetríš 106 Kč. Ponuka je časovo obmedzená a platí pro všetky lekcie v kurze. Nakúp teraz a získaj limitovanou 10% zľavu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tejto lekcii umelej inteligencie si vysvetlíme, ako sa zostavujú dátové korpusy pre LLM. Pozrieme sa aj na výpočtové zdroje.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísala Natálie Růžičková
Avatar
Autorka je odbornicí na digitální marketing, umělou inteligenci a specializuje se také na UX/UI Design a tvorbu webů. Její oblíbenou disciplínou je SEO a práce s AI. Zajímá ji také programování.
Aktivity