18. diel - Deep Q-learning v Pythone
V minulej lekcii, Q-Learning v Pythone , sme si ukázali Q-Learning v Pythone na príklade MountainCar.
Motivácia
V minulom článku sme vytvorili Q-learning algoritmus, ktorý sa zvládol naučiť MountainCar. Aj keď to tak vyzerať nemusí, v porovnaní s inými hrami išlo o veľmi jednoduché prostredie, v ktorom nám stačilo poznať len dve informácie – rýchlosť a pozícia agenta. V takom jednoduchom prípade nám naozaj stačí jednoduchá tabuľka na udržanie hodnôt kvality jednotlivých a
...koniec náhľadu článku...
Pokračuj ďalej
Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.
Kúpiť iba tento kurz
Získaj okamžitý prístup ku kurzu bez
časového obmedzenia.
675 kreditov
Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.
- Prístup k jednotlivým lekciám podľa spôsobu obstarania.
- Kvalitné znalosti v oblasti IT.
- Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.
Popis článku
Požadovaný článok má nasledujúci obsah:
Popis a tvorba vlastného DQN (Deep Q-Learning) algoritmu v Pythone a jeho využitie pre Cartpole prostredie v OpenAI Gym.
Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.
