NOVINKA: Kurz kybernetickej bezpečnosti teraz už od 0 €. Staň sa žiadaným profesionálom. Zisti viac:
NOVINKA: Staň sa dátovým analytikom od 0 € a získaj istotu práce, lepší plat a nové kariérne možnosti. Viac informácií:

10. diel - Shlukovací algoritmus K-Means v Pythone

V minulej lekcii, Les rozhodovacích stromov v Pythone , sme sa v našom kurze venovali lesu rozhodovacích stromov. V tomto tutoriále o strojovom učení sa pozrieme na algoritmus z rodiny algoritmov "učenie bez dohľadu" a tým je K-Means. Tento algoritmus nepotrebuje poznať náš požadovaný výstup, ale postupným iterováním rozdelí dáta do K skupín, čo je parameter, ktorý definujeme. Týmto spôsobom môže algoritmus nájsť ďalšie vzory alebo vzťahy v dátach, ktorých si nemusíme ani všimnúť.

K-Means môžeme využiť v reálnom svete napríklad k rozdeleniu zákazníkov do K skupín, kde každá skupina bude mať vždy niečo spoločné (napr. Tí, čo nakupujú topánky, čo nakupujú pravidelne, sviatočné nakupovacích, šetřílci, ...). Jediný problém je, že vám algoritmus ukáže len kto do akej skupiny patria, ale nie čo majú za unikátnu vlastnosť / čo majú spoločné. To tiež uvidíme v praktickej ukážke v Pythone.

Ako funguje shlukovací algoritmus K-Means

Povedzme, že máme nasledujúce body a chceme ich rozdeliť do K skupín. Metódou KV (pozriem a vidím) si môžeme všimnú, že sú tu 2 skupiny bodov a môžeme ich jednoducho rozdeliť:

Skupiny vyzerajú takto:

Centroid

Algoritmus K-Means ale nevie, koľko je tu potenciálnych skupín ani kde každá z nich leží. Každá skupina (ich počet definuje parameter K) má svoj Centroid, čo je


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Prístup k jednotlivým lekciám podľa spôsobu obstarania.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V Python tutoriále si predstavíme algoritmus K-Means z rodiny algoritmov Učenie bez dohľadu. Rozdelíme si pomocou neho Iris dataset a otestujeme jeho presnosť.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal MQ .
Avatar
Používám hlavně Python a zajímám se o Deep Learning a vše kolem.
Aktivity