NOVINKA: Kurz kybernetickej bezpečnosti teraz už od 0 €. Staň sa žiadaným profesionálom. Zisti viac:
NOVINKA: Staň sa dátovým analytikom od 0 € a získaj istotu práce, lepší plat a nové kariérne možnosti. Viac informácií:

2. diel - Import dát do nástroja Power BI

V predchádzajúcej lekcii, Úvod do dátovej analytiky s Power Query a Power BI, sme sa zoznámili so základmi dátovej analytiky, jej využitím v praxi a možnosťami nástrojov Power BI a Power Query pre prácu s dátami.

V tomto tutoriáli si ukážeme rôzne spôsoby, ako importovať dáta do nástroja Power BI.

Import dát do nástroja Power BI

Práca s dátami sa často začína ich získaním a úpravou do podoby vhodnej na ďalšiu analýzu. Na to slúži nástroj Power Query, ktorý umožňuje nielen import dát z rôznych zdrojov, ale aj ich čistenie a transformáciu.

Medzi bežné operácie pri úprave dát patria:

  • odstránenie neplatných alebo duplicitných hodnôt,
  • zlúčenie dát z viacerých tabuliek,
  • filtrovanie podľa rôznych kritérií,
  • zmena dátových typov či premenovanie stĺpcov.

Vďaka týmto úpravám získame konzistentné a spoľahlivé dáta, ktoré sú pripravené na analýzu a vizualizáciu v Power BI.

Inštalácia Power BI Desktop

Najprv si nainštalujme Power BI Desktop, teda bezplatnú desktopovú verziu nástroja Power BI. Táto verzia je vhodná na prácu na vlastnom počítači a nevyžaduje pripojenie k internetu ani konto Microsoft.

Ak by sme chceli využívať cloudovú verziu Power BI Service, je potrebné mať konto Microsoft. Okrem toho existujú aj platené varianty (napríklad Power BI Pro), ale v tejto lekcii si vystačíme s bezplatnou verziou pre Windows.

Ak vlastníte Mac, je najprv nutné nainštalovať virtuálny Windows a ďalší postup vykonávať v ňom.

Inštalačný súbor si stiahneme z oficiálnych stránok Microsoftu. Po otvorení odkazu sa zobrazí nasledujúca stránka:

Stránka na stiahnutie Power BI - Dátová analýza s Power BI

Vyberieme jazyk a klikneme na tlačidlo Download. Po stiahnutí spustíme inštalačný program. Opäť vyberieme jazyk, umiestnenie inštalácie a prejdeme jednotlivé kroky sprievodcu až do dokončenia inštalácie.

Import dát z rôznych zdrojov

Pri práci s dátami často potrebujeme čerpať informácie z rôznych zdrojov. To môže zahŕňať súbory, databázy alebo webové služby. Power BI nám umožňuje efektívne načítavať dáta zo širokej škály formátov a následne ich transformovať do podoby vhodnej na ďalšiu analýzu.

Import dát predstavuje prvý krok pri príprave dátového modelu. Umožňuje nám zjednotiť rôzne zdroje do jednej štruktúry, s ktorou môžeme ďalej pracovať v Power BI.

Power BI podporuje import z celého radu dátových zdrojov, napríklad:

  • Excel – Pri importe z Excelu je možné vyberať jednotlivé listy alebo definované tabuľky. Vďaka tomu možno jednoducho spracovávať dáta z existujúcich reportov či exportovaných tabuliek.
  • CSV – Textový formát, ktorý je vhodný na prenos dát z rôznych aplikácií. Pri načítavaní je dôležité správne nastaviť oddeľovač, napríklad čiarku alebo bodkočiarku.
  • SQL databázy – Pri pripojení k databáze je možné použiť SQL dotazy na filtrovanie dát už pri importe. To je užitočné najmä pri práci s veľkými objemami dát, keď nie je efektívne načítavať všetky dáta naraz.

Po importe môžeme dáta upraviť v nástroji Power Query, ktorý nám umožní odstrániť nepotrebné stĺpce, zjednotiť formáty alebo upraviť štruktúru tabuliek podľa našich potrieb.

Import dát z Excelu

V tejto časti si vyskúšame, ako importovať dáta z Excelu do Power BI. Otvoríme Power BI a zvolíme možnosť Excel workbook:

Import dát z Excelu - Dátová analýza s Power BI

Vyberieme pripravený súbor s dátami o predajoch, ktorý je na stiahnutie na konci tejto lekcie, a klikneme na Open:

Výber excelového súboru na import - Dátová analýza s Power BI

Zobrazí sa okno s prehľadom dostupných listov v Exceli. Na každom liste sa nachádzajú dáta, ktoré predstavujú samostatné tabuľky so súvisiacimi záznamami.

Ak súbor obsahuje osobné údaje (napr. mená, e-maily, adresy), je dôležité tieto dáta v reálnom projekte anonymizovať. V rámci tohto kurzu ponechávame dáta v pôvodnej podobe na účely výučby, ale anonymizácia je dôležitým bezpečnostným opatrením. Viac o bezpečnosti dát nájdete v lekcii Bezpečnosť dát a ich ochrana pred zneužitím.

Vyberieme všetky tabuľky, ktoré chceme importovať, a klikneme na Load:

Výber jednotlivých excelových tabuliek - Dátová analýza s Power BI

Po načítaní sa dáta objavia v Power BI a môžeme s nimi ďalej pracovať – napríklad ich prezerať, upravovať alebo vizualizovať v rámci zostavy.

Import dát z CSV

Súbor vo formáte CSV (Comma Separated Values) sa bežne používa na export dát z rôznych systémov. Pri importe CSV je dôležité správne nastaviť oddeľovač dát, ktorým môže byť čiarka, bodkočiarka alebo tabulátor.

Postup importu je veľmi podobný ako pri Exceli. Najprv otvoríme Power BI a zvolíme možnosť Get data from other sources:

Import dát z iného zdroja - Dátová analýza s Power BI

Z ponuky vyberieme Text/CSV a klikneme na Connect:

Výber dátového zdroja CSV - Dátová analýza s Power BI

Otvorí sa okno na výber súboru. Vyberieme požadovaný CSV súbor z archívu tejto lekcie a klikneme na Open:

Výber CSV súboru - Dátová analýza s Power BI

Zobrazí sa okno, kde môžeme vidieť jazykovú sadu, ktorú CSV súbor používa, a oddeľovač, ktorým je bodkočiarka:

Výber oddeľovača CSV súboru - Dátová analýza s Power BI

Ak všetko zodpovedá, klikneme na Load a dáta sa načítajú do Power BI.

Môžeme si všimnúť, že týmto spôsobom sme importovali iba jedinú tabuľku customers.csv. Ak by sme chceli importovať všetky tabuľky naraz, ako to bolo pri importe z Excelu, museli by sme mať všetky tabuľky v jedinom CSV a oddeliť ich nejakým novým stĺpcom, napr. record_type.

Ukážme si ešte, čo by sa stalo, keby sme zvolili nesprávny oddeľovač:

Použitie nesprávneho oddeľovača CSV súboru - Dátová analýza s Power BI

Všetky dáta by boli rozhádzané v jednom stĺpci. Na správnom nastavení oddeľovača teda veľmi záleží.

Import dát zo SQL databázy

Priame pripojenie k databáze umožňuje efektívne pracovať s veľkými objemami dát bez nutnosti ich ručného exportu do súborov. Teraz si ukážeme, ako môžeme importovať dáta zo SQL Servera priamo do Power BI.

Znovu otvoríme Power BI a klikneme na možnosť SQL Server:

Výber SQL zdroja - Dátová analýza s Power BI

Zobrazí sa dialógové okno, kam zadáme názov servera a názov databázy. Napríklad môžeme použiť server (LocalDB)\MSSQLLocalDB a databázu s názvom sales:

Výber servera a databázy - Dátová analýza s Power BI

Predpokladom je mať vytvorenú nejakú databázu. To môžeme urobiť v nástroji SSMS (SQL Server Management Studio) alebo vo Visual Studiu pomocou SQL Server Object Exploreru.

Ak nezadáme názov databázy, Power BI nám zobrazí zoznam všetkých dostupných databáz na danom serveri a budeme si môcť vybrať tú, ktorú chceme použiť.

Použitie LocalDB

LocalDB je špeciálna verzia SQL Servera určená pre vývojárov, ktorá beží lokálne na našom počítači bez nutnosti zložitej inštalácie servera. MSSQLLocalDB je predvolená inštancia SQL LocalDB, ktorá sa vytvorí automaticky pri inštalácii. Použitie LocalDB je ideálne na testovanie, výučbu či vývoj aplikácií v menšom rozsahu.

Viac sa o MS-SQL dozviete v kurze MS-SQL databázy krok za krokom.

Po zadaní údajov na pripojenie zvolíme možnosť Use my current credentials a klikneme na Connect:

Nastavenie prihlásenia k SQL serveru - Dátová analýza s Power BI

Po úspešnom pripojení sa zobrazí okno s možnosťou výberu tabuliek. Môžeme opäť vybrať všetky alebo len nejakú konkrétnu a potvrdíme tlačidlom Load:

Výber SQL tabuliek - Dátová analýza s Power BI

Power Query si staré dáta ukladá do medzipamäte. Ak si takto načítame dáta z tej istej databázy, ktorú potom upravíme, môže sa stať, že dáta nebudú súhlasiť. V takom prípade je potrebné kliknúť na malú ikonu v pravom hornom rohu, aby sme stiahli aktuálne dáta z databázy.

Zobrazenie dát po importe

Nech už sme dáta importovali akýmkoľvek spôsobom, môžeme si ich v Power BI zobraziť tlačidlom Zobrazenie tabuľky:

Zobrazenie importu v Power BI - Dátová analýza s Power BI

V tomto zobrazení môžeme prechádzať jednotlivé tabuľky a prezerať si ich obsah. Ak by sme chceli otvoriť niektorú z tabuliek v nástroji Power Query, klikneme na ňu pravým tlačidlom myši na karte Data a zvolíme možnosť Edit query, čím sa otvorí Power Query Editor:

Ponuka zobrazenia v editore Power Query - Dátová analýza s Power BI

Nástroj Power Query sa nám pri importe neotvoril okamžite, pretože sme zvolili možnosť Load. Ak by sme chceli dáta začať upravovať ihneď po importe, vybrali by sme namiesto toho tlačidlo Transform Data:

Voľba Transformovať dáta na otvorenie Power Query - Dátová analýza s Power BI

Tým sme si ukázali základné postupy na načítanie a zobrazenie dát v Power BI Desktop. Teraz už vieme, ako dáta nielen načítať, ale aj sprístupniť na ďalšie úpravy v editore Power Query.

V nasledujúcej lekcii, Zoznámenie s Power Query a úvod do čistenia dát, sa dozvieme, prečo je dôležité dáta čistiť, a zoznámime sa s prostredím editora Power Query.


 

Mal si s čímkoľvek problém? Stiahni si vzorovú aplikáciu nižšie a porovnaj ju so svojím projektom, chybu tak ľahko nájdeš.

Stiahnuť

Stiahnutím nasledujúceho súboru súhlasíš s licenčnými podmienkami

Stiahnuté 2x (29.02 kB)
Aplikácia je vrátane zdrojových kódov

 

Predchádzajúci článok
Úvod do dátovej analytiky s Power Query a Power BI
Všetky články v sekcii
Dátová analýza s Power BI
Preskočiť článok
(neodporúčame)
Zoznámenie s Power Query a úvod do čistenia dát
Článok pre vás napísal Adam Hamšík
Avatar
Užívateľské hodnotenie:
Ešte nikto nehodnotil, buď prvý!
.
Aktivity