2. diel - Import dát do nástroja Power BI
V predchádzajúcej lekcii, Úvod do dátovej analytiky s Power Query a Power BI, sme sa zoznámili so základmi dátovej analytiky, jej využitím v praxi a možnosťami nástrojov Power BI a Power Query pre prácu s dátami.
V tomto tutoriáli si ukážeme rôzne spôsoby, ako importovať dáta do nástroja Power BI.
Import dát do nástroja Power BI
Práca s dátami sa často začína ich získaním a úpravou do podoby vhodnej na ďalšiu analýzu. Na to slúži nástroj Power Query, ktorý umožňuje nielen import dát z rôznych zdrojov, ale aj ich čistenie a transformáciu.
Medzi bežné operácie pri úprave dát patria:
- odstránenie neplatných alebo duplicitných hodnôt,
- zlúčenie dát z viacerých tabuliek,
- filtrovanie podľa rôznych kritérií,
- zmena dátových typov či premenovanie stĺpcov.
Vďaka týmto úpravám získame konzistentné a spoľahlivé dáta, ktoré sú pripravené na analýzu a vizualizáciu v Power BI.
Inštalácia Power BI Desktop
Najprv si nainštalujme Power BI Desktop, teda bezplatnú desktopovú verziu nástroja Power BI. Táto verzia je vhodná na prácu na vlastnom počítači a nevyžaduje pripojenie k internetu ani konto Microsoft.
Ak by sme chceli využívať cloudovú verziu Power BI Service, je potrebné mať konto Microsoft. Okrem toho existujú aj platené varianty (napríklad Power BI Pro), ale v tejto lekcii si vystačíme s bezplatnou verziou pre Windows.
Ak vlastníte Mac, je najprv nutné nainštalovať virtuálny Windows a ďalší postup vykonávať v ňom.
Inštalačný súbor si stiahneme z oficiálnych stránok Microsoftu. Po otvorení odkazu sa zobrazí nasledujúca stránka:

Vyberieme jazyk a klikneme na tlačidlo Download. Po stiahnutí spustíme inštalačný program. Opäť vyberieme jazyk, umiestnenie inštalácie a prejdeme jednotlivé kroky sprievodcu až do dokončenia inštalácie.
Import dát z rôznych zdrojov
Pri práci s dátami často potrebujeme čerpať informácie z rôznych zdrojov. To môže zahŕňať súbory, databázy alebo webové služby. Power BI nám umožňuje efektívne načítavať dáta zo širokej škály formátov a následne ich transformovať do podoby vhodnej na ďalšiu analýzu.
Import dát predstavuje prvý krok pri príprave dátového modelu. Umožňuje nám zjednotiť rôzne zdroje do jednej štruktúry, s ktorou môžeme ďalej pracovať v Power BI.
Power BI podporuje import z celého radu dátových zdrojov, napríklad:
- Excel – Pri importe z Excelu je možné vyberať jednotlivé listy alebo definované tabuľky. Vďaka tomu možno jednoducho spracovávať dáta z existujúcich reportov či exportovaných tabuliek.
- CSV – Textový formát, ktorý je vhodný na prenos dát z rôznych aplikácií. Pri načítavaní je dôležité správne nastaviť oddeľovač, napríklad čiarku alebo bodkočiarku.
- SQL databázy – Pri pripojení k databáze je možné použiť SQL dotazy na filtrovanie dát už pri importe. To je užitočné najmä pri práci s veľkými objemami dát, keď nie je efektívne načítavať všetky dáta naraz.
Po importe môžeme dáta upraviť v nástroji Power Query, ktorý nám umožní odstrániť nepotrebné stĺpce, zjednotiť formáty alebo upraviť štruktúru tabuliek podľa našich potrieb.
Import dát z Excelu
V tejto časti si vyskúšame, ako importovať dáta z Excelu do Power BI. Otvoríme Power BI a zvolíme možnosť Excel workbook:

Vyberieme pripravený súbor s dátami o predajoch, ktorý je na stiahnutie na konci tejto lekcie, a klikneme na Open:

Zobrazí sa okno s prehľadom dostupných listov v Exceli. Na každom liste sa nachádzajú dáta, ktoré predstavujú samostatné tabuľky so súvisiacimi záznamami.
Ak súbor obsahuje osobné údaje (napr. mená, e-maily, adresy), je dôležité tieto dáta v reálnom projekte anonymizovať. V rámci tohto kurzu ponechávame dáta v pôvodnej podobe na účely výučby, ale anonymizácia je dôležitým bezpečnostným opatrením. Viac o bezpečnosti dát nájdete v lekcii Bezpečnosť dát a ich ochrana pred zneužitím.
Vyberieme všetky tabuľky, ktoré chceme importovať, a klikneme na Load:

Po načítaní sa dáta objavia v Power BI a môžeme s nimi ďalej pracovať – napríklad ich prezerať, upravovať alebo vizualizovať v rámci zostavy.
Import dát z CSV
Súbor vo formáte CSV (Comma Separated Values) sa bežne používa na export dát z rôznych systémov. Pri importe CSV je dôležité správne nastaviť oddeľovač dát, ktorým môže byť čiarka, bodkočiarka alebo tabulátor.
Postup importu je veľmi podobný ako pri Exceli. Najprv otvoríme Power BI a zvolíme možnosť Get data from other sources:

Z ponuky vyberieme Text/CSV a klikneme na Connect:

Otvorí sa okno na výber súboru. Vyberieme požadovaný CSV súbor z archívu tejto lekcie a klikneme na Open:

Zobrazí sa okno, kde môžeme vidieť jazykovú sadu, ktorú CSV súbor používa, a oddeľovač, ktorým je bodkočiarka:

Ak všetko zodpovedá, klikneme na Load a dáta sa načítajú do Power BI.
Môžeme si všimnúť, že týmto spôsobom sme importovali iba
jedinú tabuľku customers.csv. Ak by sme chceli
importovať všetky tabuľky naraz, ako to bolo pri importe z
Excelu, museli by sme mať všetky tabuľky v jedinom CSV a
oddeliť ich nejakým novým stĺpcom, napr. record_type.
Ukážme si ešte, čo by sa stalo, keby sme zvolili nesprávny oddeľovač:

Všetky dáta by boli rozhádzané v jednom stĺpci. Na správnom nastavení oddeľovača teda veľmi záleží.
Import dát zo SQL databázy
Priame pripojenie k databáze umožňuje efektívne pracovať s veľkými objemami dát bez nutnosti ich ručného exportu do súborov. Teraz si ukážeme, ako môžeme importovať dáta zo SQL Servera priamo do Power BI.
Znovu otvoríme Power BI a klikneme na možnosť SQL Server:

Zobrazí sa dialógové okno, kam zadáme názov servera a
názov databázy. Napríklad môžeme použiť server
(LocalDB)\MSSQLLocalDB a databázu s názvom
sales:

Predpokladom je mať vytvorenú nejakú databázu. To môžeme urobiť v nástroji SSMS (SQL Server Management Studio) alebo vo Visual Studiu pomocou SQL Server Object Exploreru.
Ak nezadáme názov databázy, Power BI nám zobrazí zoznam všetkých dostupných databáz na danom serveri a budeme si môcť vybrať tú, ktorú chceme použiť.
Použitie LocalDB
LocalDB je špeciálna verzia SQL Servera
určená pre vývojárov, ktorá beží lokálne na našom počítači bez
nutnosti zložitej inštalácie servera. MSSQLLocalDB je
predvolená inštancia SQL LocalDB, ktorá sa vytvorí automaticky
pri inštalácii. Použitie LocalDB je ideálne na testovanie,
výučbu či vývoj aplikácií v menšom rozsahu.
Viac sa o MS-SQL dozviete v kurze MS-SQL databázy krok za krokom.
Po zadaní údajov na pripojenie zvolíme možnosť Use my current credentials a klikneme na Connect:

Po úspešnom pripojení sa zobrazí okno s možnosťou výberu tabuliek. Môžeme opäť vybrať všetky alebo len nejakú konkrétnu a potvrdíme tlačidlom Load:

Power Query si staré dáta ukladá do medzipamäte. Ak si takto načítame dáta z tej istej databázy, ktorú potom upravíme, môže sa stať, že dáta nebudú súhlasiť. V takom prípade je potrebné kliknúť na malú ikonu v pravom hornom rohu, aby sme stiahli aktuálne dáta z databázy.
Zobrazenie dát po importe
Nech už sme dáta importovali akýmkoľvek spôsobom, môžeme si ich v Power BI zobraziť tlačidlom Zobrazenie tabuľky:

V tomto zobrazení môžeme prechádzať jednotlivé tabuľky a prezerať si ich obsah. Ak by sme chceli otvoriť niektorú z tabuliek v nástroji Power Query, klikneme na ňu pravým tlačidlom myši na karte Data a zvolíme možnosť Edit query, čím sa otvorí Power Query Editor:

Nástroj Power Query sa nám pri importe neotvoril okamžite, pretože sme zvolili možnosť Load. Ak by sme chceli dáta začať upravovať ihneď po importe, vybrali by sme namiesto toho tlačidlo Transform Data:

Tým sme si ukázali základné postupy na načítanie a zobrazenie dát v Power BI Desktop. Teraz už vieme, ako dáta nielen načítať, ale aj sprístupniť na ďalšie úpravy v editore Power Query.
V nasledujúcej lekcii, Zoznámenie s Power Query a úvod do čistenia dát, sa dozvieme, prečo je dôležité dáta čistiť, a zoznámime sa s prostredím editora Power Query.
Mal si s čímkoľvek problém? Stiahni si vzorovú aplikáciu nižšie a porovnaj ju so svojím projektom, chybu tak ľahko nájdeš.
Stiahnuť
Stiahnutím nasledujúceho súboru súhlasíš s licenčnými podmienkami
Stiahnuté 2x (29.02 kB)
Aplikácia je vrátane zdrojových kódov

