Mikuláš je tu! Získaj 90 % extra kreditov ZADARMO s promo kódom CERTIK90 pri nákupe od 1 199 kreditov. Len do nedele 7. 12. 2025! Zisti viac:
NOVINKA: Najžiadanejšie rekvalifikačné kurzy teraz s 50% zľavou + kurz AI ZADARMO. Nečakaj, táto ponuka dlho nevydrží! Zisti viac:

18. diel - Práca so súbormi DocX v Pythone - Čítanie a štruktúra

V predchádzajúcej lekcii, Práca so súbormi DocX v Pythone - Obrázky a tabuľky, sme si ukázali pokročilejšiu prácu s dokumentmi DocX v Pythone pomocou knižnice python-docx. Prebrali sme obrázky, a tabuľky.

V nasledujúcej lekcii práce so súbormi v Pythone sa zameriame na čítanie súborov formátu .docx. Využijeme na to opäť knižnicu python-docx.

Čítanie už existujúcich dokumentov DocX

Doteraz sme vytvárali úplne nové dokumenty. Teraz si ukážeme, ako môžeme prečítať obsah už existujúcich dokumentov. Našim cieľom bude vytvoriť kód, ktorý nám poskytne základný prehľad o požadovanom dokumente. Konkrétne nás budú zaujímať nasledujúce informácie:

  • text obsiahnutý v dokumente,
  • informácie o jednotlivých obrázkoch,
  • informácie obsiahnuté v tabuľkách.

Pripomeňme si, že informácie sú v súbore .docx uložené vo formáte XML. My teda potrebujeme vytvoriť kód, ktorý nám tieto informácie extrahuje. Preto je nevyhnutné mať základné povedomie o tom, ako vyzerá štruktúra XML súboru, ako ho používa MS Word. Využijeme na to znalosti z lekcie Úvod do formátu XML v Pythone.

Štruktúra a hierarchia XML súboru formátu .docx


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár eur

Došiel si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Obmedzená ponuka: Nauč sa všetko a ušetri

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom za exkluzívnu cenu 110 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto výhodného balíčku získaš prístup ku všetkým 25 článkom (22 lekcií, 2 praktické cvičenia, test) s kontrolou a certifikáciou a ešte naviac ušetríš 441 Kč. Ponuka je časovo obmedzená a platí pro všetky lekcie v kurze. Nakúp teraz a získaj limitovanou 80% zľavu.

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V tomto tutoriále práce so súbormi DocX v Pythone si ukážeme, ako pomocou knižnice python-docx čítať dokumenty. Ukážeme si tiež základy XML štruktúry.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Jakub Jakubec
Avatar
Aktivity