Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.

25. diel - PostgreSQL - Fulltextové vyhľadávanie - Fulltextový index

V predchádzajúcej lekcii, PostgreSQL - Fulltextové vyhľadávanie , sme si predstavili fulltextové vyhľadávanie v PostgreSQL databázach a pozreli sa na jeho výhody oproti klasickému hľadaniu.

V dnešnom PostgreSQL tutoriále sa opäť pozrieme na fulltextové vyhľadávanie. Naučíme sa vytvárať vlastné konfigurácie textového vyhľadávania, čím si zlepšíme možnosti vyhľadávania v slovenskom jazyku. A tiež našu databázu rozšírime o fulltextový index.

Všetko si ukážeme na databáze databaze_pro_web. Ak už túto databázu nemáte, tak si jej aktuálnu verziu môžete stiahnuť pod článkom a naimportovať.

Konfigurácia textového vyhľadávania

Konfigurácia textového vyhľadávania riadi mieru a spôsob redukcie dokumentov a vyhľadávaných výrazov na tsvector a tsquery. Každá takáto konfigurácia je definovaná týmito zložkami:
  • Slovníky - používajú sa na odobratie slov, ktoré by sa nemali uvažovať pri hľadaní (tzv. stop slova). A ďalej k normalizácii slov, aby sa rôzne odvodené formy rovnakého slova zhodovali. Úspešne normalizované slovo sa nazýva lexém. Jedna konfigurácia môže obsahovať pokojne aj viac slovníkov.
  • Parser (analyzátor) - slúži na rozdelenie textu na tzv. tokeny, teda jednotlivé slová alebo frázy. Tieto tokeny nadobúdajú rôzne dátové typy, podľa toho v akom formáte sú dané slová alebo frázy, napr. máme typy asciiword, word, hword, hword_part, email, url, int a ďalšie.

Tvorba slovníka

Slovníky sa v PostgreSQL tvoria podľa šablón.

Šablóny poskytujú funkcie, pomocou ktorých sa slovníky vytvárajú z odovzdaných súborov s požadovanými dátami. Ide napr. o súbory so stop slovami, predponami, príponami, synonymami, atď.

Šablóny si môžeme sami vytvoriť alebo využiť už predpripravené od PostgreSQL:


 

...koniec náhľadu článku...
Pokračuj ďalej

Vedomosti v hodnote stoviek tisíc získaš za pár korún

Minul si až sem a to je super! Veríme, že ti prvé lekcie ukázali niečo nového a užitočného.
Chceš v kurze pokračovať? Prejdi do prémiové sekcie.

Kúpiť tento kurz

Kúpiť všetky aktuálne dostupné lekcie s funkciou odovzdávanie úloh a certifikátom iba za 1 550 kreditov
Aktuálny stav konta 0 kreditov
Kúpou tohoto balíčku získaš prístup ku všetkým 47 článkom (28 lekcií, 10 testov, 9 praktických cvičení) tohoto kurzu.

Pred kúpou tohto článku je potrebné kúpiť predchádzajúci diel

Obsah článku spadá pod licenciu Premium, kúpou článku súhlasíš so zmluvnými podmienkami.

Čo od nás v ďalších lekciách dostaneš?
  • Neobmedzený a trvalý prístup k jednotlivým lekciím.
  • Kvalitné znalosti v oblasti IT.
  • Zručnosti, ktoré ti pomôžu získať vysnívanú a dobre platenú prácu.

Popis článku

Požadovaný článok má nasledujúci obsah:

V PostgreSQL tutoriále sa opäť pozrieme na fulltextové vyhľadávanie. Naučíme sa vytvárať vlastné konfigurácie textového vyhľadávania a fulltextový index.

Kredity získaš, keď podporíš našu sieť. To môžeš urobiť buď zaslaním symbolickej sumy na podporu prevádzky alebo pridaním obsahu na sieť.

Článok pre vás napísal Radek Vymětalík
Avatar
...
Aktivity