Vyhledávání na Internetu pro pokročilé
Vyhledávací stroje
 Tisk

Vyhledávací stroje

Odlišný typ vyhledávání než-li katalogy představují vyhledávače. Vyhledávače využívají při svém prohledávání plný text nebo-li text (slovo) v obsahu stránky (tzv. fulltext). Základem je databáze, do níž jsou ukládána všechna slova, která jsou obsažena na zaindexovaných stránkách. Samotné vyhledávání je prováděno tzv. vyhledávacími stroji (search engines) a využívá se při něm automaticky vytvářená databáze. Podívejte se na animaci , která ukazuje základní způsob vyhledávání ve vyhledávači Google.


Vyhledávání prostřednictvím vyhledávacího stroje může být zahájeno až po zadání vyhledávacího dotazu (vyhledávací řetězec, termín). Jedná se o výraz, který uživatel zadá do vyhledávacího pole. Vyhledávací dotaz může být tvořen jedním klíčovým slovem nebo se může jednat o skupinu klíčových slov. V tom případě se často používají tzv. operátory, které specifikují vztahy mezi klíčovými slovy.


Všechny nejpoužívanější vyhledávače jsou založeny na stejném principu, rozdíly nalezneme pouze v koncovém vyladění jejich činnosti. Samotné vyhledávání je založeno na porovnání obsahu stránek v databázi vyhledávače se zadaným dotazem. Databáze vyhledávacích strojů je naplňována pomocí automatického sběru dat, který provádí tzv. roboti (crawlers), kteří na Internetu prochází stránku po stránce a zaznamenávají jejich obsah do databáze vyhledávače. V databázi nejsou uloženy pouze odkazy na webové stránky, ale také například obsah příspěvků z nejrůznějších diskusních skupin, které fungují po celém světě.


Vyhledávací stroje pracují většinou s jedním indexem (databází), ale existují dva způsoby jeho prohlížení: základní režim vyhledávání a pokročilý režim vyhledávání. Každá z těchto technik slouží k jiným účelům a nelze přesně definovat, která z nich je jednodušší nebo efektivnější. Základní rozdíl spočívá v tom, že v režimu pokročilého vyhledávání má uživatel možnost specifikovat svůj dotaz na základě rozšířených kritérií. Jedná se např. o určení jazyka cílového dokumentu nebo umístění dotazu na stránce. Zde se sleduje např. zda je dané slovo obsaženo v titulku stránky, v textu stránky nebo v umístění odkazu na stránku. Podobným způsobem lze vyhledávat i v základním režimu vyhledávání přímým použitím logických operátorů. Lze tak zařídit, aby byly vybrány pouze stránky, kde se vyskytují oba nebo více zadaných termínů společně, nebo naopak takové stránky z výsledků hledání vyloučit. Animace demonstruje způsob vyhledávání prostřednictvím pokročilého režimu vyhledávače.


Operátory

Velmi efektivní pomůckou pro přesné a rychlé vyhledávání určitých webových stránek pomocí vyhledávačů je použití logických operátorů:

Operátor AND je operátorem logického součinu, který umožňuje nalezení takových stránek, jež se váží k oběma použitým výrazům, např. sport AND fotbal. Ve vyhledávači použijeme zástupný znak +. Tento operátor nemusíme do vyhledávacího pole zadávat, jelikož vyhledávač si jej mezi hledaná slova doplní automaticky.

Operátor OR je operátorem logického součtu, jehož použití nám zaručí vyhledání takových stránek, které se váží alespoň k jednomu z obou hesel, např. sport OR kultura.

Operátor NOT umožňuje vyhledat stránky obsahující slovo, které tomuto operandu předchází a naopak vyloučit ty stránky, které obsahují slova obě, tzn. zadání sport NOT kultura nám ve svém výsledku nalezne stránky týkající se hesla sport, neobsahující ovšem heslo kultura. Ve vyhledávači použijeme zástupný znak -. Podívejte se na animaci .

Operátor FILETYPE se používá pro nalezení souboru určitého formátu. Animace ukazuje vyhledávání s použitím tohoto operátoru.


Řetězec

Dalším velmi používaným způsobem při vyhledávání je ohraničení zadaných klíčových slov uvozovkami. V tom případě se výraz chápe jako jeden řetězec (fráze) a výsledkem jsou mnohdy relevantnější odkazy na stránky s danou problematikou. Např. výraz "kultura ve společnosti“ zajistí, že vyhledávač vám nabídne pouze odkazy na ty stránky, kde se daný řetězec (fráze) vyskytuje. Podívejte se na animaci .


Google

Vyhledávací stroj Google (www.google.com) představuje v současné době zřejmě nejvýkonnější nástroj pro hledání na webu. Ve své databázi má údajně uloženo několik miliard stránek. Kromě klasického fulltextového vyhledávání v základním a pokročilém režimu, může uživatel využít možnost vyhledávat např. obrázky.


Google je efektivní pomůckou při hledání konkrétních termínů jako je např. název produktu. Jeho vysoká efektivita vyhledávání spočívá v podpoře technologie analýzy citovanosti (viz následující studijní článek). Aktualizace indexu (databáze) zde probíhá zhruba jednou za měsíc. Předností Google je podpora vyhledávání v různých světových jazycích včetně jazyka českého a schopnost vyhledávat soubory, které se jeví jiným vyhledávačům jako neviditelné (např. soubory typu PDF nebo DOC).


Zhodnocení vyhledávacích strojů

Bohužel není v silách žádného vyhledávacího stroje pokrýt celý obsahu Internetu. Výsledky vyhledávání nelze považovat za vyčerpávající, jelikož i ten největší vyhledávací stroj pokryje přibližně pouhou třetinu Internetu. Nejefektivnějším řešením se v této situaci jeví vyhledávání prostřednictvím více systémů (vyhledávačů i katalogů). Je nutné zvážit zda termín, který hledáme, snáze nalezneme použitím vyhledávače nebo katalogu. Vyhledávací stroje umožňují prohledat Internet detailněji a zobrazit odkaz na každou stránku, na které se zadaný dotaz vyskytuje. Bohužel v důsledku např. existence synonym je spousta odkazů irelevantních. Narozdíl od vyhledávače nám katalogy nabízí přesnější výsledky vyhledávání, bohužel však pracují s menším počtem informací.


Pokud se rozhodneme vyhledávat prostřednictvím fulltextového vyhledávače, měli bychom zvolit některý ze zahraničních serverů. Vysoce kvalitní český fulltextový vyhledávač v současné době na Internetu v důsledku zanedbatelné velikosti místního trhu nenalezneme. Jinými slovy to znamená, že se zatím z ekonomického hlediska nevyplatí český fulltextový vyhledávač provozovat.