Obsah
Pre moderného človeka je ťažké si predstaviť život bez Internet a takmer okamžitý prístup k zdrojom informácií. Používateľ zriedka premýšľa o tom, ako sa vyhľadávanie požadovaného obsahu vykonáva v sieti. Ale je to veľmi zaujímavé.
Systém vyhľadávania informácií (IPS) je komplexný softvérový a hardvérový komplex, ktorý vyberá informácie na žiadosť používateľa. Informácie sú uložené na serveroch v digitálnej podobe, pretože knihy bývali na pultoch knižníc. Systém pozostáva z mnohých subsystémov. Každý plní svoju úlohu v procese spracovania žiadosti používateľa a poskytovania informácií v textovej alebo zvukovej podobe. Zložitosť architektúry moderných IPS (skratka systému vyhľadávania informácií) je spôsobená množstvom riešených úloh. Druh "čierna skrinka": pri vchode-text žiadosti, čo je vo vnútri, nie je známe, na výstupe-komplexné informácie.

Vstupné toky
Žiadosti o informácie, ktoré osoba vytvára v textovej podobe na obrazovke svojho modulu gadget, tvoria malú časť dopytov spracovaných vyhľadávacím nástrojom. Hlavné polia vyhľadávacích dopytov tvoria roboty, ktoré prijímajú ľudskú požiadavku a vykonávajú viacstupňové vyhľadávanie a spätnú väzbu používateľov. Vyhľadávače informácií zahŕňajú známy Google, "Yandex" a ďalšie, ktoré každý deň spracúvajú milióny žiadostí.
Objekty vyhľadávania zdrojov
Súbor zdrojových objektov záujmu pre vyhľadávanie sú dokumenty, nahrávky, videá, obrázky a ďalšie. Sú vytvorené mimo IPS. Všeobecný systém na ukladanie a vyhľadávanie informácií by mal mať zabudovaný bibliografický systém - druh katalógu, ktorý vám umožňuje vyhľadávať akýkoľvek druh objektov.
Objekty alebo ich digitálne transformácie sa stávajú "zdroj pre vstup" IP. Medzi nimi sú vybrané informácie, ktoré používateľ potrebuje.

Externé zdroje
Pri prezentácii výberu informácií sa používajú externé zdroje vedomostí. Toto sú informácie, ktoré používateľ hľadá. Názov filmu, citát z knihy a ďalšie. Pri počítačovom vyhľadávaní musia byť tieto informácie preložené do dotazu v algoritmickom jazyku. V IP sa to robí pomocou bloku na vytváranie, indexovanie a vývoj dopytov.
V ideálnom prípade by sa tieto tri procesy-reprezentácia – indexovanie a vývoj dotazov-mali spoliehať na identické zdroje vedomostí, ale v praxi je to nedosiahnuteľné.
Je potrebné neustále kontrolovať a aktualizovať zdroje vedomostí a aktualizácia by mala byť identická a synchronizovaná. A externý zdroj vedomostí vždy chronologicky predchádza jeho použitiu vo vyhľadávačoch pre dopyt, niekedy o niekoľko rokov.

Zobraziť
Reprezentácie zdrojových objektov sú tvorené vstupnými údajmi v nejakej kombinácii alebo sú transformované v súlade s Pravidlami a algoritmami konkrétnej informácie-vyhľadávač.
Zobrazenia sú viac-menej transformované kópie pôvodného vyhľadávacieho objektu. V zbierke neupravených úplných textov je každý text vlastným zastúpením. V zbierke predmetov múzejných exponátov a artefaktov môže byť reprezentáciou transformovaný popis objektu s jeho obrazom. V niektorých prípadoch môže byť reprezentácia čiastočne odvodená od zdrojového objektu a čiastočne od popisu: v bibliografických vyhľadávacích systémoch sú reprezentácie odvodené od objektu – napríklad názov, meno autora bude kombinované s anotáciou diela.

Prehľadávateľný index
Keďže informácie vo vyhľadávačoch informácií sú uložené vo forme prezentácie, je logické predpokladať, že vyhľadávanie sa vykonáva podľa prezentácie a po výbere sa používateľovi. V praxi to tak nie je. Napríklad aktuálne adresáre sieťových knižníc zvyčajne obmedzujú vyhľadávanie podľa niekoľkých polí: autor, názov a podnadpisy v zobrazení obsahujúcom ďalšie polia, ktoré sa nehľadajú. To je dostatočný dôvod, prečo je potrebné rozlišovať medzi zobrazením a indexom, ktorý je vyhľadávacou časťou zobrazenia. Definuje všetko, to by malo vyhľadávanie. Prehľadávateľný index, ako reprezentácia a zdrojový objekt, možno rozdeliť do samostatných podindexov, aby sa zabezpečilo presnejšie a cielenejšie vyhľadávanie
Vyhľadávače majú zvyčajne syntetickú štruktúru na porovnanie platných výsledkov vyhľadávania. Táto štruktúra je druhou zložkou prehľadávateľného indexu.
Proces indexovania je možné procedurálne implementovať rôznymi spôsobmi: index, ktorý je možné prehľadávať, je možné získať:
- doslova kopírovanie prehľadávateľnej reprezentácie;
- skopírovaním podrobností o zobrazení. Môže to byť časť alebo všetky pohľady, ktoré existujú fyzicky iba vo forme fragmentov distribuovaných podľa pravidiel na vytvorenie indexu na vyhľadávanie, ktorý sa v prípade potreby zhromaždí.

Pravidlá vývoja dotazov a formálne dotazy
Vývoj dotazov je funkcia, ktorá sprostredkuje medzi požiadavkou používateľa a formálnou požiadavkou. Transformuje dotaz používateľa jeho porovnaním so slovníkmi príkazov extrakcie, špecifikáciou indexu a indexom pred extrakciou. Na začiatku vývoja IPS bola táto úloha tradične pridelená kvalifikovaným IT špecialistom.
Vývoj počítačových dotazov, ktoré dokážu priradiť slovníkové dotazy k prehľadateľnému systémovému indexu, sa zvyčajne nazýva modul "zadanie slovníka". Automatizácia tejto funkcie je sľubná a ponúka príležitosti pre odborné a pravdepodobnostné metódy vyhľadávania.
Formálna žiadosť sa stáva takou po konverzii žiadosti používateľa. Príklady takýchto formálnych transformácií zahŕňajú skrátenie, substitúciu, normalizáciu, vektorizáciu a ďalšie transformácie "z vonkajšej strany" zastúpenie do "vnútorný" reprezentácie počítačových IP adries (dešifrovanie-systém vyhľadávania informácií).
Extrahované súbory odkazov na dokumenty
Výsledná množina informačných zdrojov je logicky podmnožinou reprezentácií vytvorených podľa pravidiel zhody aplikovaných na formálny dopyt indexom, ktorý je možné prehľadávať.
Zvyčajne, ale nie nevyhnutne, existuje samostatný proces triedenia obnovenej sady informácií. Online katalógy knižníc zvyčajne pred zobrazením usporiadajú prijaté sady abecedne podľa autora. V systémoch vyhľadávania informácií, ktoré vytvárajú prísne poradie, poradie poradia predchádza akejkoľvek zmene poradia.

Výstupné toky
Výstup výsledkov vyhľadávania sa vykonáva tradične na displeji, častejšie vo forme prúdu objektov, ktoré sa použijú inde alebo na iné účely, dokončí hlavný cyklus vyhľadávania.Takéto toky môžu byť smerované do vizualizačných zariadení, uložené na následné spracovanie alebo použité ako vstupné toky do iných výberových služieb.
Systémy vyhľadávania informácií vám umožňujú poskytovať spätnú väzbu o výstupe z akéhokoľvek výberového procesu. Výstupom akéhokoľvek procesu môže byť spätná väzba z iných procesov. Spätná väzba môže poskytnúť základ pre znalecký posudok v ktorejkoľvek fáze.