Skip to content

Latest commit

 

History

History
48 lines (27 loc) · 1.84 KB

README.md

File metadata and controls

48 lines (27 loc) · 1.84 KB

SMARTSEARCH

Miks?

Tihti on olemasolevale infosüsteemile raske lisada otsingufunktsionaalsust, mis arvestaks eestikeele eripäradega:

  • Reeglina soovitakse leida dokumentidest kõiki otsingufraaside vorme (näiteks president, presidendi, presidenti, ...)
  • Tihti soovitakse korrigeerida kasutaja poolt otsisõna kirjutamisel tehtud trüki- ja ortograafiavigu (arhidekt, reeglisdtik, ...)
  • Tihti on kasulik teisendada kasutaja otsisõnad dokumentides kasutatavateks teminoloogiaks (üksratas, hoverboard → tasakaaluliikur, jalgrattatee → kergliiklustee)
  • Vahel soovitakse automaatset sõnalõpetust, mis piisava arvu tähtede sisestamisel pakub ise välja võimalikud otsisõnade kandidaadid.

Antud projekti eesmärgiks on luua nende eesmärkide saavutamiseks vajalikud tarkvarakomponendid, mida saab suhteliselt lihtsalt liidestada olemasolevate infosüsteemidega.

Kuidas?

Raamistiku ülevaade

Iga otsigu saab jagada neljaks faasiks:

  • otsisisendi normaliseerimine;
  • andmebaasi päringu koostamine;
  • dokumentide andmebaasist otsimine;
  • leitud dokumentide filtreerimine ja dekoreerimine.

Ülal toodud eesmärkide saavutamiseks piisab enamasti joonisel toodud komponentide lisamisest olemasolevasse otsingumoodulisse.

Antud projekti raames loome me kõik vajalikud komponendid veebiteenustena ning näitame lihtsate demorakendustega, kuidas vastavaid komponente kasutada.

I. Dokumentide indekseerimine

Toimiva otsingu aluseks on korrektselt indekseeritud dokumendid. Standardsed andmebaasilahendused ei arvesta eestikeelsete tekstide omapära ning seetõttu on otsingutulemused tihti kehvapoolsed.

II. Otsisisendi normaliseerimine

TBA

III. Nutika otsingu demorakendus

TBA

Veebiteenused

Kõigi veebiteenuste kood on kaustas api