Skip to content
This repository has been archived by the owner on Oct 10, 2023. It is now read-only.

Latest commit

 

History

History
53 lines (46 loc) · 2.25 KB

README.md

File metadata and controls

53 lines (46 loc) · 2.25 KB

MRI_EX3

Esercizio svolto da Natasha Fabrizio Matricola: 717446 e Francesco Saverio Cassano Matricola: 716133

DESCRIZIONE SVOLGIMENTO ESERCIZIO

L'esercizio è stato realizzato prendendo come base ciò che è presente nella repo Git Hub.
E' stata creata la classe Personal Analyzer , ereditando da "StopwordAnalyzerBase", che Tokenizza i termini e poi li filtra. Come Tokenizzatore, la classe utilizza il LetterTokenizer, mentre per quanto riguarda i filtri utilizza LowerCaseFilter, EnglishPossessiveFilter, RemoveDuplicateTokenFilter, KStemFilter ed infine StopFilter; quest'ultimo legge la lista delle stopword da file.

Per la gestione delle query nella classe CranSearcher viene utilizzato il PersonalAnalyzer. Inoltre è stato aggiunto il metodo "customQueryBoost" per effettuare i boost dei termini rilevanti e l'eliminazione dei caratteri non desiderati.

Anche la classe CranIndexer utilizza come analyzer il PersonalAnalyzer.

L'output del sistema si trova nel percorso "MRI_EX3\resources\cran", il file è chiamato "result.out". Il risultato di "trec_eval" è il seguente:

runid                 	all	exp0
num_q                 	all	225
num_ret               	all	22500
num_rel               	all	1837
num_rel_ret           	all	1346
map                   	all	0.4662
gm_map                	all	0.3142
Rprec                 	all	0.4384
bpref                 	all	0.7735
recip_rank            	all	0.8803
iprec_at_recall_0.00  	all	0.8905
iprec_at_recall_0.10  	all	0.8664
iprec_at_recall_0.20  	all	0.7408
iprec_at_recall_0.30  	all	0.6334
iprec_at_recall_0.40  	all	0.5517
iprec_at_recall_0.50  	all	0.4811
iprec_at_recall_0.60  	all	0.3900
iprec_at_recall_0.70  	all	0.3227
iprec_at_recall_0.80  	all	0.2183
iprec_at_recall_0.90  	all	0.1510
iprec_at_recall_1.00  	all	0.1336
P_5                   	all	0.5004
P_10                  	all	0.3360
P_15                  	all	0.2596
P_20                  	all	0.2104
P_30                  	all	0.1547
P_100                 	all	0.0598
P_200                 	all	0.0299
P_500                 	all	0.0120
P_1000                	all	0.0060

Natasha Fabrizio - Francesco Saverio Cassano
Esercizio 3 MRI