Recupero di Informazione (Information retrieval).
Si vogliono recuperare fra un insieme di documenti quelli rilevanti per una interrogazione.
![]() | I documenti sono analizzati in base alla frequenza di termini (parole). |
![]() | Ogni documento e' rappresentato da vettori n-dimensionali (se n e' il numero di termini) |
![]() | Ogni componente del vettore rappresenta la frequenza del termine nel documento. |
![]() | La distanza fra i vettori rappresentativi di due documenti rappresenta la somiglianza fra i due documenti. |
![]() | Si puo' creare un vettore che rappresenta l'interrogazione. L'estrazione dei documenti rilevanti avviene prendento i documenti piu' vicini alla domanda. |