Information retrieval

A.A. 2019/2020
Insegnamento per
6
Crediti massimi
48
Ore totali
SSD
INF/01
Lingua
Inglese

Struttura insegnamento e programma

Edizione attiva
Responsabile
INF/01 - INFORMATICA - CFU: 6
Lezioni: 48 ore
Docente: Ferrara Alfio
STUDENTI FREQUENTANTI
Programma
Il corso fornisce un'introduzione generale al tema dell'information retrieval classico e su web.
In particolare, il corso affronta il tema della ricerca di documenti sul web e è specificamente orientato al mining, all'analisi, alla classificazione e al clustering di dati testuali.
Il corso propone una trattazione aggiornata della progettazione e implementazione di sistemi per l'indicizzazione e la ricerca di documenti, dei metodi di valutazione dei sistemi di information retrieval, e un'introduzione all'uso di tecniche di machine learning per collezioni di dati testuali, con particolare riferimento a tecniche di latent e probabilistic semantic indexing.
Infine, il corso fornisce un'introduzione ai nuovi strumenti software NoSql per l'implementazione di sistemi di information retrieval di moderna concezione.

SINTESI DEGLI ARGOMENTI

Sistemi booleani
Vocabolari e dizionari
Indicizzazione
Misure e pesi per i termini
Vector Space Model
Valutazione di sistemi di information retrieval
Sistemi probabilistici e classificazione di testi
Clustering
Decomposizioni di matrici e latent semantic analysis
Informazioni sul programma
With respect to the book text Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval (Vol. 1, p. 496). Cambridge: Cambridge university press. (http://nlp.stanford.edu/IR-book/ ) the program corresponds to the chapters:
1-3, 6-9, 11-18
Prerequisiti e modalità di esame
For attending students only, the exam consists of the realization of an exam project to be agreed with the teacher. The project aims to assess the understanding of the topics of the course and the candidate's ability to identify innovative solutions with respect to literature.
The project will be evaluated through an oral interview on the results of the project and the related topics of the course.
Metodi didattici
Lectures
Materiale didattico e bibliografia
Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval (Vol. 1, p. 496). Cambridge: Cambridge university press. (http://nlp.stanford.edu/IR-book/)
Appunti e materiali forniti dal docente
STUDENTI NON FREQUENTANTI
Programma
Il corso fornisce un'introduzione generale al tema dell'information retrieval classico e su web.
In particolare, il corso affronta il tema della ricerca di documenti sul web e è specificamente orientato al mining, all'analisi, alla classificazione e al clustering di dati testuali.
Il corso propone una trattazione aggiornata della progettazione e implementazione di sistemi per l'indicizzazione e la ricerca di documenti, dei metodi di valutazione dei sistemi di information retrieval, e un'introduzione all'uso di tecniche di machine learning per collezioni di dati testuali, con particolare riferimento a tecniche di latent e probabilistic semantic indexing.
Infine, il corso fornisce un'introduzione ai nuovi strumenti software NoSql per l'implementazione di sistemi di information retrieval di moderna concezione.

SINTESI DEGLI ARGOMENTI

Sistemi booleani
Vocabolari e dizionari
Indicizzazione
Misure e pesi per i termini
Vector Space Model
Valutazione di sistemi di information retrieval
Sistemi probabilistici e classificazione di testi
Clustering
Decomposizioni di matrici e latent semantic analysis
Prerequisiti e modalità di esame
The test for non-attending students consists of an in-depth interview on the entire program of the course.
Materiale didattico e bibliografia
Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval (Vol. 1, p. 496). Cambridge: Cambridge university press. (http://nlp.stanford.edu/IR-book/)
Periodo
Secondo semestre
Periodo
Secondo semestre
Modalità di valutazione
Esame
Giudizio di valutazione
voto verbalizzato in trentesimi
Docente/i
Ricevimento:
Venerdì, 11.30 - 13.30
Dipartimento di Informatica, via Comelico 39, Stanza S221