Analisi di dati su larga scala

A.A. 2015/2016
Insegnamento per
6
Crediti massimi
48
Ore totali
Lingua
Italiano
Obiettivi formativi
L'insegnamento introduce le principali tecniche legate all'analisi di grosse moli di dati.
Gli studenti saranno in grado di analizzare dati non strutturati e in quantità tali da non permetterne lo stoccaggio su di un unico elaboratore.

Struttura insegnamento e programma

Edizione attiva
Responsabile
Lezioni: 48 ore
Docenti: Apolloni Bruno, Malchiodi Dario
Programma
Introduzione al data mining, file system su larga scala e hadoop, map-reduce e hadoop, algoritmi map-reduce, analisi di algoritmi map-reduce, noSQL, ricerca di elementi simili, analisi di stream di dati, analisi di link, insiemi di elementi frequenti, Web advertising, clustering, machine learning, recommendation systems, riduzione della dimensionalità, analisi di reti sociali.
Informazioni sul programma
Competenze acquisite
Gli studenti saranno in grado di analizzare dati non strutturati e in quantità tali da non permetterne lo stoccaggio su di un unico elaboratore.
Metodi didattici
Metodi Didattici: Lezioni frontali; Modalità di esame: Orale.
Materiale didattico e bibliografia
Anand Rajaraman and Jeff Ullman, Mining of Massive Datasets, available both as a freely downloadable PDF and published in hardcopy by Cambridge University Press (ISBN:9781107015357). Sarà inoltre consigliata la lettura di alcuni tutorial pubblicati sul Web.
Periodo
Primo semestre
Periodo
Primo semestre
Modalità di valutazione
Esame
Giudizio di valutazione
voto verbalizzato in trentesimi
Docente/i
Ricevimento:
Su appuntamento
Stanza 5015, Dipartimento di Informatica