Statistica matematica
A.A. 2019/2020
Obiettivi formativi
L'obiettivo principale dell'insegnamento è di introdurre gli aspetti sia teorici che applicativi dei moderni metodi della Statistica Matematica, sia multivariata che computazionale, con particolare attenzione alle tecniche per l'analisi di Big Data. Attraverso le attività di laboratorio, si vuole inoltre abituare lo studente ad effettuare analisi di dati con strumenti software avanzati (R, Spark).
Risultati apprendimento attesi
Nozioni e teoremi base della Statistica Matematica multivariata e computazionale, che lo studente sarà poi in grado di approfondire in ambito sia teorico che applicativo. Lo studente sarà inoltre in grado di applicare tali competenze all'analisi statistica di dati multivariati o di grandi dimensioni.
Periodo: Secondo semestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Secondo semestre
Programma
Viene qui fornita una indicazione dei capitoli che sarebbe necessario sviluppare. L'insufficienza del tempo a disposizione potrà costringere i docenti ad operare una scelta ragionata.
Statistica Multivariata
1. Vettori aleatori
2. La distribuzione Normale Multivariata
2.1. Definizione e proprietà della Normale multivariata
2.2. Test per la verifica della normalità di un vettore aleatorio
2.3. Ricerca di outliers
3. Principali distribuzioni multivariate derivanti dalla Normale
3.1. Distribuzione di Wishart
3.2. Distribuzione T2 di Hotelling
3.3. Distribuzione Lambda di Wilks
4. Test di ipotesi multivariati
4.1. Test su uno o due vettori medi
4.2. Analisi multivariata della varianza (MANOVA)
4.3. Test sulle matrici di covarianza
Metodi statistici per il trattamento di Big Data
5. Locality Sensitive Hashing (LSH)
6. Ricerca di oggetti simili
7. Oggetti frequenti
8. Cluster analysis
9. Tecniche di riduzione della dimensione
10. Analisi di data streams
11. Analisi di social networks
12. Laboratorio
Analisi di dati tramite software statistici (R e R Spark)
Statistica Multivariata
1. Vettori aleatori
2. La distribuzione Normale Multivariata
2.1. Definizione e proprietà della Normale multivariata
2.2. Test per la verifica della normalità di un vettore aleatorio
2.3. Ricerca di outliers
3. Principali distribuzioni multivariate derivanti dalla Normale
3.1. Distribuzione di Wishart
3.2. Distribuzione T2 di Hotelling
3.3. Distribuzione Lambda di Wilks
4. Test di ipotesi multivariati
4.1. Test su uno o due vettori medi
4.2. Analisi multivariata della varianza (MANOVA)
4.3. Test sulle matrici di covarianza
Metodi statistici per il trattamento di Big Data
5. Locality Sensitive Hashing (LSH)
6. Ricerca di oggetti simili
7. Oggetti frequenti
8. Cluster analysis
9. Tecniche di riduzione della dimensione
10. Analisi di data streams
11. Analisi di social networks
12. Laboratorio
Analisi di dati tramite software statistici (R e R Spark)
Prerequisiti
E' richiesto che gli studenti abbiano seguito un corso introduttivo alla Statistica Matematica univariata, con particolare riferimento alla Verifica di Ipotesi statistiche e alla Regressione Lineare.
Metodi didattici
Lezioni frontali, esercitazioni e laboratorio informatico
Materiale di riferimento
A.C. Rencher, Multivariate Statistical Inference and Applications, Wiley, 1998
K.V. Mardia, J.T. Kent, J.M., Bibby, Multivariate Analysis, Academic Press, 1979
Jure Leskovec, Anand Rajaraman, Jeff Ullman, Mining of massive datasets, Cambridge University Press, 2014. Versione online: http://www.mmds.org/
Note dei docenti
K.V. Mardia, J.T. Kent, J.M., Bibby, Multivariate Analysis, Academic Press, 1979
Jure Leskovec, Anand Rajaraman, Jeff Ullman, Mining of massive datasets, Cambridge University Press, 2014. Versione online: http://www.mmds.org/
Note dei docenti
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame consiste di una prova scritta, ed una prova di laboratorio.
- Nella prova scritta verranno assegnati alcuni esercizi a risposta aperta e/o chiusa, atti a verificare le conoscenze acquisite e la capacità di risolvere problemi di Statistica multivariata. La durata della prova scritta è commisurata al numero e alla struttura degli esercizi assegnati, ma non supererà comunque le tre ore. Gli esiti delle prove scritte verranno comunicati sul SIFA attraverso il portale UNIMIA e sul sito del corso su ariel.
- La prova di laboratorio consiste nello sviluppo di esercizi al calcolatore assegnati dai docenti durante le lezioni, che saranno valutati di volta in volta durante lo svolgimento del corso. E' pertanto richiesta la frequenza costante delle lezioni. La prova di laboratorio mira a valutare la capacità dello Studente di inquadrare un problema di analisi di dati multivariati e/o di grosse dimensioni, di individuare una soluzione e di relazionare sui risultati ottenuti.
L'esame si intende superato se vengono superate la prova scritta e la prova di laboratorio. Il voto è espresso in trentesimi ed è calcolato come una media pesata col numero di crediti (6 cfu per lo scritto, 3 cfu per il laboratorio) dei risultati delle due prove. Il voto verrà comunicato immediatamente al termine della correzione della prova scritta.
- Nella prova scritta verranno assegnati alcuni esercizi a risposta aperta e/o chiusa, atti a verificare le conoscenze acquisite e la capacità di risolvere problemi di Statistica multivariata. La durata della prova scritta è commisurata al numero e alla struttura degli esercizi assegnati, ma non supererà comunque le tre ore. Gli esiti delle prove scritte verranno comunicati sul SIFA attraverso il portale UNIMIA e sul sito del corso su ariel.
- La prova di laboratorio consiste nello sviluppo di esercizi al calcolatore assegnati dai docenti durante le lezioni, che saranno valutati di volta in volta durante lo svolgimento del corso. E' pertanto richiesta la frequenza costante delle lezioni. La prova di laboratorio mira a valutare la capacità dello Studente di inquadrare un problema di analisi di dati multivariati e/o di grosse dimensioni, di individuare una soluzione e di relazionare sui risultati ottenuti.
L'esame si intende superato se vengono superate la prova scritta e la prova di laboratorio. Il voto è espresso in trentesimi ed è calcolato come una media pesata col numero di crediti (6 cfu per lo scritto, 3 cfu per il laboratorio) dei risultati delle due prove. Il voto verrà comunicato immediatamente al termine della correzione della prova scritta.
MAT/06 - PROBABILITA' E STATISTICA MATEMATICA - CFU: 9
Laboratori: 36 ore
Lezioni: 42 ore
Lezioni: 42 ore
Docenti:
Aletti Giacomo, Micheletti Alessandra
Turni:
Docente/i
Ricevimento:
su appuntamento
ufficio 2099
Ricevimento:
Su appuntamento per email
studio o online (videoconferenza)