Advanced multivariate statistics
A.A. 2023/2024
Obiettivi formativi
This course is divided in two parts: (i) inference for multivariate analysis and (ii) exploratory multivariate analysis. The first part takes up the concepts of inferential multivariate statistical analysis, extending the theory about univariate inferential statistics with all the implications this extension involves. Additional topics in this context are Bayesian networks and multivariate bootstrapping. The second part will focus on exploratory multivariate analysis and will focus on further dimensional reduction techniques, correlation analysis and advanced clustering. During the course, applications to real situations will be presented using mainly the R statistical package.
Risultati apprendimento attesi
Students will achieve skills for doing independent study and research in presence of multivariate data. Moreover, they will learn how to use dedicated R libraries to deal with multivariate contexts.
Periodo: Primo trimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Periodo
Primo trimestre
Programma
Prima parte: inferenza multivariata
(i) Distribuzioni normali multivariate.
(ii) Analisi multivariata della varianza.
(iii) Modelli log-lineari e logistici per dati categoria multivariati.
(iv) Modelli per variabili di risposta multivariate.
(v) Bootstrapping multivariato.
(vi) Analisi robusta multivariata.
(vii) Reti bayesiane.
Seconda parte: analisi esplorativa di dati multivariati.
(i) Analisi delle componenti principali non lineari.
(ii) Scaling multidimensionale.
(iii) Analisi delle corrispondenze multiple.
(iv) Correlazione canonica.
(v) Cluster analysis avanzata.
(i) Distribuzioni normali multivariate.
(ii) Analisi multivariata della varianza.
(iii) Modelli log-lineari e logistici per dati categoria multivariati.
(iv) Modelli per variabili di risposta multivariate.
(v) Bootstrapping multivariato.
(vi) Analisi robusta multivariata.
(vii) Reti bayesiane.
Seconda parte: analisi esplorativa di dati multivariati.
(i) Analisi delle componenti principali non lineari.
(ii) Scaling multidimensionale.
(iii) Analisi delle corrispondenze multiple.
(iv) Correlazione canonica.
(v) Cluster analysis avanzata.
Prerequisiti
E' richiesta una buona conoscenza delle tecniche statistiche e di probabilità di base. La conoscenza di metodologie di algebra lineare e di analisi matematica può aiutare la velocizzazione del processo di apprendimento.
Metodi didattici
60% lezioni frontali;
40% di attività didattiche interattive in aula incentrate su esempi, case study, documenti di ricerca e applicazioni sviluppate principalmente in R.
40% di attività didattiche interattive in aula incentrate su esempi, case study, documenti di ricerca e applicazioni sviluppate principalmente in R.
Materiale di riferimento
Note e slide. delle lezioni.
Alcuni suggerimenti su specifici argomenti:
Everitt, B.S., Hothorn, T. (2011). An Introduction to Applied Multivariate Analysis with R. Springer.
Everitt, B.S., Dunn, G. (2017). Applied Multivariate Data Analysis, 2nd edition. Springer.
Gifi, A. (1990). Nonlinear Multivariate Analysis. Wiley.
Härdle, W., Simar, L. ( 2007). Applied Multivariate Statistical Analysis, 2nd edition . Springer.
Bouveyron, C., Celeux, G., Murphy, T.B., Raftery, A., E. (2019). Model-based Clustering and Classification for Data Science. Springer
Alcuni suggerimenti su specifici argomenti:
Everitt, B.S., Hothorn, T. (2011). An Introduction to Applied Multivariate Analysis with R. Springer.
Everitt, B.S., Dunn, G. (2017). Applied Multivariate Data Analysis, 2nd edition. Springer.
Gifi, A. (1990). Nonlinear Multivariate Analysis. Wiley.
Härdle, W., Simar, L. ( 2007). Applied Multivariate Statistical Analysis, 2nd edition . Springer.
Bouveyron, C., Celeux, G., Murphy, T.B., Raftery, A., E. (2019). Model-based Clustering and Classification for Data Science. Springer
Modalità di verifica dell’apprendimento e criteri di valutazione
Alcuni assignment saranno proposti e valutati durante il corso ed è richiesto un progetto finale scritto. La valutazione del progetto avverrà attraverso una presentazione orale e con alcune domande volte a valutare la conoscenza delle tecniche usate nel progetto e più in generale proposte durante il corso.
SECS-S/01 - STATISTICA - CFU: 6
Lezioni: 40 ore
Docente:
Manzi Giancarlo
Siti didattici