Advanced multivariate statistics
A.A. 2026/2027
Obiettivi formativi
The course is designed to teach cutting-edge statistical methods for analyzing multivariate data. Its central theme is inspired by the paper Gelman, A., & Vehtari, A. (2021). What are the most important statistical ideas of the past 50 years? Journal of the American Statistical Association, 116(536), 2087-2097. During the course, applications to real situations will be presented using the R statistical software.
Risultati apprendimento attesi
Students will achieve skills for doing independent study and research in presence of multivariate data. Moreover, they will learn how to use dedicated R libraries to deal with multivariate contexts.
Periodo: Secondo quadrimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Secondo quadrimestre
Programma
Il corso è pensato per insegnare metodi statistici avanzati per l'analisi di dati multivariati. Il tema centrale è ispirato all'articolo di Gelman, A., & Vehtari, A. (2021), What are the most important statistical ideas of the past 50 years?, Journal of the American Statistical Association, 116(536), 2087-2097.
Il corso tratta i seguenti argomenti:
- Bootstrap e inferenza basata sulla simulazione
- Modelli multilivello
- Algoritmi computazionali
- Inferenza robusta
- Analisi esplorativa di dati multivariati
- Clustering basato su modelli
- Clustering robusto
Il corso tratta i seguenti argomenti:
- Bootstrap e inferenza basata sulla simulazione
- Modelli multilivello
- Algoritmi computazionali
- Inferenza robusta
- Analisi esplorativa di dati multivariati
- Clustering basato su modelli
- Clustering robusto
Prerequisiti
È richiesta una buona conoscenza delle tecniche di base di statistica e probabilità. Queste includono variabili aleatorie discrete e continue, distribuzioni di probabilità, statistica descrittiva, regressione e analisi dei cluster, riduzione della dimensionalità (ad esempio, PCA). La conoscenza delle metodologie di algebra lineare e calcolo differenziale e integrale può contribuire ad accelerare il processo di apprendimento.
Metodi didattici
Le lezioni saranno articolate come segue:
- 60% lezioni frontali
- 40% attività didattiche interattive in aula, incentrate su esempi, casi di studio e applicazioni sviluppate principalmente in R.
- 60% lezioni frontali
- 40% attività didattiche interattive in aula, incentrate su esempi, casi di studio e applicazioni sviluppate principalmente in R.
Materiale di riferimento
Materiale fornito a lezione: appunti, slides e codici R.
Everitt, B., & Hothorn, T. (2011). An introduction to applied multivariate analysis with R. Springer Science & Business Media.
Tibshirani, R. J., & Efron, B. (1993). An introduction to the bootstrap. Monographs on statistics and applied
probability, 57(1), 1-436.
Maronna, R. A., Martin, R. D., Yohai, V. J., & Salibián-Barrera, M. (2019). Robust statistics: theory and methods (with R). John Wiley & Sons.
Gałecki, A., & Burzykowski, T. (2012). Linear mixed-effects model. In Linear mixed-effects models using R: a
step-by-step approach (pp. 245-273). New York, NY: Springer New York.
Bouveyron, C., Celeux, G., Murphy, T. B., & Raftery, A. E. (2019). Model-based clustering and classification for data science: with applications in R (Vol. 50). Cambridge University Press.
Everitt, B., & Hothorn, T. (2011). An introduction to applied multivariate analysis with R. Springer Science & Business Media.
Tibshirani, R. J., & Efron, B. (1993). An introduction to the bootstrap. Monographs on statistics and applied
probability, 57(1), 1-436.
Maronna, R. A., Martin, R. D., Yohai, V. J., & Salibián-Barrera, M. (2019). Robust statistics: theory and methods (with R). John Wiley & Sons.
Gałecki, A., & Burzykowski, T. (2012). Linear mixed-effects model. In Linear mixed-effects models using R: a
step-by-step approach (pp. 245-273). New York, NY: Springer New York.
Bouveyron, C., Celeux, G., Murphy, T. B., & Raftery, A. E. (2019). Model-based clustering and classification for data science: with applications in R (Vol. 50). Cambridge University Press.
Modalità di verifica dell’apprendimento e criteri di valutazione
La valutazione, sia per gli studenti frequentanti sia per i non frequentanti, consisterà in una presentazione orale di un progetto in cui gli studenti applicheranno le tecniche statistiche apprese durante il corso a un caso di studio personale, formulando le proprie domande di ricerca.
Gli studenti prepareranno una relazione di circa 20 pagine e una presentazione di accompagnamento. Durante l'esame orale, verranno poste loro domande sui metodi trattati a lezione, sul codice prodotto e sugli argomenti generali inclusi nel resto del programma.
Gli studenti prepareranno una relazione di circa 20 pagine e una presentazione di accompagnamento. Durante l'esame orale, verranno poste loro domande sui metodi trattati a lezione, sul codice prodotto e sugli argomenti generali inclusi nel resto del programma.
SECS-S/01 - STATISTICA - CFU: 6
Lezioni: 40 ore
Docente:
Masci Chiara
Turni:
Turno
Docente:
Masci ChiaraDocente/i