Advanced multivariate statistics

A.A. 2026/2027
6
Crediti massimi
40
Ore totali
SSD
SECS-S/01
Lingua
Inglese
Obiettivi formativi
The course is designed to teach cutting-edge statistical methods for analyzing multivariate data. Its central theme is inspired by the paper Gelman, A., & Vehtari, A. (2021). What are the most important statistical ideas of the past 50 years? Journal of the American Statistical Association, 116(536), 2087-2097. During the course, applications to real situations will be presented using the R statistical software.
Risultati apprendimento attesi
Students will achieve skills for doing independent study and research in presence of multivariate data. Moreover, they will learn how to use dedicated R libraries to deal with multivariate contexts.
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo quadrimestre

Programma
Il corso è pensato per insegnare metodi statistici avanzati per l'analisi di dati multivariati. Il tema centrale è ispirato all'articolo di Gelman, A., & Vehtari, A. (2021), What are the most important statistical ideas of the past 50 years?, Journal of the American Statistical Association, 116(536), 2087-2097.

Il corso tratta i seguenti argomenti:
- Bootstrap e inferenza basata sulla simulazione
- Modelli multilivello
- Algoritmi computazionali
- Inferenza robusta
- Analisi esplorativa di dati multivariati
- Clustering basato su modelli
- Clustering robusto
Prerequisiti
È richiesta una buona conoscenza delle tecniche di base di statistica e probabilità. Queste includono variabili aleatorie discrete e continue, distribuzioni di probabilità, statistica descrittiva, regressione e analisi dei cluster, riduzione della dimensionalità (ad esempio, PCA). La conoscenza delle metodologie di algebra lineare e calcolo differenziale e integrale può contribuire ad accelerare il processo di apprendimento.
Metodi didattici
Le lezioni saranno articolate come segue:
- 60% lezioni frontali
- 40% attività didattiche interattive in aula, incentrate su esempi, casi di studio e applicazioni sviluppate principalmente in R.
Materiale di riferimento
Materiale fornito a lezione: appunti, slides e codici R.

Everitt, B., & Hothorn, T. (2011). An introduction to applied multivariate analysis with R. Springer Science & Business Media.

Tibshirani, R. J., & Efron, B. (1993). An introduction to the bootstrap. Monographs on statistics and applied
probability, 57(1), 1-436.

Maronna, R. A., Martin, R. D., Yohai, V. J., & Salibián-Barrera, M. (2019). Robust statistics: theory and methods (with R). John Wiley & Sons.

Gałecki, A., & Burzykowski, T. (2012). Linear mixed-effects model. In Linear mixed-effects models using R: a
step-by-step approach (pp. 245-273). New York, NY: Springer New York.

Bouveyron, C., Celeux, G., Murphy, T. B., & Raftery, A. E. (2019). Model-based clustering and classification for data science: with applications in R (Vol. 50). Cambridge University Press.
Modalità di verifica dell’apprendimento e criteri di valutazione
La valutazione, sia per gli studenti frequentanti sia per i non frequentanti, consisterà in una presentazione orale di un progetto in cui gli studenti applicheranno le tecniche statistiche apprese durante il corso a un caso di studio personale, formulando le proprie domande di ricerca.
Gli studenti prepareranno una relazione di circa 20 pagine e una presentazione di accompagnamento. Durante l'esame orale, verranno poste loro domande sui metodi trattati a lezione, sul codice prodotto e sugli argomenti generali inclusi nel resto del programma.
SECS-S/01 - STATISTICA - CFU: 6
Lezioni: 40 ore
Docente: Masci Chiara
Turni:
Turno
Docente: Masci Chiara