Laboratorio di statistica matematica

A.A. 2021/2022
3
Crediti massimi
36
Ore totali
SSD
MAT/06
Lingua
Italiano
Obiettivi formativi
L'obiettivo principale dell'insegnamento è di introdurre gli aspetti teorici e computazionali dei primi strumenti statistici, traendo spunto dall'analisi di set di dati simulati o reali. A tale scopo verrà introdotto e utilizzato il software R, di riferimento in tutti gli ambiti scientifici e in diversi contesti aziendali e industriali. Lo studente imparerà a applicare la teoria matematica a situazioni di interesse modellistico, migliorerà le sue competenze informatiche e compuazionali e la sua attitudine al problem solving.
Risultati apprendimento attesi
Lo studente dovrà essere in grado di effettuare un'analisi statistica di base di dati provenienti da situazioni applicative di tipo diverso utilizzando il software statistico R. Avrà acquisito la capacità di utilizzare gli strumenti dell'analisi statistica di base per trarre informazioni rilevanti dai set di dati disponibili. Nel contempo avrà acquisito una buona prima padronanza delle risorse basilari del software R. Dovrà essere cosciente di come la teoria matematica permetta l'utilizzo di specifici algoritmi col software
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo semestre
in caso di didattica in remoto, oltre a Teams, viene richiesto che gli studenti abbiano un PC con software statistico installato (R). Su Ariel, verrà spiegato come installarlo. In relazione alle modalità di erogazione delle attività formative per l'a.a. 2021/22, verranno date indicazioni più specifiche nei prossimi mesi, in base all'evoluzione della situazione sanitaria.

Programma
1. Introduzione al software statistico (SAS o R)
2. Introduzione ai GLM (General Linear Models): formulazione generale, funzione di link
3. Caso in cui la funzione di link è l'identità: modello di regressione lineare.
3.1. Stima dei parametri
3.2. Metodi di selezione delle variabili
3.3. Analisi dei residui e diagnostica sulla regressione.
4. Caso di regressori dummy
5. ANOVA a una e a due vie
6. Funzione di link logit: regressione logistica
7. Alberi di classificazione e regressione (CART)
8. Introduzione alle reti neurali (se tempo sufficiente)
Prerequisiti
Il contenuti del corso di Statistica Matematica (ex CPSM2) sono fortemente consigliati per una comprensione approfondita dei contenuti
Metodi didattici
lezioni in laboratorio informatico
Materiale di riferimento
· Peter K. Dunn · Gordon K. Smyth, Generalized Linear Models With Examples in R, Springer Texts in Statistics, 2018
· G.G. Roussas, A Course in Mathematical Statistics, Academic Press, 1997 (o edizioni più recenti)
· A.Agresti, Categorical data analysis, Wiley, 2nd edition (2002)
· N. Draper, H. Smith, Applied Regression Analysis, Ultima Edizione
· A.J.Izenman, Modern multivariate statistical techniques.. Regression, classification, and manifold learning, Springer, 2008
Modalità di verifica dell’apprendimento e criteri di valutazione
Scritto in laboratorio (svolgimento esercizi con PC)
MAT/06 - PROBABILITA' E STATISTICA MATEMATICA - CFU: 3
Laboratori: 36 ore
Docente/i
Ricevimento:
su appuntamento
ufficio 2099
Ricevimento:
Su appuntamento per email
studio o online (videoconferenza)