Statistica e analisi dei dati

A.A. 2019/2020
Insegnamento per
6
Crediti massimi
60
Ore totali
SSD
INF/01
Lingua
Italiano
Obiettivi formativi
Gli studenti:
- saranno in grado di effettuare analisi esplorative di base su dataset, sfruttando i principali indici e metodi grafici della statistica descrittiva;
- conosceranno le basi della teoria della probabilità e saranno in grado di calcolare le probabilità di semplici eventi;
- conosceranno le principali distribuzioni di probabilità e le loro proprietà;
- saranno in grado di calcolare stime a partire da campioni casuali, valutando nel contempo le proprietà principali delle statistiche coinvolte;
- sapranno comprendere le analisi statistiche condotte da altri;
- conosceranno semplici metodi per la classificazione binaria e sapranno valutarne le performance;
- avranno acquisito le conoscenze di base per poter affrontare lo studio di tecniche più avanzate di analisi e modellazione dei dati.
Gli studenti:
- saranno in grado di effettuare analisi esplorative di base su dataset, sfruttando i principali indici e metodi grafici della statistica descrittiva;
- conosceranno le basi della teoria della probabilità e saranno in grado di calcolare le probabilità di semplici eventi;
- conosceranno le principali distribuzioni di probabilità e le loro proprietà;
- saranno in grado di calcolare stime a partire da campioni casuali, valutando nel contempo le proprietà principali delle statistiche coinvolte;
- sapranno comprendere le analisi statistiche condotte da altri;
- conosceranno semplici metodi per la classificazione binaria e sapranno valutarne le performance;
- avranno acquisito le conoscenze di base per poter affrontare lo studio di tecniche più avanzate di analisi e modellazione dei dati.

Struttura insegnamento e programma

Edizione attiva
Responsabile
INF/01 - INFORMATICA - CFU: 6
Esercitazioni: 36 ore
Lezioni: 24 ore
Docente: Malchiodi Dario
STUDENTI FREQUENTANTI
Programma
Introduzione al linguaggio python
Statistica descrittiva:
- Frequenze e frequenze cumulate. Frequenze congiunte e marginali.
- Indici di centralità, dispersione, correlazione, eterogeneità e concentrazione.
- Metodi grafici: diagrammi di dispersione, diagrammi a scatola e diagrammi QQ.
- Classificatori e curve ROC.
Calcolo delle probabilità:
- Calcolo combinatorio. Richiami di teoria degli insiemi.
- Assiomi di probabilità.
- Probabilità condizionata. Teorema di Bayes. Indipendenza.
- Variabili aleatorie discrete.
- Variabili aleatorie multivariate. Indipendenza di variabili aleatorie.
- Variabili aleatorie continue.
- Disuguaglianze di Markov e di Tchebyshev
- Modelli di Bernoulli, binomiale, geometrico, di Poisson, uniforme discreto e ipergeometrico.
- Modelli uniforme continuo, esponenziale e gaussiano.
- Processo di Poisson.
Statistica inferenziale:
- Popolazione, campione casuale e stima puntuale
- Media campionaria. Teorema centrale del limite.
- Varianza campionaria.
- Stimatori non deviati e stimatori consistenti in media quadratica.
- Calcolo della taglia del campione.
Propedeuticità
Matematica del continuo (propedeuticità obbligatoria)
Matematica del discreto (propedeuticità consigliata)
Prerequisiti e modalità di esame
Prerequisiti: basi di programmazione, matematica del continuo e matematica del discreto.
Modalità di esame: prova orale a seguito di una selezione tramite prova scritto/pratica.
Metodi didattici
Lezioni frontali ed esercitazioni
Materiale didattico e bibliografia
S. Ross, Introduzione alla statistica, Apogeo education, 2014, ISBN 9788838786020
S. Ross, Probabilità e statistca per l'ingegneria e le scienze, terza edizione, Apogeo education, 2015, ISBN 8891609946
Dispense
STUDENTI NON FREQUENTANTI
Programma
Introduzione al linguaggio python
Statistica descrittiva:
- Frequenze e frequenze cumulate. Frequenze congiunte e marginali.
- Indici di centralità, dispersione, correlazione, eterogeneità e concentrazione.
- Metodi grafici: diagrammi di dispersione, diagrammi a scatola e diagrammi QQ.
- Classificatori e curve ROC.
Calcolo delle probabilità:
- Calcolo combinatorio. Richiami di teoria degli insiemi.
- Assiomi di probabilità.
- Probabilità condizionata. Teorema di Bayes. Indipendenza.
- Variabili aleatorie discrete.
- Variabili aleatorie multivariate. Indipendenza di variabili aleatorie.
- Variabili aleatorie continue.
- Disuguaglianze di Markov e di Tchebyshev
- Modelli di Bernoulli, binomiale, geometrico, di Poisson, uniforme discreto e ipergeometrico.
- Modelli uniforme continuo, esponenziale e gaussiano.
- Processo di Poisson.
Statistica inferenziale:
- Popolazione, campione casuale e stima puntuale
- Media campionaria. Teorema centrale del limite.
- Varianza campionaria.
- Stimatori non deviati e stimatori consistenti in media quadratica.
- Calcolo della taglia del campione.
Prerequisiti e modalità di esame
Prerequisiti: basi di programmazione, matematica del continuo e matematica del discreto.
Modalità di esame: prova orale a seguito di una selezione tramite prova scritto/pratica.
Materiale didattico e bibliografia
S. Ross, Introduzione alla statistica, Apogeo education, 2014, ISBN 9788838786020
S. Ross, Probabilità e statistca per l'ingegneria e le scienze, terza edizione, Apogeo education, 2015, ISBN 8891609946
Dispense
Periodo
Secondo semestre
Periodo
Secondo semestre
Modalità di valutazione
Esame
Giudizio di valutazione
voto verbalizzato in trentesimi
Docente/i
Ricevimento:
Su appuntamento
Stanza 5015, Dipartimento di Informatica