Statistica e analisi dei dati

A.A. 2017/2018
Insegnamento per
6
Crediti massimi
60
Ore totali
Lingua
Italiano
Obiettivi formativi
Il corso si propone di introdurre lo studente ai concetti di base del Calcolo delle Probabilità e della Statistica inferenziale e di indicare le principali applicazioni di queste discipline in ambito informatico.
Saper valutare e utilizzare le tecniche di base del calcolo della probabilità e della statistica nella prospettiva di modellare e analizzare problemi e sistemi in regime di incertezza.

Struttura insegnamento e programma

Edizione attiva
Responsabile
Esercitazioni: 36 ore
Lezioni: 24 ore
Informazioni sul programma
PARTE I: PROBABILITÀ ELEMENTARE
- Introduzione: Modelli probabilistici. Esito, spazio degli esiti o dei campioni, evento,
probabilità di un evento e del complementare. Interpretazione frequentistica. Legge dei
grandi numeri. Probabilità dell'unione.
- Probabilità condizionata: Eventi dipendenti ed eventi indipendenti. Regola del prodotto.
Verifiche dell'indipendenza. Albero delle alternative e regola delle probabilità totali. Alcune
applicazioni al campo dell'affidabilità dei sistemi. Teorema di Bayes e sue applicazioni
elementari.
- Valore atteso: Calcolo del valore atteso di una quantità aleatoria mediante l'albero delle
alternative.

PARTE II: INTRODUZIONE ALLE VARIABILI ALEATORIE
- Introduzione alle variabili aleatorie: Quando gli eventi sono numeri. Definizione di
variabile aleatoria, distribuzione e densità di Probabilità. Distribuzioni e densità
elementari. Funzione cumulativa e anticumulativa. Moda, mediana e media. Quartili.
Intervallo interquartile. Percentili. Quantili. Inversa delle cumulativa o funzione quantile.
Momenti di ordine superiore. Momenti centrali. Varianza. Deviazione standard. Cenni al
concetto di informazione. Valore atteso di una funzione di variabili aleatorie.
- Principali distribuzioni e densità di probabilità. Geometrica, Esponenziale; Bernoulliana,
Binomiale, Poissoniana, Gaussiana, legge 3-sigma; Processi stocastici: processi
Bernoulliani e processi Poissoniani: Mancanza di memoria, merging e splitting. Binomiale
Negativa, Erlang. Distribuzione Ipergeometrica.

PARTE III: ARGOMENTI AVANZATI
- Somma di variabili aleatorie: Somma di variabili aleatorie indipendenti. Convoluzione. Uso
delle funzioni generatrici delle probabilità e dei momenti. Teorema del Limite Centrale.
Cenni al Teorema Generalizzato del Limite Centrale. Applicazioni ai cammini aleatori.
- Variabili aleatorie in 2D, 3D e più dimensioni: Densità e distribuzioni congiunte e
marginali. Dipendenza per distribuzioni e densità: distribuzioni condizionate (ad un evento
o ad una variabile aleatoria). Valore atteso condizionale. Correlazione e covarianza.
Somma di variabili correlate. Trasformazioni di coordinate 1D, 2D, 3D. Simulazione di
distribuzioni e densità qualunque a partire dalla densità uniforme.
- Distribuzioni campionarie: Distribuzioni del minimo, del massimo e della media di un
campione.
- Metodi Bayesiani: Teorema di Bayes con ipotesi numeriche: ruolo della lilkelihood e ruolo
della prior. Probabilità inversa per processi Bernoulliani. Probabilità inversa per
Gaussiana.
- Statistica classica: Massima Verosimiglianza: stima della media; errore statistico. Stima
della varianza.
- Catene di Markov: Concetti di base. Stati transienti e stati ricorrenti. Stati assorbenti.
Catene ergodiche e regime stazionario: tempi di rilassamento. Applicazioni varie dai
protocolli epidemici, ai sistemi auto-organizzanti, alla generazione di numeri pseudocasuali,
alla teoria delle code. Cenni ai modelli di Markov nascosti (Hidden Markov
Models) e a loro applicazioni in speach processing.
Prerequisiti e modalità di esame
L'esame sara' scritto e comprendera' tipicamente cinque esercizi strutturati in domande a risposta libera.
Periodo
Secondo semestre
Periodo
Secondo semestre
Modalità di valutazione
Esame
Giudizio di valutazione
voto verbalizzato in trentesimi
Docente/i
Ricevimento:
controllare tramite email
studio presso Dipartimento di Informatica sede di Crema o di Milano
Ricevimento:
Su appuntamento (concordato per email o telefono)
Dipartimento di Informatica, via Celoria 18, stanza 6004 (6 piano, ala Ovest), Milano o Polo didattico di Crema (CR)