Statistical methods for machine learning | Università degli Studi di Milano Statale

A.A. 2019/2020

Crediti massimi

Ore totali

SSD

INF/01

Lingua

Inglese

Corsi di laurea che utilizzano l'insegnamento

Informatica (Classe LM-18)-immatricolati dall'a.a. 2014/2015

Obiettivi formativi

L'insegnamento descrive e analizza, in un contesto statistico rigoroso, alcuni delle più importanti tecniche algoritmiche di apprendimento automatico. Ciò fornisce allo studente un ricco insieme di strumenti concettuali e metodologici atti a comprendere il fenomeno dell'apprendimento nelle macchine.

Risultati apprendimento attesi

Al termine dell'insegnamento gli studenti saranno in grado di: (1) Comprendere il concetto di overfitting e il suo ruolo nel controllo del rischio statistico; (2) descrivere alcuni dei più importanti algoritmi di apprendimento automatico e spiegare come evitano l'overfitting; (3) eseguire esperimenti di apprendimento automatico usando la corretta metodologia statistica. Questi obiettivi verranno misurati attraverso la combinazione di due elementi: la relazione del progetto e la discussione orale. Il voto finale è basato sulla valutazione del progetto incrementato dalla valutazione della discussione orale.

Periodo: Secondo semestre

Orari delle lezioni

Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi

Calendario degli appelli

Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Cerca un corso singolo

Programma e organizzazione didattica

Edizione unica

Responsabile

Cesa Bianchi Nicolo' Antonio

Periodo

Secondo semestre

Programma

Programma

L'obiettivo del corso è di fornire i fondamenti metodologici all'apprendimento automatico. L'accento è sul progetto e l'analisi di algoritmi di apprendimento con prestazioni teoriche garantite.

Introduzione
L'algoritmo Nearest Neighbour
Predittori ad albero
Apprendimento statistico
Cross-validazione
Analisi del rischio di Nearest Neighbor
Analisi del rischio dei predittori ad albero
Consistenza e algoritmi non parametrici
Classificatori lineari
Discesa del gradiente sequenziale
Da rischio sequenziale a rischio statistico
Funzioni kernel
Support Vector Machines
Analisi di stabilità e controllo del rischio in SVM
Boosting
Controllo del rischio basato su compressione
Reti neuronali e apprendimento profondo

Prerequisiti

Si richiedono nozioni di base di analisi matematica, algebra lineare e statistica.

E` fortemente consigliato il superamento degli esami seguenti: Matematica del continuo, Matematica del discreto, Statistica e analisi dei dati.

Metodi didattici

Lezioni frontali.

Materiale di riferimento

Il riferimento principale sono le dispense disponibili tramite ncesa-bianchismml.ariel.ctu.unimi.it/

Un riferimento ulteriore è il libro di testo: Shai Shalev-Shwartz e Shai Ben-David, Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press, 2014.

Modalità di verifica dell’apprendimento e criteri di valutazione

L'esame consiste nella scrittura di una relazione di circa 10-15 pagine contenente la descrizione di un'attività sperimentale (progetto sperimentale) o un'analisi approfondita di un risultato teorico (progetto teorico). La relazione viene discussa in un esame orale in cui allo studente vengono chieste domande dettagliate sugli algoritmi utilizzati nel progetto oltre a domande più ad alto livello sul resto del programma. Il voto finale (in trentesimi) è ottenuto combinando la valutazione del progetto con la discussione orale.

Organizzazione didattica

INF/01 - INFORMATICA - CFU: 6

Lezioni: 48 ore

Docente: Cesa Bianchi Nicolo' Antonio

Turni:

Docente: Cesa Bianchi Nicolo' Antonio

Docente/i

Cesa Bianchi Nicolo' Antonio

Sito web

Ricevimento:

Su appuntamento

via Celoria 18. Stanza 7007