Bioinformatica

A.A. 2019/2020
6
Crediti massimi
48
Ore totali
SSD
INF/01
Lingua
Italiano
Obiettivi formativi
L'insegnamento si propone di:
- Fornire allo studente le conoscenze fondamentali per l'analisi di dati complessi in ambito biologico e medico con metodi di Apprendimento Automatico.
- Introdurre lo studente alle metodologie computazionali allo stato dell'arte per estrarre conoscenza biologica e medica da collezioni, anche massive, di dati o osservazioni o in presenza di informazione incerta, e per creare modelli predittivi per applicazioni fondamentali in ambito bio-medico.
- Fornire gli strumenti metodologici fondamentali per intraprendere in maniera autonoma attività di approfondimento e ricerca scientifica secondo standard internazionali nell'area della Bioinformatica e della Biologia Computazionale.
Risultati apprendimento attesi
- Capacità di applicare le principali metodologie di Apprendimento Automatico per l'analisi dei dati bio-molecolari rivolte sia all'estrazione di conoscenza, sia alla costruzioni di modelli predittivi nell'ambito della Biologia Molecolare e della Medicina Personalizzata.
- Comprensione delle problematiche legate al trattamento di dati su larga scala in ambito biologico e medico.
- Capacità di applicare ed adattare modelli di Apprendimento Automatico sviluppati in diversi ambiti applicativi nel contesto della Bioinformatica e della Biologia Computazionale
- Capacità di ragionare criticamente e di porre in discussione scelte progettuali e implementative.
Tali capacità verranno valutate attraverso
una relazione relativa ad un progetto software ed una discussione orale sui contenuti del corso.
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo semestre

Programma
L'insegnamento fornisce strumenti metodologici per affrontare problemi rilevanti nell'ambito della biologia Molecolare e della Medicina con algoritmi e tecniche di Machine Learning.
L'insegnamento si articola in due parti principali: a) Introduzione ai metodi di Machine Learning: b) Metodi di Machine Learning per la Biologia Computazionale.
Nella prima parte (Introduzione ai metodi di Machine Learning) vengono introdotti:
a) i concetti fondamentali di apprendimento supervisionato, semi-supervisionato e non supervisionato con alcun esempi di metodi di Machine Learning per ciascuna tipologia di apprendimento automatico
b) le tecniche speprimentali per la stima dell' errore di generalizzazione dei sistemi di Apprendimento Automatico.
Nella seconda parte (Metodi di Machine Learning per la Biologia Computazionale) viene fornito un quadro generale delle applicazioni dei metodi di Machine Learning in Biologia Computazionale ed in particolare vengono trattati i seguenti problemi, con un focus particolare sulle metodologie di apprendimento utilizzate:
a) ll problema della predizione supervisionata della funzione delle proteine
b) Problemi di Biologia Computazionale basati sull'analisi semi-supervisionata di grafi
c) Problemi di apprendimento supervisionato per la Genomica Medica
Per ognuno dei problemi di Biologia Computazionale affrontati, vengono fornite le conoscenze biologiche necessarie per modellare i problemi bio-medici affrontati come problemi di Machine Learning.
Prerequisiti
Nozioni di analisi matematica e statistica, appresi nei corsi del triennio di Informatica (o in corsi equivalenti a Matematica del Continuo e Matematica del Discreto per studenti provenienti da altre lauree triennali).
Insegnamenti consigliati (ma non obbligatori): Metodi Statistici per l'Apprendimento e Sistemi Intelligenti (corso di laurea in Informatica)
Metodi didattici
Le lezioni sono svolte frontalmente o sotto forma di discussione con gli studenti riguardo a materiale didattico ed articoli precedentemente indicati. Sono previsti anche lavori di gruppo per lo svolgimento di progetti software relativi ad argomenti del corso.
Materiale di riferimento
Bibliografia e materiale didattico relativo all'insegnamento (slide e articoli scientifici) sono disponibili dalla pagina web dell'insegnamento stesso:
http://homes.di.unimi.it/valentini/CorsoBioinformatica1920.html
Modalità di verifica dell’apprendimento e criteri di valutazione
Modalità d'esame:
Si articola in 2 parti:
I. Svolgimento di un progetto software oppure discussione orale di letteratura scientifica, relativi ad un argomento trattato durante il corso. Il progetto software richiede, oltre alla scrittura del codice per l'analisi di dati genomici, la redazione di un report che descriva il problema affrontato, i metodi di Machine Learning utilizzati, il set-up sperimentale, i risultati ottenuti ed una beve discussione sui risultati, delineando i vantaggi e le limitazioni dell'approccio proposto. La discussione orale della letteratura scientifica ha lo scopo di verificare che lo studente abbia compreso il contenuto scientifico e che sia in grado di evidenziare gli aspetti problematici e critici del lavoro studiato.
II. Discussione orale sugli argomenti trattati durante il corso.
Al termine della prova orale viene formulata la valutazione complessiva, espressa in trentesimi, tenendo conto dei seguenti fattori: grado di conoscenza degli argomenti, capacità di applicare le conoscenze acquisite alla risoluzione di problemi concreti, capacità di ragionamento critico, chiarezza espositiva e proprietà di linguaggio.
INF/01 - INFORMATICA - CFU: 6
Lezioni: 48 ore
Turni:
-
Docente: Valentini Giorgio
Docente/i
Ricevimento:
Per appuntamento tramite e-mail
Diparitmento Informatica, via Celoria 18, stanza 3011