Bioinformatica e biologia computazionale

A.A. 2024/2025
6
Crediti massimi
48
Ore totali
SSD
BIO/11 BIO/19
Lingua
Italiano
Obiettivi formativi
I recenti avanzamenti metodologici nel campo della biologia molecolare e della genetica hanno portato ad un importante aumento dei volumi di dati disponibili, permettendo studi di biodiversità ed evoluzione prima impossibili. Sfruttare questa enorme miniera di informazioni richiede però di saper maneggiare alcuni basilari strumenti statistici ed informatici. Questo corso fornirà un'introduzione completa ad R, un linguaggio di programmazione ampiamente utilizzato per il calcolo statistico e la grafica, con un focus su semplici metodologie statistiche di immediata rilevanza per studi di biodiversità ed evoluzione. Gli studenti impareranno ad installare R Studio (l'interfaccia grafica di R), eseguire test statistici di base (confronto medie, regressioni lineari, etc.) e a preparare grafici. Il corso includerà anche un caso di studio sull'analisi dei dati di sequenziamento del DNA ambientale (eDNA) per lo studio della diversità microbica.
Risultati apprendimento attesi
Il corso si prefigge lo scopo di fornire agli studenti: i) un'introduzione sull'applicazione della bioinformatica in campo evoluzionistico ed ecologico; ii) capacità di gestire ed analizzare dati utilizzando R; iii) lo sviluppo di capacità di scelta ed esecuzione di analisi statistiche di base; iv) la capacità di preparare grafici di alta qualità in R, come heatmap e Principal Component Analysis (PCA). Inoltre, il corso si propone di stimolare lo studente a sviluppare le proprie capacità informatico/statistiche anche nel resto del percorso di crescita universitario e post-universitario, attraverso l'esplorazione della miriade di pacchetti di R disponibili.
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Primo semestre

Programma
In primo luogo, gli insegnamenti introdurranno gli studenti ai principi, concetti e metodi statistici comunemente utilizzati per l'analisi e l'interpretazione di dati biologici su larga scala:

Introduzione all'ambiente R per l'analisi dei dati biologici - 1 cfu (8 ore)
Come importare i dati in R
Strutture dati di base, dataframe, vettori, matrici
Installazione e gestione di pacchetti software
Introduzione all'ambiente grafico R
Utilizzo di software statistico. Esempi in R.

Tecniche di riepilogo e rappresentazione dei dati - 1 cfu (8 ore)
Riduzione della dimensionalità e analisi dei componenti principali
Violin plot/boxplot e confronto visivo delle distribuzioni dei dati
Mappe di calore e clustering dei dati

Markdown, formattazione e generazione di report - 1 cfu (8 ore)
RMarkdown

A questa prima parte del corso seguirà un'introduzione all'analisi dei dati di Next Generation Sequencing (NGS) mediante R, con approfondimenti sui principi teorici e pratici alla base dei metodi all'avanguardia per lo studio dell'analisi di dati di sequenziamento del DNA ambientale (eDNA) per studiare la diversità microbica.
Prerequisiti
Per la frequenza del corso è fortemente consigliata la conoscenza degli argomenti di base della biologia molecolare, con particolare riferimento al sequenziamento degli acidi nucleici, alla struttura dei geni e de genomi degli organismi procariotici ed eucariotici.
Metodi didattici
Modalità didattica: lezioni frontali affiancate da esercitazioni. Gli insegnanti assegneranno degli esercizi alla fine della maggior parte delle lezioni per aiutare a fissare i concetti tra le lezioni. La frequenza è altamente raccomandata.
Materiale di riferimento
Copie delle diapositive proiettate durante le lezioni, nonché ulteriori materiali e dataset saranno resi disponibili attraverso il sito web del corso sulla piattaforma ARIEL dell'Università degli Studi di Milano. Questo materiale è inteso come supporto alle lezioni frontali e il suo studio non può essere considerato una piena alternativa alla frequenza costante delle lezioni. Il materiale è reso disponibile solo agli studenti iscritti al Corso di Laurea in Biologia Molecolare della Cellula e non deve essere distribuito ad altri senza espresso consenso dei docenti.
Modalità di verifica dell’apprendimento e criteri di valutazione
Progetto di gruppo + prova orale
Agli studenti verrà richiesto di svolgere un piccolo progetto consistente nell'analisi di dati reali, attraverso le tecniche e i metodi appresi durante il corso. Gli studenti produrranno e presenteranno una relazione descrivendo i loro risultati agli insegnanti.
La consegna del report è prevista almeno 48h prima dell'appello d'esame prescelto.
L'esame prevede una discussione critica con i docenti dei principali risultati e delle tecniche utilizzate. L'esame si intenderà superato con il punteggio pari o superiore a 18/30.
BIO/11 - BIOLOGIA MOLECOLARE - CFU: 3
BIO/19 - MICROBIOLOGIA - CFU: 3
Lezioni: 48 ore
Docente/i
Ricevimento:
Giovedì(Thursday) 15:00-17:00
Secondo piano torre B