Informatica e statistica per le biotecnologie (comune)

A.A. 2021/2022
6
Crediti massimi
48
Ore totali
SSD
FIS/01 FIS/02 FIS/03 FIS/04 FIS/05 FIS/06 FIS/07 FIS/08 INF/01 MAT/01 MAT/02 MAT/03 MAT/04 MAT/05 MAT/06 MAT/07 MAT/08 MAT/09 SECS-S/01 SECS-S/02
Lingua
Italiano
Obiettivi formativi
Il corso è strutturato in un modulo di Informatica ed un modulo di statistica. L'obiettivo formativo dell'insegnamento nel suo complesso e' quello di rendere gli studenti autonomi nell'esecuzione e pianificazione di test statistici mediante l'utilizzo del calcolatore. A tal fine le lezioni sono somministrate con cadenza settimanale e comprendono una lezione di Informatica, una di Statistica ed un terzo incontro dedicato alla realizzazione dei concetti spiegati nella lezione di Statistica mediante linguaggio R.
Risultati apprendimento attesi
Al termine dell'insegnamento lo studente dovrà essere in grado di comprendere le problematiche ed i punti di forza dei metodi statistici presentati durante il corso ed essere in grado di pianificare e realizzare test statistici mediante l'utilizzo del linguaggio R. Dovrà inoltre essere in grado di presentare in modo chiaro i risultati di suddetti test mediante le funzionalità grafiche offerte dal linguaggio R.
Programma e organizzazione didattica

Linea AL

Responsabile
Periodo
Secondo semestre
In relazione alle modalita' di erogazione di attivita' formative per l'a.a. 2021/22, verranno date indicazioni piu' specifiche nei prossimi mesi, in base all'evoluzione della situazione sanitaria.
Programma
Informatica
Il modulo di Informatica inizierà con una breve introduzione alle architetture e ai sistemi d'informazione e dielaborazione dei dati, mentre il resto del corso sarà dedicato ai principi della programmazione imperativa emodulare, utilizzando il linguaggio R come riferimento.
- Architettura di un calcolatore
- Cenni alla rappresentazione delle informazioni- Principali concetti di un generico linguaggio di programmazione
- Programmi e processi
- Ambiente R
- Variabili e assegnamenti
- Struttura dati vettore. Vettori numerici, carattere, logici
- Selezione e accesso, differenti tipologie
- Generazione di sequenze regolari
- Matrici: costruzione, concatenazione, prodotto. Selezione e accesso
- Comando table
- Gestione dati eterogenee: liste, data frame, loro tipologie di accesso
- Controllo del flusso
- Istruzioni condizionali e cicli
- Efficienza dei cicli in R
- Funzioni e Script
- Ambiente grafico di R
- Comandi plot, barplot, hist, boxplot
- Grafici a torta 2D e 3D
- Salvataggio figure
- Generazione di numeri pseudocasuali
- Principali distribuzioni di probabilità
- Funzioni qqnorm, qqline, qqplot per confrontare distribuzioni di probabilità

Statistica
Il modulo di statistica ha l'obbiettivo di fornire le nozioni fondamentali di statistica per le biotecnologie. Particolare attenzione viene data all'aspetto applicativo della statistica, con enfasi speciale rivolta all'interpretazione dei dati ed ai test usati nell'analisi dei dati biologici. Il corso prevede numerosi esempi pratici e fornisce allo studente conoscenze di base che consentano di delineare un workflow logico di supporto nella scelta dell'approcciostatistico più appropriato dato il problema biologico da affrontare.

- Introduzione alla statistica. Concetti di base, popolazioni e campioni, campionamento, tipo di dati, tipo di variabili, tipo di studi
- Visualizzazione dei dati. Tabelle di frequenza, diagrammi, grafici e istogrammi
- Indici statistici e descrizione dei dati
- Stima e incertezza
- Probabilità. Evento, probabilità di un evento. Probabilità di eventi complessi
- Distribuzioni di probabilità
- Concetti di base del processo di test delle ipotesi
- Test statistici per variabili nominali. Test del chi quadrato per bontà di adattamento. Tabelle di contingenza, Odds Ratio, test del chi quadrato per indipendenza, test esatto di Fisher
- Test statistici per variabili continue e discrete
Prerequisiti
L'insegnamento ha come propedeuticità l'insegnamento di Matematica del corso di Laurea in Biotecnologia (Classe L-2), che ovviamente non preclude la possibilità di seguire il corso. Tuttavia, il corso darà per consolidate da parte degli studenti le conoscenze matematiche di base necessarie alla comprensione dell'insegnamento (specialmente in relazione agli argomenti trattati nel modulo di Statistica).
Metodi didattici
Statistica: L'insegnamento sarà organizzato in lezioni frontali. Informatica: L'insegnamento sarà organizzato in lezioni frontali.
Materiale di riferimento
Informatica:
- R for data science. H. Wickham, G. Grolemund. Editore: O'Reilly, ISBN-13: 978-1491910399
- Slide del corso (contengono tutto il necessario per superare l'esame)
- Manuali on-line:
- http://cran.r-project.org/doc/manuals/R-intro.pdf
- http://cran.r-project.org/doc/manuals/R-lang.pdf
- http://cran.r-project.org/doc/manuals/R-admin.pdf
- http://cran.r-project.org/doc/manuals/R-data.pdf
- http://cran.r-project.org/doc/contrib/Verzani-SimpleR.pdf

Statistica:
Testo principale
- Analisi Statistica dei Dati Biologici. Whitlock MC, Schulter D. Zanichelli
- Handbook of Biological Statistics. John H. MacDonald. Printed version and online
- Slides del corso
Altri riferimenti:
- Introductory Statistics. Ross SM. Elsevier AP - Third Edition (alcuni concetti introdotti nei capitoli 5 e6 relativi a variabili casuali discrete e continue)
Modalità di verifica dell’apprendimento e criteri di valutazione
Le sessioni d'esame consistono in una prova unica per i moduli di Informatica e di Statistica e si svolgeranno in laboratori informatizzati. Il tema d'esame conterrà domande riferite agli argomenti trattati sia nel modulo di Informatica, che in quello di Statistica. Il massimo punteggio ottenuto rispondendo in modo corretto a tutte le domande è 30. Non e' possibile, per gli studenti, sostenere unicamente l'esame di Informatica o quello di Statistica. L'esame si intende superato se la valutazione complessiva è uguale o maggiore di 18. Agli studenti, durante l'esame, è consentito l'utilizzo di tutto il materiale didattico del corso e degli appunti presi a lezione.
Moduli o unità didattiche
Unità didattica: Informatica
FIS/01 - FISICA SPERIMENTALE - CFU: 0
FIS/02 - FISICA TEORICA, MODELLI E METODI MATEMATICI - CFU: 0
FIS/03 - FISICA DELLA MATERIA - CFU: 0
FIS/04 - FISICA NUCLEARE E SUBNUCLEARE - CFU: 0
FIS/05 - ASTRONOMIA E ASTROFISICA - CFU: 0
FIS/06 - FISICA PER IL SISTEMA TERRA E PER IL MEZZO CIRCUMTERRESTRE - CFU: 0
FIS/07 - FISICA APPLICATA (A BENI CULTURALI, AMBIENTALI, BIOLOGIA E MEDICINA) - CFU: 0
FIS/08 - DIDATTICA E STORIA DELLA FISICA - CFU: 0
INF/01 - INFORMATICA - CFU: 0
MAT/01 - LOGICA MATEMATICA - CFU: 0
MAT/02 - ALGEBRA - CFU: 0
MAT/03 - GEOMETRIA - CFU: 0
MAT/04 - MATEMATICHE COMPLEMENTARI - CFU: 0
MAT/05 - ANALISI MATEMATICA - CFU: 0
MAT/06 - PROBABILITA E STATISTICA MATEMATICA - CFU: 0
MAT/07 - FISICA MATEMATICA - CFU: 0
MAT/08 - ANALISI NUMERICA - CFU: 0
MAT/09 - RICERCA OPERATIVA - CFU: 0
SECS-S/01 - STATISTICA - CFU: 0
SECS-S/02 - STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA - CFU: 0
Lezioni: 24 ore
Docente: Re' Matteo

Unità didattica: Statistica
FIS/01 - FISICA SPERIMENTALE - CFU: 0
FIS/02 - FISICA TEORICA, MODELLI E METODI MATEMATICI - CFU: 0
FIS/03 - FISICA DELLA MATERIA - CFU: 0
FIS/04 - FISICA NUCLEARE E SUBNUCLEARE - CFU: 0
FIS/05 - ASTRONOMIA E ASTROFISICA - CFU: 0
FIS/06 - FISICA PER IL SISTEMA TERRA E PER IL MEZZO CIRCUMTERRESTRE - CFU: 0
FIS/07 - FISICA APPLICATA (A BENI CULTURALI, AMBIENTALI, BIOLOGIA E MEDICINA) - CFU: 0
FIS/08 - DIDATTICA E STORIA DELLA FISICA - CFU: 0
INF/01 - INFORMATICA - CFU: 0
MAT/01 - LOGICA MATEMATICA - CFU: 0
MAT/02 - ALGEBRA - CFU: 0
MAT/03 - GEOMETRIA - CFU: 0
MAT/04 - MATEMATICHE COMPLEMENTARI - CFU: 0
MAT/05 - ANALISI MATEMATICA - CFU: 0
MAT/06 - PROBABILITA E STATISTICA MATEMATICA - CFU: 0
MAT/07 - FISICA MATEMATICA - CFU: 0
MAT/08 - ANALISI NUMERICA - CFU: 0
MAT/09 - RICERCA OPERATIVA - CFU: 0
SECS-S/01 - STATISTICA - CFU: 0
SECS-S/02 - STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA - CFU: 0
Lezioni: 24 ore

Linea MZ

Responsabile
Periodo
Secondo semestre
Perdurando la pandemia da SARS-CoV-2, la modalità di fruizione, se in presenza o da remoto, sarà resa nota nei prossimi mesi.
Il programma e il materiale di riferimento non subiranno variazioni rispetto a quanto indicato nel manifesto degli studi.
L'esame si svolgerà in forma scritta al calcolatore in presenza in laboratorio, oppure utilizzando la piattaforma Microsoft Teams se la pandemia non lo consentisse. L'obiettivo della prova di esame è la verifica del raggiungimento da parte degli studenti degli obiettivi formativi previsti dall'insegnamento.
Programma
Il modulo di Informatica inizierà con una breve introduzione alle architetture e ai sistemi d'informazione e di elaborazione dei dati, mentre il resto del corso sarà dedicato ai principi della programmazione imperativa e modulare, utilizzando il linguaggio R come riferimento.

Programma dettagliato.

Informatica
- Architettura di un calcolatore
- Cenni alla rappresentazione delle informazioni
- Principali concetti di un generico linguaggio di programmazione
- Programmi e processi
- Ambiente R.
- Variabili e assegnamenti
- Struttura dati vettore. Vettori numerici, carattere, logici
- Selezione e accesso, differenti tipologie
- Generazione di sequenze regolari
- Matrici: costruzione, concatenazione, prodotto. Selezione e accesso
- Comando table
- Gestione dati eterogenee: liste, data frame, loro tipologie di accesso
- Controllo del flusso
- Istruzioni condizionali e cicli
- Efficienza dei cicli in R
- Funzioni e Script in R
- Ambiente grafico di R
- Comandi plot, barplot, hist, boxplot
- Grafici a torta 2D e 3D
- Salvataggio figure
- Generazione di numeri pseudocasuali
- Principali distribuzioni di probabilità
- Funzioni qqnorm, qqline, qqplot per confrontare distribuzioni di probabilità

Statistica
- Introduzione alla statistica. Concetti di base, popolazioni e campioni, campionamento, tipo di dati, tipo di variabili, tipo di studi
- Visualizzazione dei dati. Tabelle di frequenza, diagrammi, grafici e istogrammi
- Indici statistici e descrizione dei dati
- Stima e incertezza
- Probabilità. Evento, probabilità di un evento. Probabilità di eventi complessi
- Distribuzioni di probabilità
- Concetti di base del processo di test delle ipotesi
- Test statistici per variabili nominali. Test del chi quadrato per bontà di adattamento. Tabelle di contingenza, Odds Ratio, test del chi quadrato per indipendenza, test esatto di Fisher
- Test statistici per variabili continue e discrete
Prerequisiti
L'insegnamento ha come propedeuticità l'insegnamento di Matematica del corso di Laurea in Biotecnologia (Classe L-2), che ovviamente non preclude la possibilità di seguire il corso. Tuttavia, il corso darà per consolidate da parte degli studenti le conoscenze matematiche di base necessarie alla comprensione dell'insegnamento (in modo particolare circa agli argomenti trattati nel modulo di Statistica).
Metodi didattici
Il corso è organizzato in lezioni frontali ed esercitazioni individuali o di gruppo. Si consiglia fortemente di partecipare alle lezioni muniti di computer portatile (in caso di ritorno alla didattica in presenza).
Materiale di riferimento
Per il modulo di Informatica sono consigliati i seguenti manuali on-line:

Italiano
http://www.r-project.it/books/nozioniR.pdf

Inglese
1. http://cran.r-project.org/doc/manuals/R-intro.pdf
2. http://cran.r-project.org/doc/manuals/R-lang.pdf
3. http://cran.r-project.org/doc/manuals/R-admin.pdf
4. http://cran.r-project.org/doc/manuals/R-data.pdf
5. http://cran.r-project.org/doc/contrib/Verzani-SimpleR.pdf

Per il modulo di Statistica invece si consigliano i seguenti riferimenti:
1. Analisi Statistica dei Dati Biologici. Whitlock MC, Schulter D. Zanichelli
2. Handbook of Biological Statistics. John H. MacDonald. Printed version and online
Other suggested books:
3. Intuitive Biostatistics: a non-mathematical guide to statistical thinking, Fourth EditionMotulsky H. Oxford University Press.
4. Introductory Statistics. Ross SM. Elsevier AP - Third Edition (alcuni concetti introdotti nei capitoli 5 e 6 relativi a variabili casuali discrete e continue)
Modalità di verifica dell’apprendimento e criteri di valutazione
La prova d'esame consiste in una prova unica per i moduli di informatica e di statistica, composta da alcuni esercizi da svolgersi al calcolatore, comprendenti una parte di informatica e una di statistica.
Durata: 1h 30m.
Non è consentito durante l'esame l'utilizzo di dispositivi dotati di connessione Internet (cellulari, tablet, etc.).
La prova ha una valutazione espressa in trentesimi.
Le sessioni d'esame si svolgeranno in laboratori informatizzati, in condizioni non di emergenza, o in aule virtuali accessibili da remoto altrimenti. Il tema d'esame conterrà domande riferite agli argomenti trattati sia nel modulo di Informatica che in quello di Statistica. Non è possibile, per gli studenti, sostenere unicamente l'esame di Informatica o quello di Statistica. L'esame si intende superato se la valutazione complessiva e uguale o maggiore di 18 (almeno 9 in ciascun modulo).

Agli studenti, durante l'esame, è consentito l'utilizzo di tutto il materiale didattico del corso e degli appunti presi a lezione.
Moduli o unità didattiche
Unità didattica: Informatica
FIS/01 - FISICA SPERIMENTALE - CFU: 0
FIS/02 - FISICA TEORICA, MODELLI E METODI MATEMATICI - CFU: 0
FIS/03 - FISICA DELLA MATERIA - CFU: 0
FIS/04 - FISICA NUCLEARE E SUBNUCLEARE - CFU: 0
FIS/05 - ASTRONOMIA E ASTROFISICA - CFU: 0
FIS/06 - FISICA PER IL SISTEMA TERRA E PER IL MEZZO CIRCUMTERRESTRE - CFU: 0
FIS/07 - FISICA APPLICATA (A BENI CULTURALI, AMBIENTALI, BIOLOGIA E MEDICINA) - CFU: 0
FIS/08 - DIDATTICA E STORIA DELLA FISICA - CFU: 0
INF/01 - INFORMATICA - CFU: 0
MAT/01 - LOGICA MATEMATICA - CFU: 0
MAT/02 - ALGEBRA - CFU: 0
MAT/03 - GEOMETRIA - CFU: 0
MAT/04 - MATEMATICHE COMPLEMENTARI - CFU: 0
MAT/05 - ANALISI MATEMATICA - CFU: 0
MAT/06 - PROBABILITA E STATISTICA MATEMATICA - CFU: 0
MAT/07 - FISICA MATEMATICA - CFU: 0
MAT/08 - ANALISI NUMERICA - CFU: 0
MAT/09 - RICERCA OPERATIVA - CFU: 0
SECS-S/01 - STATISTICA - CFU: 0
SECS-S/02 - STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA - CFU: 0
Lezioni: 24 ore
Docente: Frasca Marco

Unità didattica: Statistica
FIS/01 - FISICA SPERIMENTALE - CFU: 0
FIS/02 - FISICA TEORICA, MODELLI E METODI MATEMATICI - CFU: 0
FIS/03 - FISICA DELLA MATERIA - CFU: 0
FIS/04 - FISICA NUCLEARE E SUBNUCLEARE - CFU: 0
FIS/05 - ASTRONOMIA E ASTROFISICA - CFU: 0
FIS/06 - FISICA PER IL SISTEMA TERRA E PER IL MEZZO CIRCUMTERRESTRE - CFU: 0
FIS/07 - FISICA APPLICATA (A BENI CULTURALI, AMBIENTALI, BIOLOGIA E MEDICINA) - CFU: 0
FIS/08 - DIDATTICA E STORIA DELLA FISICA - CFU: 0
INF/01 - INFORMATICA - CFU: 0
MAT/01 - LOGICA MATEMATICA - CFU: 0
MAT/02 - ALGEBRA - CFU: 0
MAT/03 - GEOMETRIA - CFU: 0
MAT/04 - MATEMATICHE COMPLEMENTARI - CFU: 0
MAT/05 - ANALISI MATEMATICA - CFU: 0
MAT/06 - PROBABILITA E STATISTICA MATEMATICA - CFU: 0
MAT/07 - FISICA MATEMATICA - CFU: 0
MAT/08 - ANALISI NUMERICA - CFU: 0
MAT/09 - RICERCA OPERATIVA - CFU: 0
SECS-S/01 - STATISTICA - CFU: 0
SECS-S/02 - STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA - CFU: 0
Lezioni: 24 ore
Docente: Gabrieli Paolo

Docente/i
Ricevimento:
Martedì 15-16
Via Celoria 18 - Stanza 3021
Ricevimento:
Dal lunedì al venerdì su appuntamento o dopo lezione
Via Celoria 26 o in aula lezione
Ricevimento:
Concordare via email e/o su piattaforma Microsoft Teams. Per specifici corsi fare riferimento al sito Ariel del corso.
Milano - via Celoria 18 (stanza 3010) e/o Ms Teams/Zoom