Metodi e linguaggi per il trattamento dei dati
A.A. 2020/2021
Obiettivi formativi
Il corso di propone l'obiettivo di fornire agli studenti le conoscenze teoriche e le competenze tecniche necessarie per descrivere statisticamente dati mediante l'utilizzo del linguaggio R, interagire con banche dati remote (ad esempio banche dati associate ai browser genomici) mediante l'utilizzo del linguaggio PERL ed effettuare inferenza attraverso esperimenti di apprendimento automatico realizzati mediante il linguaggio di programmazione PYTHON.
Risultati apprendimento attesi
Capacità di effettuare analisi statistiche utilizzando il linguaggio R
- Capacità di scrivere programmi/script in linguaggio R
- Capacità di realizzare programmi in linguaggio PERL
- Capacità di manipolare/analizzare dati in formato testuale (ad esempio sequenze proteiche e/o nucleotidiche) utilizzando PERL
- Capacità di realizzare programmi in linguaggio PYTHON
- Capacità di effettuare esperimenti di apprendimento automatico utilizzando PYTHON
- Capacità di scrivere programmi/script in linguaggio R
- Capacità di realizzare programmi in linguaggio PERL
- Capacità di manipolare/analizzare dati in formato testuale (ad esempio sequenze proteiche e/o nucleotidiche) utilizzando PERL
- Capacità di realizzare programmi in linguaggio PYTHON
- Capacità di effettuare esperimenti di apprendimento automatico utilizzando PYTHON
Periodo: Secondo semestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Secondo semestre
Programma
Parte 1 - metodi per l'analisi descrittiva: tabelle di frequenza, grafici, indici di posizione, di dispersione e di eterogeneità. Analisi di casi di studio utilizzando SPSS.
Parte 2 - metodi di inferenza statistica: stimatori della media e della varianza, intervalli di confidenza, test di ipotesi. Analisi di casi di studio utilizzando SPSS.
Parte 3 - accenno ai metodi di machine learning: metodi supervisionati e non supervisionati; metodi per modelli di classificazione (clustering, alberi di decisione, dendrogrammi, regressione logistica), metodi per modelli di previsione (regressione lineare, support vector machines, reti neurali); questioni importanti riguardo all'apprendimento (overfitting, non linearità, riduzione della dimensionalità, sbilanciamento dei dati); valutazione della bontà di un modello (accuratezza, tabella di confusione, specificità, sensibilità).
Parte 2 - metodi di inferenza statistica: stimatori della media e della varianza, intervalli di confidenza, test di ipotesi. Analisi di casi di studio utilizzando SPSS.
Parte 3 - accenno ai metodi di machine learning: metodi supervisionati e non supervisionati; metodi per modelli di classificazione (clustering, alberi di decisione, dendrogrammi, regressione logistica), metodi per modelli di previsione (regressione lineare, support vector machines, reti neurali); questioni importanti riguardo all'apprendimento (overfitting, non linearità, riduzione della dimensionalità, sbilanciamento dei dati); valutazione della bontà di un modello (accuratezza, tabella di confusione, specificità, sensibilità).
Prerequisiti
nessuno
Metodi didattici
METODI DIDATTICI (obbligatorio)- INDICARELA NUOVA COMBINAZIONE SOLO SE DIFFERENTE DA QUELLA GIA' INSERITA (ELIMINARE IN TAL CASO QUELLE RESTANTI)
Modalità di esame: Scritto e Orale; Modalità di frequenza: Fortemente consigliata; Modalità di erogazione: Tradizionale
Modalità di esame: Scritto e Orale; Modalità di frequenza: Fortemente consigliata; Modalità di erogazione: Tradizionale
Materiale di riferimento
Videolezioni e dispense sul sito Ariel
Modalità di verifica dell’apprendimento e criteri di valutazione
Modalità di verifica dell'apprendimento e criteri di valutazione
L'esame consiste di una prova pratica (analisi di un semplice caso di studio utilizzando un ambiente software per l'analisi dei dati) seguita da una prova orale relativa agli argomenti trattati a lezione.
L'esame consiste di una prova pratica (analisi di un semplice caso di studio utilizzando un ambiente software per l'analisi dei dati) seguita da una prova orale relativa agli argomenti trattati a lezione.
Docente/i
Ricevimento:
mercoledì dalle 10:30 alle 12:30 -- prendere appuntamento
via Celoria 18 quinto piano