Analisi dei dati per l'agricoltura

A.A. 2022/2023
6
Crediti massimi
68
Ore totali
SSD
AGR/17
Lingua
Italiano
Obiettivi formativi
Fornire le basi metodologiche e pratiche per una rigorosa gestione dei dati quantitativi in agricoltura, la progettazione di indagini campionarie, rilievi di campo e prove sperimentali in agricoltura.
Sviluppare capacità avanzate di utilizzo di fogli di calcolo e di software dedicati per la raccolta e per l'analisi statistica della sempre più rilevante massa di dati, gestionali e biologici, in agricoltura.
Fornire solide basi teoriche e pratiche per la lettura, analisi, interpretazione e presentazione dei dati provenienti da database del settore, indagini campionarie, misure di campo e risultati di prove sperimentali.
Risultati apprendimento attesi
Capacità di gestire dati provenienti da database nazionali ed internazionali di settore, e/o da rilievi campionari in agricoltura.
Capacità di svolgere analisi descrittive grafiche e quantitative, di analizzare trend, fattori di variazione e fattori di confondimento mediante l'utilizzo delle opportune tecniche grafiche e statistiche con fogli di calcolo e software di elaborazione statistica.
Capacità di presentare, leggere ed interpretare i dati provenienti sia dal campo sia dal laboratorio.
Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Primo semestre

Programma
Il programma in breve:
Il corso, dopo un richiamo dei concetti di base di statistica descrittiva affronta le principali tecniche di analisi dei dati utili per la valutazione delle informazioni quantitative e qualitative in agricoltura.
Le lezioni si articoleranno in una parte teorica ed una parte applicativa in aula di informatica.
In breve il corso affronterà: descrizione e rappresentazione di dati qualitativi e quantitativi provenienti da database nazionali ed internazionali. Rappresentazione grafiche, analisi dei trend e degli outlier. Distribuzioni campionarie e teoriche. Relazione fra variabili quantitative: covarianza, correlazione e regressione. Relazioni fra variabili quantitative. Normalizzazione e standardizzazione. Test delle ipotesi e test statistici per dati quantitativi e qualitativi. Analisi della varianza ad una e più vie. Fattori di confondimento, interazione, fattori fissi e casuali. Regressione lineare semplice e multipla, Disegno degli esperimenti e schemi sperimentali. Cenni di test non parametrici e di tecniche di analisi multivariata.

Il programma in dettaglio:
Creazione, gestione e preparazione di dataset quantitativi. 4 h
Richiami di statistica descrittiva: Rappresentazione grafica dei dati: istogrammi, diagrammi box plot, scatter plot 4h
indici di posizione e dispersione 4h
Misure di relazione fra variabili: covarianza. L'analisi della correlazione e della regressione lineare. Il metodo dei minimi quadrati per la stima dei parametri.4h
Caratteristiche delle popolazioni e dei campioni. Stima dei parametri di una popolazione: stima puntuale ed intervallare. Distorsione, efficienza e consistenza di uno stimatore. Il test statistico: concetti di ipotesi nulla, test bilaterali e unilaterali, livello di significatività e sua valutazione critica, errori di I e II tipo, potenza del test. 3 h
Distribuzioni campionarie e distribuzioni teoriche: binomiale, Poisson, normale, normale standardizzata, log-normale. 6h
Variabili qualitative: loro rappresentazione grafica e test di significatività. Test chi quadrato per la valutazione della bontà di adattamento di dati osservati a distribuzioni teoriche (equiprobabile, binomiale, Poisson) eper la verifica di ipotesi di indipendenza di variabili qualitative. Correzione di Yates. 6h
Test su una media. Z score. intervalli di confidenza, t test. Tecniche per i confronti tra due medie campionarie. Il test t per dati appaiati e per campioni indipendenti. Assunzioni. Problematiche dei confronti indiretti. 6 h
Tecniche di confronto fra più medie: l'analisi della varianza. Assunzioni dell'ANOVA (test di normalità e di omogeneità delle varianze). L'analisi della varianza fattoriale e l'interazione: ANOVA a 2 e 3 vie, e relativa interpretazione dei risultati. ANCOVA 6 h
L'analisi gerarchica della varianza. Modello lineare generale. Modello a fattori fissi e modello a fattori casuali. Tecniche di confronto multiplo tra medie (contrasti e test post-hoc). 4 h
L'analisi della varianza della regressione. Bontà del modello. Le assunzioni per la regressione e i relativi test. Il coefficiente di regressione e il suo errore standard. Valori previsti e residui, analisi dei residui. Analisi degli outlier. Test di significatività per coefficiente di regressione e intercetta. Intervalli fiduciali attorno alla retta di regressione. Il coefficiente di determinazione. Significatività statistica della correlazione e della regressione. 4h
Cenni alla trasformazione dei dati, al ranking e ai test non parametrici. 2h
Cenni di analisi della regressione multipla La scelta del modello ottimale (backward, forward e stepwise regression). 2h
Disegno degli esperimenti: stima della dimensione degli esperimenti e della dimensione dell'effetto. Gli schemi sperimentali: blocchi randomizzati, quadrato latino, split-plot. 2 h
Introduzione all'analisi multivariata: Cenni all'analisi delle componenti principali, all'analisi discriminante all'analisi della varianza multivariata e alla Cluster analysis. 4h
Introduzione alla Modellizzazione predittiva: reti neurali; serie temporali. 4 h
Introduzione alle Tecniche di screening: outlier, dati mancanti e pattern, screening predittivi. 3 h
Esecuzione, lettura ed interpretazione dei risultati dei diversi metodi con software statistici dedicati (svolta durante l'intero corso.
Prerequisiti
Conoscenze di base di statistica descrittiva. Capacità di utilizzo di fogli di calcolo elettronico.
I prerequisiti per gli studenti non frequentanti sono gli stessi degli studenti frequentanti.
Metodi didattici
Il corso è organizzato in lezioni frontali 3,5 CFU (28 h)ed esercitazioni pratiche in aula di informatica 2,5 CFU (28 h). Ogni lezione è articolata in una parte teorica ed una parte applicata. Una assidua frequenza alle lezioni e alle esercitazioni è fortemente consigliata. La modalità interattiva del corso permetterà infatti agli studenti di comprendere meglio le aree di applicazioni delle diverse tematiche affrontate nel corso.
Materiale di riferimento
Verranno messe a disposizione degli studenti sul sito Ariel del corso (https://pcrepaldimsa.ariel.ctu.unimi.it/v5/home/Default.aspx) le slide delle lezioni e il materiale di supporto al corso: dataset di analisi, link ad articoli scientifici e a pagine web di interesse. Durante il corso e nelle slide della prima lezione verranno indicati i testi di riferimento.
Modalità di verifica dell’apprendimento e criteri di valutazione
La verifica dell'apprendimento consiste in una prova scritta e pratica seguita da un colloquio orale facoltativo. Lo scritto consiste in 6 domande: di cui una a risposta multipla, due a risposta aperta, 2 esercizi e un output di un programma statistico da commentare. La prova pratica consiste nell'analisi di un dataset
La prova scritta vede la valutazione delle 6 domande in funzione del linguaggio scientifico- tecnico adottato, della completezza e dello spirito critico di commento ai risultati. La prova scritta può raggiungere un punteggio massimo pari a 24 (fino a 4 punti per ogni domanda).
La prova pratica è volta ad accertare che il candidato sappia scegliere il metodo di analisi corretto, sappia utilizzare un software statistico per l'esecuzione dell'analisi e sappia commentarne i risultati. Questa prova verrà valutata con un punteggio massimo di 6 punti.
Le due prove hanno una durata di 45 minuti ciascuna e vengono svolte una di seguito all'altra.
Se il candidato non arriva alla sufficienza (18/30 ) nella prova scritta, la prova pratica non viene valutata.
Il colloquio orale verte sui risultati delle prove scritta e pratica e viene svolto a seguito del superamento della prova scritta e pratica. I l colloquio è volto al chiarimento degli errori presenti nella prova per il miglioramento del voto.

Le modalità di verifica dell'apprendimento per gli studenti non frequentanti sono le stesse degli studenti frequentanti.

Sono previste procedure specifiche per studenti con disabilità o disturbi dell'apprendimento (DSA). Per maggiori informazioni:
https://www.unimi.it/it/studiare/servizi-gli-studenti/servizi-studenti-con-disabilita
https://www.unimi.it/it/studiare/servizi-gli-studenti/servizi-studenti-con-dsa
Nel caso lo studente necessiti di procedure specifiche deve informare il docente per e-mail almeno 10 giorni prima dell'esame, includendo nella comunicazione anche l'indirizzo email del servizio dedicato:
[email protected] or [email protected]
AGR/17 - ZOOTECNICA GENERALE E MIGLIORAMENTO GENETICO - CFU: 6
Esercitazioni in aula informatica: 40 ore
Lezioni: 28 ore
Docente: Crepaldi Paola
Docente/i
Ricevimento:
Su appuntamento richiesto tramite messaggio e-mail
Sezione di Zootecnica Agraria, I° piano, via Celoria 2