Analisi e modellistica predittiva dei dati

A.A. 2025/2026
6
Crediti massimi
48
Ore totali
SSD
ING-INF/06 MAT/06
Lingua
Italiano
Obiettivi formativi
La principale finalità del corso di Analisi e modellistica predittiva dei dati è di illustrare i principali concetti della statistica di base applicata alle scienze biomediche. Il corso integra la statistica descrittiva e inferenziale in modo da fornire agli studenti le competenze essenziali per raccogliere, analizzare, interpretare e presentare dati, facendo particolare riferimento ai dati raccolti durante il percorso di Tesi Magistrale. Nello specifico, il corso ha i seguenti obiettivi:

1. Struttura di un lavoro scientifico e ruolo dell'analisi dei da di dati e raccolta dei dati:
Rammentare agli studenti la struttura di un lavoro scientifico, sezione per sezione, ed enfatizzare il ruolo specifico giocato dall'analisi dei dati. Insegnare agli studenti le differenze tra i vari tipi di dati (qualitativi vs. quantitativi, discreti vs. continui). Introdurre metodi per la raccolta e il campionamento dei dati da una popolazione per eseguire uno studio campionario.

2. Statistica descrittiva:
Sottolineare la rilevanza della sintesi e presentazione efficace dei dati mediante tabelle e grafici (diagramma a punti, istogramma, diagramma a barre e boxplot).
Gli studenti impareranno inoltre calcolare e interpretare indicatori numerici chiave, tra cui:
-Tendenza centrale (moda, media e mediana
-Posizione (minimo, massimo, percentili)
-Dispersione (range, varianza, deviazione standard)
-Forma (asimmetria, curtosi)

3. Statistica inferenziale:
Fornire agli studenti gli strumenti per fare previsioni e inferenze su una popolazione basandosi su dati campionari. Enunciare e comprendere le implicazioni del teorema che sta al cuore della statistica inferenziale: il Teorema del Limite Centrale. Esso consente il calcolo di intervalli di confidenaz e l'esecuzuioone di test d'ipotesi. Verranno poi presentati i principali test statistici (ad esempio, Z- test t di Student per dati appaiati e dati non appaiati, ANOVA, test del chi-quadrato). L'elenco completo è enunciato nel programma delle lezioni riportato nel seguito.

4. Modellistica predittiva
Il ruolo della modellistica predittiva è di costruire dei modelli che permettano di fare previsioni. SI tratta di un ramo della statistica che sta assumendo un ruolo sempre più importante nella nostra società grazie al rapido sviluppo dell'intelligenza artificiale, e in particolare del cosiddetto machine learning. Una o più variabili (dette variabili indipendenti o predittori) vengono usate per predire una variabile (detta variabile dipendente o predetta). Partiremo dal concetto di covarianza e correlazione tra coppie di variabili per poi passare a modelli predittivi basati sulla regressione lineare semplice e multipla, sulla regressione polinomiale e sulle regressione non lineare. Nel caso della regressione non lineare, concentreremo la nostra attenzione su quattro tipi di funzioni che ricorrono frequentemente nelle scienze bniomediche: la sinusoide/cosinusoide, la funzione esponenziale, la funzione sigmoidale, la funzione saturativa secondo Michaelis-Menten.
Risultati apprendimento attesi
Alla fine del corso, lo studente sarà in grado di meglio interpretare i risultati forniti dalle procedure statistica usate nella letteratura biomedica. Inoltre, sarà stata acquisita la capacità di scegliere le tecniche statistiche più appropriate per analizzare i dati sperimentali raccolti nel corso della propria Tesi di Laurea Magistrale. Nello specifico, i risultati e i benefici attesi per gli studenti saranno:
1. Miglioramento del pensiero analitico
Gli studenti acquisiranno familiarità con l'analisi statistica dei dati e saranno in grado di identificare schemi, tendenze e valori anomali.
2. Competenza nelle tecniche statistiche
Acquisiranno competenze pratiche sia nella statistica descrittiva che inferenziale,
consentendo loro di analizzare set di dati, eseguire test stastistici e trarre conclusioni razionali.
3. Capacità di prendere decisioni basate sui dati
Impareranno a prendere decisioni informate basate sull'analisi statistica, abilità sempre più importante in un mondo in cui i dati sono considerati il "nuovo petrolio".
4. Sviluppo delle capacità di problem-solving
Attraverso l'applicazione di vari metodi statistici, svilupperanno la capacità di affrontare
problemi complessi e trarre conclusioni valide dai dati.
5. Preparazione per la preparazione ad una carriera accademica
Il corso fornirà una base solida per gli studenti che volessero perseguire un dottorato di ricerca.
6. Sviluppo delle competenze nella presentazione dei dati
Saranno in grado di presentare i dati in modo efficace utilizzando grafici, tabelle e report che
comunicano informazioni complesse in modo comprensibile ed efficace.
Corso singolo

Questo insegnamento può essere seguito come corso singolo.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Primo semestre

Programma
Introduzione al corso. Struttura di un lavoro scientifico. Distinzione tra popolazione e campione. Distinzione tra statistica descrittiva e statistica inferenziale. Rappresentazione dei dati mediante tabelle e grafici (diagramma a punti, istogramma, boxplot). Presentazione degli indici della statistica descrittiva. Indici di tendenza centrale, posizione, variabilità e forma. La distribuzione gaussiana e la distribuzione gaussiana standardizzata (Z). Uso della tavola Z. La statistica inferenziale e Il Teorema del Limite Centrale. Accuratezza vs. precisione. Calcolo dell'intervallo di confidenza basato sulla Z. La distribuzione t di Student con applicazioni al calcolo dell'intervallo di confidenza. Teoria del test d'ipotesi. Test Z e t di Student per un campione. Errori statistici del primo e del secondo tipo.
Test t di Student per due campioni: test per dati appaiati e test per dati non appaiati. Anova per gruppi indipendenti e ANOVA per misure ripetute. La valutazione della normalità di un set di dati e la trasformazione logaritmica. I test non parametrici. La statistica bivariata e predittiva: correlazione e regressione lineare semplice. La regressione lineare multiipla. La regressione polinomiale. LA regressioner non lineare con con cenni alla funzione esponenziale e a quella di Michaelis-Menten. Variabili categoriche. Test chi quadrato per l'indipendenza applicato alle tabelle di contingenza. Test esatto di Fisher. Caso di studio: cenni di cronobiologia e studio actigrafico del cronotipo mediante querstionario (MEQ) e mediante actigrafia interpretata con il modello Cosinor. Caso di studio: il sistema di regolazione glucosio-insulina e il concetto di insulino-resistenza. Determinazione di due indici cruciali per il funzionamento del sistema glucosio-insulina: la sensibilità insulinica e la sensibilità beta-cellulare.
Prerequisiti
Gli studenti dovrebbero già aver superato un esame di Istituzioni di Matematica durante la Triennale. Mi preme rassicurare gli studenti che la matematica appresa in una qualsiasi scuola superiore sarà più che
sufficiente per seguire il corso.
Metodi didattici
Lezioni frontali
Materiale di riferimento
TESTI DI RIFERIMENTO
Questo corso non richiede l'adozione di alcun testo in quanto Il materiale didattico postato su myAriel è del tutto sufficiente per garantire una preparazione ottimale all'esame. Per gli studenti che volessero avere indicazioni circa dei testi di riferimento, ecco tre testi che io consiglio di consultare:
1. Marc Triola e Mario Triola - Statistica per le discipline biosanitarie, Pearson Editore (544 pagine).
2. S. A. Glantz- Statistica per le Discipline Biomediche, McGraw-Hill Editore (490 pagine).
3. David S. Moore - Statistica di base, Apogeo Editore (645 pagine).

RICEVIMENTO STUDENTI: Da corcordare per e-mail
Modalità di verifica dell’apprendimento e criteri di valutazione
FORMATO DELL'ESAME
1. L'esame e' scritto, dura un'ora e contiene 31 domande a risposta multipla. Chi risponde esattamente a tutte le domande prende 30 e lode, chi risponde esattamente a 30 domande prende 30, e cosi' via.
2. Non c'e' penalita' per la risposta errata.
3. E' necessario portare all'esame le Tavole Z e t di Student.
4. E' necessario portare all'esame una calcolatrice (anche non scientifica). Non sara' ammesso l'uso dell'applicazione calcolatrice contenuta nel cellulare.
ING-INF/06 - BIOINGEGNERIA ELETTRONICA E INFORMATICA - CFU: 2
MAT/06 - PROBABILITA' E STATISTICA MATEMATICA - CFU: 4
Lezioni: 48 ore
Docente: Caumo Andrea
Docente/i
Ricevimento:
Da concordare per e-mail
Via Colombo 71, 20133 Milano