Matematica e tecniche di analisi dei dati

A.A. 2020/2021
9
Crediti massimi
60
Ore totali
SSD
SECS-S/01 SECS-S/06
Lingua
Italiano
Obiettivi formativi
Principale obiettivo dell'insegnamento è quello di fornire strumenti idonei per la descrizione sintetica quantitativa uno o più caratteri di interesse che si rilevano nei più svariati campi (economico, sociologico, politico, amministrativo, storico, giuridico, ecc.). Tale descrizione può essere realizzata aggregando i dati osservati in tabelle, dandone una adeguata rappresentazione grafica, costruendo opportuni indici di posizione e di variabilità, individuando le più opportune misure che ne evidenziano le relazioni. Alla descrizione statistica è necessario affiancare l'inferenza statistica, quando i dati sono tratti da rilevazioni campionarie parziali; in tal caso la conoscenza dei suddetti caratteri non è in termini "certi" ma solo "probabili" ed ha lo scopo di fornire le indicazioni sulla intera collettività di riferimento. Vengono pertanto forniti gli argomenti di base del Calcolo delle probabilità e dell'Inferenza statistica, con particolare riferimento alla teoria della stima. Elementi base di matematica sono essenziali per la comprensione e l'applicazione degli strumenti statistici forniti.
Risultati apprendimento attesi
Alla fine dell'insegnamento, lo studente dovrà conoscere e comprendere le tecniche matematiche e statistiche presentate a lezione e quindi sarà in grado di svolgere un'analisi descrittiva di un dataset, identificando le principali caratteristiche delle variabili coinvolte nello studio. Inoltre, attraverso indicatori statistici e verifiche di ipotesi ci si attende che lo studente sia in grado di trarre conclusioni compatibili con il contesto economico, sociologico, politico, amministrativo e socio-giuridico al quale lo scopo dell'analisi è legato.
Attraverso numerosi esempi basati su dati reali verrà mostrato allo studente come affrontare un'analisi, commentare i risultati e trarre conclusioni coerenti con il contesto di appartenenza delle variabili. Allo studente verrà poi richiesta un'analisi simile ai casi visti a lezione per valutarne la capacità di comprensione ed esposizione della materia. Le tecniche matematiche e statistiche viste a lezione forniscono una base per ulteriori sviluppi e analisi più approfondite che lo studente potrà incontrare durante il suo percorso.
Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo trimestre
Il primo modulo di Matematica sarà erogato da remoto in modalità sincrona attraverso la piattaforma Microsoft Teams.
La seconda parte del corso, inerente le tecniche di analisi dei dati, se necessario si svolgerà anch'essa da remoto in modalità sincrona attraverso la piattaforma Microsoft Teams.

L'esame sarà costituito da una prova scritta della durata di un'ora e 15 minuti, con tre esercizi e 6 domande a scelta multipla: 1 esercizio e 2 domande relative alla parte di matematica, i rimanenti relativi alla parte di analisi dei dati. Se necessario, l'esame si svolgerà a distanza attraverso la piattaforma exam.net.
In Dicembre è prevista una prova parziale sulla parte di matematica, che se superata verrà integrata negli appelli ufficiali svolgendo solo la parte di analisi dei dati. Se necessario, la prova parziale sarà erogata da remoto attraverso la piattaforma exam.net.
Programma
Matematica - Probabilità e variabili casuali:
1) Introduzione al calcolo delle probabilità: impostazioni della probabilità (classica, frequentista, soggettivista, assiomatica), eventi elementari, composti e incompatibili, principio delle probabilità composte, indipendenza stocastica.
2) Funzioni di una variabile. Concetti e caratteristiche generali su alcuni tipi di funzione (lineare, quadratica, alcune trascendenti. Cenni sul concetto di limite e di continuità. Calcolo differenziale e semplici applicazioni. Cenni sul concetto di integrale, di primitiva ed esempi di calcolo dell'integrale definito.
3) Definizione di variabili casuali discrete e continue: distribuzione di probabilità, concetti di derivata e di integrale per poter definire la densità di probabilità e la funzione di ripartizione; valore atteso (o media), moda, mediana, varianza di una variabile casuale. Definizione di indipendenza tra variabili casuali.
4) Cenni al teorema del limite centrale e alla legge dei grandi numeri.
5) Le variabili casuali di Bernoulli, Normale e Binomiale; approssimazione Normale alla Binomiale.

Tecniche di Analisi dei Dati - Statistica descrittiva:
1) Classificazione dei fenomeni statistici (tipi di caratteri e scale di modalità) e distribuzioni di frequenza (frequenze assolute, relative e cumulate).
2) Rappresentazioni grafiche: grafico a barre, grafico a bastoncini, istogramma di frequenze.
3) Calcolo di: moda, mediana e media campionarie quando i dati sono classificati in una tabella. Teoremi e proprietà della media.
4) Alcuni indici di variabilità e dispersione: campo di variazione, differenza e scarto interquartile, varianza e scarto quadratico medio. Il coefficiente di variazione.
5) Tabelle di contingenza e analisi bivariata: definizione di distribuzioni di frequenza congiunte assolute e relative, marginali e condizionate; l'indice di Pearson per l'indipendenza; la dipendenza in media; la covarianza e il coefficiente di correlazione lineare; il modello di regressione lineare semplice (metodo dei minimi quadrati; bontà di adattamento e coefficiente di determinazione; previsione).

Tecniche di Analisi dei Dati - Statistica inferenziale:
1) La stima puntuale: definizione di stimatore non distorto; l'errore standard come misura di precisione di uno stimatore. La media e la varianza campionarie; la proporzione campionaria.
2) Intervalli di confidenza per una media (con osservazioni Normali e varianza nota o ignota). Intervalli di confidenza per una proporzione.
3) Definizione generale del problema della verifica d'ipotesi e di p-value. Verifica d'ipotesi per una media, con osservazioni Normali e varianza nota o ignota.
4) Verifica d'ipotesi per una proporzione.
Prerequisiti
Il programma di matematica svolto in un qualsiasi istituto superiore fornisce le basi sufficienti per seguire l'insegnamento. Si consiglia un ripasso generale.
Metodi didattici
I docenti spiegano alla lavagna tendenzialmente senza l'uso di slide, la lezione in questo modo è più interattiva e viene adeguata ai bisogni dell'aula, sia in termini di velocità di presentazione dei concetti che di approfondimento degli stessi. Chi non può frequentare può comunque ritrovare tutto nel materiale di riferimento indicato (libro di testo ed eventuali dispense su ARIEL).
Dopo l'introduzione di ogni nuovo concetto vengono presentati vari esempi numerici per comprenderne a fondo il significato ed impratichirsi con i calcoli.

Commenti e richieste di chiarimenti durante le lezioni/esercitazioni da parte degli studenti sono sempre ben accette, perché rendono le lezioni più vivaci e sicuramente più utili per tutti.
Materiale di riferimento
Matematica - Probabilità e variabili casuali: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 1-2 e una dispensa integrativa relativa alle funzioni, che è disponibile nel sito di ARIEL (sotto la voce: contenuti - lezioni-matematica).

Statistica descrittiva: due dispense disponibili nella pagina ARIEL del corso (sotto la voce: contenuti - lezioni-statistica descrittiva)

Statistica inferenziale: Introduzione all'inferenza statistica di Ferrari, Nicolini e Tommasi, Giappichelli Editore - Torino (2009) - CAPITOLI: 3-4
e la dispensa integrativa "la stima puntuale", che è disponibile nel sito di ARIEL (sotto la voce: contenuti - lezioni-statistica inferenziale)
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame di Matematica e Analisi dei Dati consiste in una prova scritta della durata di un'ora e un quarto, costituita da 3 esercizi e 6 domande a scelta multipla, riguardanti gli argomenti elencati nel programma (1 esercizio e 2 domande per ciascun punto del programma). L'esame viene valutato da 0 a 30 punti e viene considerato sufficiente se si ottiene un punteggio almeno pari a 18.
Per svolgere la prova scritta è necessario portare con sè una calcolatrice.
SECS-S/01 - STATISTICA - CFU: 6
SECS-S/06 - METODI MATEMATICI DELL'ECONOMIA E DELLE SCIENZE ATTUARIALI E FINANZIARIE - CFU: 3
Lezioni: 60 ore
Docente/i
Ricevimento:
Dal 2 agosto al 6 settembre il ricevimento è sospeso. Riprenderà dal 13 settembre. Venerdì dalle 9:00 alle 12:00 (controllare sempre la bacheca su ARIEL per eventuali cambiamenti).
ufficio, III piano di via Conservatorio