Data analysis

A.A. 2021/2022
12
Crediti massimi
80
Ore totali
SSD
SPS/07
Lingua
Inglese
Obiettivi formativi
Il corso mira a fornire agli studenti una solida base conoscitiva della statistica applica e ha l'obiettivo di fornire gli strumenti teorici e metodologici/pratici per produrre un'analisi quantitativa in modo autonomo.
Risultati apprendimento attesi
Padroneggiare i principali tipi di analisi mono e bivariata. Capire la logica dell'inferenza e come applicarla. Acquisire competenza nel test di ipotesi con diversi tipi di variabile. Essere in grado di produrre un'analisi quantitativa di base con Stata. Raggiungere una competenza di base per la comprensione e produzione di serie storiche. Fornire agli studenti le conoscenze di base per potere utilizzare il programma R nelle attività di analisi dati e reportistica.
Programma e organizzazione didattica

Edizione unica

Periodo
Primo trimestre
In relazione alle modalità di erogazione delle attività formative per l'anno a.a. 2021/2022, verranno date indicazioni più specifiche nei prossimi mesi, in base all'evoluzione della situazione sanitaria.
Programma
Il Modulo di "Data Analysis" mira a fornire agli studenti una solida base conoscitiva della statistica applica. Studentesse e studenti che completeranno con successo il corso avranno padronanza dei principali strumenti dell'analisi quantitativa (casi, tipi di variabili, dataset, test di ipotesi); verranno introdotti al campionamento e all'inferenza; sapranno applicare i principali tipi di analisi mono e bivariata. Il corso prevede anche l'introduzione al pacchetto statistico Stata, con l'obiettivo di fornire ai frequentanti gli strumenti per produrre un'analisi quantitativa in modo autonomo.
Gli argomenti trattati sono: introduzione all'analisi dei dati, variabili e campioni; statistiche descrittive; introduzione a Stata; preparazione dello spazio di lavoro e analisi monovariata; probabilità e distribuzioni; generare e modificare variabili in Stata; inferenza e stime; test di significatività; stime e intervalli di confidenza in Stata; comparare due gruppi e associazioni tra variabili categoriali; tabulazioni incrociate con Stata; regressione lineare e ANOVA: teoria e pratica; introduzione alla regressione logistica e alle relazioni multivariate; usare Stata per domande di ricerca complesse.

L'obiettivo del modulo "Introduzione a R" è fornire agli studenti le conoscenze di base per potere utilizzare il programma R nelle attività di analisi dati e reportistica. Gli studenti che completeranno il corso apprenderanno come utilizzare R per una varietà di operazioni, tra cui: descrizione e gestione dei dati, analisi statistiche di varia complessità (frequenze, inferenze statistiche, regressione lineare), visualizzazione dati, e sviluppo di prodotti dell'analisi come report e slide.
Prerequisiti
Non è richiesta alcuna conoscenza pregressa di statistica per frequentare questo corso.
Metodi didattici
Lezioni frontali, esercitazioni di gruppo in classe, esercitazioni individuali sul software (Stata & R)
Materiale di riferimento
Per "Data Analysis":
Alan Agresti and Barbara Finlay (2014), Statistical Methods for the Social Sciences. Pearson, 4th Edition
Chapters: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15.

Per Stata: le sintassi verranno fornite dal docente in classe e su ARIEL
Materiale utile per imparare Stata (non obbligatorio):
Ulrich Kohler & Frauke Kreuter (2012). Data Analysis Using Stata. Stata Press, 3rd Edition
Alan Acock (2014). A Gentle Introduction to Stata. Stata Press. 4th Edition

Per il modulo il modulo "Introduzione a R":
Il corso non è basato su un libro di testo. I materiali, principalmente tutorial HTML, verranno forniti dal docente. Due letture consigliate per gli studenti che volessero approfondire gli argomenti affrontati in classe sono:
Fox, J., and Weisberg, S. An R Companion to Applied Regression (3rd Edition). Sage, 2019
Grolemund, G., and Wickham, H. R for Data Science. O'Reilly, 2017 (disponibile gratuitamente qui https://r4ds.had.co.nz/)
Modalità di verifica dell’apprendimento e criteri di valutazione
Per il modulo di Data Analysis (60 ore), Gli studenti frequentanti sono tenuti ad essere presenti almeno all'80% delle lezioni e dovranno svolgere i compiti per casa assegnati dall'insegnante secondo le modalità indicate durante il corso. L'attiva partecipazione in classe e i compiti per casa verranno tenuti in conto per la valutazione finale. L'esame finale per i frequentanti comprende una breve prova scritta o orale - che si svolgerà in presenza oppure da remoto secondo le indicazioni fornite dall'Università - composta da domande a scelta multipla ed esercizi simili ai compiti svolti a casa. È inoltre prevista la stesura, individuale o in piccoli gruppi, di un breve elaborato a partire da un'analisi dei dati con il software Stata. I non frequentanti invece devono sostenere un esame completo su tutto il materiale assegnato nel volume di riferimento.

Per il modulo "Introduzione a R" (20 ore) gli studenti verranno valutati sulla base di 3 "compiti a casa" (2 esercizi semplici e un elaborato finale). Per ottenere i crediti gli studenti dovranno completare tutti e 3 gli esercizi in modo soddisfacente. La frequenza alle lezioni non è obbligatoria.
Moduli o unità didattiche
Unita' didattica 1
SPS/07 - SOCIOLOGIA GENERALE - CFU: 9
Lezioni: 60 ore

Unita' didattica 2 - Introduction to R
SPS/07 - SOCIOLOGIA GENERALE - CFU: 3
Lezioni: 20 ore

Siti didattici
Docente/i
Ricevimento:
Su appuntamento
Microsoft Teams