Data analysis
A.A. 2020/2021
Obiettivi formativi
Il corso mira a fornire agli studenti una solida base conoscitiva della statistica applica e ha l'obiettivo di fornire gli strumenti teorici e metodologici/pratici per produrre un'analisi quantitativa in modo autonomo.
Risultati apprendimento attesi
Padroneggiare i principali tipi di analisi mono e bivariata. Capire la logica dell'inferenza e come applicarla. Acquisire competenza nel test di ipotesi con diversi tipi di variabile. Essere in grado di produrre un'analisi quantitativa di base con Stata. Raggiungere una competenza di base per la comprensione e produzione di serie storiche. Fornire agli studenti le conoscenze di base per potere utilizzare il programma R nelle attività di analisi dati e reportistica.
Periodo: Primo trimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Primo trimestre
Durante la fase di didattica emergenziale, il programma viene mantenuto con le seguenti modifiche necessarie per una buona fruizione online del corso originariamente progettato per la didattica in presenza:
Metodi didattici:
Le lezioni si terranno per due terzi in presenza (tramite prenotazione via app). Per gli studenti che non si prenotano per la presenza in aula è prevista la possibilità di seguire la lezione da remoto (in sincrono). Il restante terzo del corso si terrà in modalità asincrona che prevede un'attività didattica online che permetterà di sviluppare le medesime capacità che normalmente sarebbero raggiunte con l'attività proposta in aula.
Il calendario delle lezioni e tutti i dettagli delle attività saranno pubblicati nel corso online entro l'inizio delle lezioni. Eventuali aggiornamenti saranno comunicati anche attraverso avvisi nel corso online (consultare spesso la posta @studenti.unimi.it)
Le modalità e i criteri per partecipare alle lezioni in presenza, che prevedono una prenotazione con la apposita app, saranno pubblicate per tempo nel corso online.
È considerato frequentante anche chi, non potendo partecipare alle lezioni in presenza, segue le indicazioni per lo svolgimento delle attività alternative online.
Materiali di riferimento:
Chi porta il programma da frequentante, oltre alla bibliografia già riportata nel programma, deve fare riferimento a tutte le lezioni, i materiali e le risorse pubblicate nel corso online.
Metodi didattici:
Le lezioni si terranno per due terzi in presenza (tramite prenotazione via app). Per gli studenti che non si prenotano per la presenza in aula è prevista la possibilità di seguire la lezione da remoto (in sincrono). Il restante terzo del corso si terrà in modalità asincrona che prevede un'attività didattica online che permetterà di sviluppare le medesime capacità che normalmente sarebbero raggiunte con l'attività proposta in aula.
Il calendario delle lezioni e tutti i dettagli delle attività saranno pubblicati nel corso online entro l'inizio delle lezioni. Eventuali aggiornamenti saranno comunicati anche attraverso avvisi nel corso online (consultare spesso la posta @studenti.unimi.it)
Le modalità e i criteri per partecipare alle lezioni in presenza, che prevedono una prenotazione con la apposita app, saranno pubblicate per tempo nel corso online.
È considerato frequentante anche chi, non potendo partecipare alle lezioni in presenza, segue le indicazioni per lo svolgimento delle attività alternative online.
Materiali di riferimento:
Chi porta il programma da frequentante, oltre alla bibliografia già riportata nel programma, deve fare riferimento a tutte le lezioni, i materiali e le risorse pubblicate nel corso online.
Programma
Il Modulo di "Data Analysis" mira a fornire agli studenti una solida base conoscitiva della statistica applica. Studentesse e studenti che completeranno con successo il corso avranno padronanza dei principali strumenti dell'analisi quantitativa (casi, tipi di variabili, dataset, test di ipotesi); verranno introdotti al campionamento e all'inferenza; sapranno applicare i principali tipi di analisi mono e bivariata. Il corso prevede anche l'introduzione al pacchetto statistico Stata, con l'obiettivo di fornire ai frequentanti gli strumenti per produrre un'analisi quantitativa in modo autonomo.
Gli argomenti trattati sono: introduzione all'analisi dei dati, variabili e campioni; statistiche descrittive; introduzione a Stata; preparazione dello spazio di lavoro e analisi monovariata; probabilità e distribuzioni; generare e modificare variabili in Stata; inferenza e stime; test di significatività; stime e intervalli di confidenza in Stata; comparare due gruppi e associazioni tra variabili categoriali; tabulazioni incrociate con Stata; regressione lineare e Anova: teoria e pratica; introduzione alla regressione logistica e alle relazioni multivariate; usare Stata per domande di ricerca complesse.
Il modulo di "Introduzione all'Analisi delle Serie Storiche" prevede l'introduzione dei fondamenti metodologici per l'analisi delle serie temporali e l'uso di Excel e Stata per l'analisi descrittiva e la decomposizione delle serie storiche, e la produzione di previsioni statistiche di breve periodo.
L'obiettivo del modulo "Introduzione a R" è fornire agli studenti le conoscenze di base per potere utilizzare il programma R nelle attività di analisi dati e reportistica. Gli studenti che completeranno il corso apprenderanno come utilizzare R per una varietà di operazioni, tra cui: descrizione e gestione dei dati, analisi statistiche di varia complessità (frequenze, inferenze statistiche, regressione lineare), visualizzazione dati, e sviluppo di prodotti dell'analisi come report e slide.
Gli argomenti trattati sono: introduzione all'analisi dei dati, variabili e campioni; statistiche descrittive; introduzione a Stata; preparazione dello spazio di lavoro e analisi monovariata; probabilità e distribuzioni; generare e modificare variabili in Stata; inferenza e stime; test di significatività; stime e intervalli di confidenza in Stata; comparare due gruppi e associazioni tra variabili categoriali; tabulazioni incrociate con Stata; regressione lineare e Anova: teoria e pratica; introduzione alla regressione logistica e alle relazioni multivariate; usare Stata per domande di ricerca complesse.
Il modulo di "Introduzione all'Analisi delle Serie Storiche" prevede l'introduzione dei fondamenti metodologici per l'analisi delle serie temporali e l'uso di Excel e Stata per l'analisi descrittiva e la decomposizione delle serie storiche, e la produzione di previsioni statistiche di breve periodo.
L'obiettivo del modulo "Introduzione a R" è fornire agli studenti le conoscenze di base per potere utilizzare il programma R nelle attività di analisi dati e reportistica. Gli studenti che completeranno il corso apprenderanno come utilizzare R per una varietà di operazioni, tra cui: descrizione e gestione dei dati, analisi statistiche di varia complessità (frequenze, inferenze statistiche, regressione lineare), visualizzazione dati, e sviluppo di prodotti dell'analisi come report e slide.
Prerequisiti
Non è richiesta alcuna conoscenza pregressa di statistica per frequentare questo corso.
Metodi didattici
Tutti e tre i moduli prevedono lezioni frontali, esercitazioni di gruppo in classe, esercitazioni individuali sul software (Stata, Excel, R)
Materiale di riferimento
Per "Data Analysis":
Alan Agresti and Barbara Finlay (2014), Statistical Methods for the Social Sciences. Pearson, 4th Edition
Chapters: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15.
Per Stata: le sintassi verranno fornite dal docente in classe e su ARIEL
Materiale utile per imparare Stata (non obbligatorio):
Ulrich Kohler & Frauke Kreuter (2012). Data Analysis Using Stata. Stata Press, 3rd Edition
Alan Acock (2014). A Gentle Introduction to Stata. Stata Press. 4th Edition
Per il modulo il modulo di "Introduzione all'Analisi delle Serie Storiche":
Barrow Michael (2017) Statistics for Economics, Accounting and Business Studies, Pearson, 7th Edition.
Chapters: 1, 10, 11.
Materiali integrativi, esercitazioni in Excel, e sintassi di Stata verranno distribuiti dalla docente su Ariel.
Per il modulo il modulo "Introduzione a R":
Il corso non è basato su un libro di testo. I materiali, principalmente tutorial HTML, verranno forniti dal docente. Due letture consigliate per gli studenti che volessero approfondire gli argomenti affrontati in classe sono:
Fox, J., and Weisberg, S. An R Companion to Applied Regression (3rd Edition). Sage, 2019
Grolemund, G., and Wickham, H. R for Data Science. O'Reilly, 2017 (disponibile gratuitamente qui https://r4ds.had.co.nz/)
Alan Agresti and Barbara Finlay (2014), Statistical Methods for the Social Sciences. Pearson, 4th Edition
Chapters: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15.
Per Stata: le sintassi verranno fornite dal docente in classe e su ARIEL
Materiale utile per imparare Stata (non obbligatorio):
Ulrich Kohler & Frauke Kreuter (2012). Data Analysis Using Stata. Stata Press, 3rd Edition
Alan Acock (2014). A Gentle Introduction to Stata. Stata Press. 4th Edition
Per il modulo il modulo di "Introduzione all'Analisi delle Serie Storiche":
Barrow Michael (2017) Statistics for Economics, Accounting and Business Studies, Pearson, 7th Edition.
Chapters: 1, 10, 11.
Materiali integrativi, esercitazioni in Excel, e sintassi di Stata verranno distribuiti dalla docente su Ariel.
Per il modulo il modulo "Introduzione a R":
Il corso non è basato su un libro di testo. I materiali, principalmente tutorial HTML, verranno forniti dal docente. Due letture consigliate per gli studenti che volessero approfondire gli argomenti affrontati in classe sono:
Fox, J., and Weisberg, S. An R Companion to Applied Regression (3rd Edition). Sage, 2019
Grolemund, G., and Wickham, H. R for Data Science. O'Reilly, 2017 (disponibile gratuitamente qui https://r4ds.had.co.nz/)
Modalità di verifica dell’apprendimento e criteri di valutazione
Per il modulo di Data Anlysis (40 ore), gli studenti frequentanti sono tenuti ad essere presenti almeno all'80% delle lezioni e dovranno svolgere i compiti per casa assegnati dall'insegnante e caricarli sul sito Ariel. L'attiva partecipazione in classe e i compiti per casa verranno tenuti in conto per la valutazione finale. L'esame finale per i frequentanti comprende una breve prova scritta - che si svolgerà in presenza oppure da remoto secondo le indicazioni fornite dall'Università - composta da domande a scelta multipla ed esercizi simili ai compiti svolti a casa. È inoltre prevista una prova sul software Stata. I non frequentanti invece devono sostenere un esame completo su tutto il materiale assegnato nel volume di riferimento.
Il modulo di "Introduzione all'analisi delle serie storiche" (20 ore) prevede un esame scritto che si svolgerà in presenza oppure da remoto secondo le indicazioni fornite dall'Università. Per le studentesse e gli studenti frequentanti si comporrà di due domande aperte sui temi del corso e di una sessione pratica con una esercitazione da svolgere in Excel e Stata. Maggiori dettagli saranno forniti prima dell'inizio del corso. Gli studenti e le studentesse non frequentanti dovranno sostenere l'esame completo che consisterà nello svolgimento di un esercizio in Excel e rispondere a due domande basate sui tre capitoli del volume di riferimento e i materiali didattici caricati su Ariel dalla docente.
Per il modulo "Introduzione a R" (20 ore) gli studenti verranno valutati sulla base di 3 "compiti a casa" (2 esercizi semplici e un elaborato finale). Per ottenere i crediti gli studenti dovranno completare tutti e 3 gli esercizi in modo soddisfacente. La frequenza alle lezioni non è obbligatoria.
Il modulo di "Introduzione all'analisi delle serie storiche" (20 ore) prevede un esame scritto che si svolgerà in presenza oppure da remoto secondo le indicazioni fornite dall'Università. Per le studentesse e gli studenti frequentanti si comporrà di due domande aperte sui temi del corso e di una sessione pratica con una esercitazione da svolgere in Excel e Stata. Maggiori dettagli saranno forniti prima dell'inizio del corso. Gli studenti e le studentesse non frequentanti dovranno sostenere l'esame completo che consisterà nello svolgimento di un esercizio in Excel e rispondere a due domande basate sui tre capitoli del volume di riferimento e i materiali didattici caricati su Ariel dalla docente.
Per il modulo "Introduzione a R" (20 ore) gli studenti verranno valutati sulla base di 3 "compiti a casa" (2 esercizi semplici e un elaborato finale). Per ottenere i crediti gli studenti dovranno completare tutti e 3 gli esercizi in modo soddisfacente. La frequenza alle lezioni non è obbligatoria.
Moduli o unità didattiche
Unita' didattica 1
SPS/07 - SOCIOLOGIA GENERALE - CFU: 9
Lezioni: 60 ore
Docente:
Bozzon Rossella
Unita' didattica 2 - Introduction to R
SPS/07 - SOCIOLOGIA GENERALE - CFU: 3
Lezioni: 20 ore
Docente:
Vegetti Federico