Multivariate analysis for social scientists
A.A. 2022/2023
Obiettivi formativi
Il corso ha l'obiettivo di introdurre gli studenti alla logica del ragionamento statistico quantitativo nelle scienze sociali e politiche. Agli studenti verranno presentate le principali tecniche statistiche per l'analisi dei dati utilizzate nelle scienze sociali, in modo da poter valutare e condurre in modo autonomo ricerche quantitative.
Al termine del corso, gli studenti saranno in grado di:
- comprendere le assunzioni sottostanti le principali tecniche statistiche utilizzate nell'analisi di fenomeni sociali e politici;
- eseguire analisi descrittive e inferenziali multivariate su R;
- elaborare un progetto di ricerca per rispondere a una domanda di ricerca con dati empirici, applicando le tecniche statistiche apprese nel corso.
Il corso è progettato per essere flessibile e può essere modificato se necessario, in base al livello di partenza degli studenti.
Nella prima parte del corso, agli studenti verranno presentati i concetti fondamentali relativi alla elaborazione di un progetto di ricerca empirica in scienze sociali, a partire dalla formulazione di una domanda di ricerca e lo sviluppo di ipotesi, fino alla selezione di un dataset appropriato. Seguirà una revisione delle analisi univariate e bivariate, della regressione OLS e delle sue assunzioni, e del modo di affrontare le deviazioni da tali assunzioni. Gli studenti verranno quindi introdotti ad altri strumenti analitici per l'analisi quantitativa, come le funzioni di regressione non lineari, i modelli di regressione logit e probit, e i modelli a variabile dipendente limitata. Argomenti più avanzati come l'analisi di time-series e di dati panel possono essere concordati con gli studenti e affrontati nell'ultima fase del corso. Gli studenti impareranno inoltre a utilizzare il software statistico R per organizzare e analizzare i dati. Le lezioni saranno alternate a sessioni di laboratorio di analisi dei dati su R.
Nella seconda parte del corso, agli studenti sarà richiesto di elaborare un progetto di ricerca utilizzando dataset attinenti alle scienze politiche o sociali, e di applicare i concetti appresi per affrontare una domanda di ricerca. Si porrà enfasi sulla formulazione di ipotesi e sull'utilizzo dei dati per testare tali ipotesi. Durante le lezioni sarà incentivata la partecipazione attiva degli studenti, che saranno coinvolti in esperienze di apprendimento interattive.
Al termine del corso, gli studenti saranno in grado di:
- comprendere le assunzioni sottostanti le principali tecniche statistiche utilizzate nell'analisi di fenomeni sociali e politici;
- eseguire analisi descrittive e inferenziali multivariate su R;
- elaborare un progetto di ricerca per rispondere a una domanda di ricerca con dati empirici, applicando le tecniche statistiche apprese nel corso.
Il corso è progettato per essere flessibile e può essere modificato se necessario, in base al livello di partenza degli studenti.
Nella prima parte del corso, agli studenti verranno presentati i concetti fondamentali relativi alla elaborazione di un progetto di ricerca empirica in scienze sociali, a partire dalla formulazione di una domanda di ricerca e lo sviluppo di ipotesi, fino alla selezione di un dataset appropriato. Seguirà una revisione delle analisi univariate e bivariate, della regressione OLS e delle sue assunzioni, e del modo di affrontare le deviazioni da tali assunzioni. Gli studenti verranno quindi introdotti ad altri strumenti analitici per l'analisi quantitativa, come le funzioni di regressione non lineari, i modelli di regressione logit e probit, e i modelli a variabile dipendente limitata. Argomenti più avanzati come l'analisi di time-series e di dati panel possono essere concordati con gli studenti e affrontati nell'ultima fase del corso. Gli studenti impareranno inoltre a utilizzare il software statistico R per organizzare e analizzare i dati. Le lezioni saranno alternate a sessioni di laboratorio di analisi dei dati su R.
Nella seconda parte del corso, agli studenti sarà richiesto di elaborare un progetto di ricerca utilizzando dataset attinenti alle scienze politiche o sociali, e di applicare i concetti appresi per affrontare una domanda di ricerca. Si porrà enfasi sulla formulazione di ipotesi e sull'utilizzo dei dati per testare tali ipotesi. Durante le lezioni sarà incentivata la partecipazione attiva degli studenti, che saranno coinvolti in esperienze di apprendimento interattive.
Risultati apprendimento attesi
Il corso preparerà gli studenti a:
- eseguire analisi multivariate descrittive e inferenziali attraverso R, utilizzando modelli di regressione multipla, regressioni non lineari, modelli con variabili dipendenti limitate e analisi di serie temporali;
- capire e discutere le ipotesi sottostanti alle principali tecniche statistiche nelle scienze sociali e politiche;
- sviluppare un disegno di ricerca per studiare i fenomeni sociali e politici (definizione di una domanda di ricerca originale, formulazione di ipotesi, selezione di un dataset adeguato, analisi statistica, interpretazione dei risultati, discussione delle limitazioni);
- presentare i risultati di una ricerca attraverso una presentazione.
- eseguire analisi multivariate descrittive e inferenziali attraverso R, utilizzando modelli di regressione multipla, regressioni non lineari, modelli con variabili dipendenti limitate e analisi di serie temporali;
- capire e discutere le ipotesi sottostanti alle principali tecniche statistiche nelle scienze sociali e politiche;
- sviluppare un disegno di ricerca per studiare i fenomeni sociali e politici (definizione di una domanda di ricerca originale, formulazione di ipotesi, selezione di un dataset adeguato, analisi statistica, interpretazione dei risultati, discussione delle limitazioni);
- presentare i risultati di una ricerca attraverso una presentazione.
Periodo: Terzo trimestre
Modalità di valutazione: Esame
Giudizio di valutazione: voto verbalizzato in trentesimi
Corso singolo
Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.
Programma e organizzazione didattica
Edizione unica
Responsabile
Periodo
Terzo trimestre
Programma
Il primo Modulo del corso (Prof. Pagano - 30 ore) inizia introducendo gli studenti ai fondamenti dell'elaborazione di un disegno di ricerca nel campo delle scienze sociali e politiche. Segue una revisione dei principali concetti relativi alle analisi univariate e bivariate, nonché del modello di regressione Ordinary Least Squares (OLS) e delle sue ipotesi di base. A partire da queste fondamenta, verranno esplorate tecniche di analisi multivariate più avanzate nelle lezioni successive. Il Modulo proseguirà con le funzioni di regressione non lineare, i modelli di variabili dipendenti limitate, analisi di serie temporali e dati panel. Le lezioni saranno intervallate con sessioni di laboratorio, in cui gli studenti impareranno a utilizzare il software statistico R per organizzare e analizzare i dati. Alla fine del Modulo, un test intermedio valuterà la comprensione degli studenti del materiale coperto nella prima parte del corso.
Il secondo Modulo (Prof.ssa Decadri - 10 ore) è dedicato a preparare gli studenti all'elaborazione di un progetto di ricerca, attraverso attività di gruppo guidate. In particolare, la Prof.ssa Decadri assegnerà a ogni gruppo un argomento sotto forma di una domanda di ricerca già formulata, e fornirà un set di dati appropriato per affrontarla. A partire da questi elementi, ogni gruppo dovrà: 1. formulare ipotesi verificabili; 2. tra i modelli statistici disponibili coperti durante il corso, selezionare quello più adatto per verificare tali ipotesi (statistiche descrittive, tabulazioni, diversi modelli di regressione OLS bivariate e multivariate); 3. eseguire le necessarie analisi statistiche descrittive e inferenziali; 4. scrivere una breve nota di ricerca (massimo 4000 parole: titolo, abstract, parole chiave, tabelle, figure e riferimenti inclusi).
Struttura del corso
Modulo 1 - Prof. Pagano (30 ore)
Fondamenti di disegno della ricerca in scienze sociali e politiche
Revisione di analisi univariata e bivariata, e del modello di Ordinary Least Squares (OLS) regression
Regressioni non lineari - interazioni e modelli quadratici
Modelli a variabile dipendente limitata - Regressioni logit e probit
Tecniche avanzate per l'analisi quantitativa (come analisi di serie temporali e panel data) da concordare con gli studenti
Le lezioni saranno intervallate con sessioni di laboratorio per l'analisi dei dati attraverso il software statistico R.
Modulo 2 - Prof. Decadri (10 ore)
Sessioni dedicate all'elaborazione di un disegno di ricerca e alla preparazione da parte degli studenti del loro Progetto di Ricerca di Gruppo
Project Colloquia
Il secondo Modulo (Prof.ssa Decadri - 10 ore) è dedicato a preparare gli studenti all'elaborazione di un progetto di ricerca, attraverso attività di gruppo guidate. In particolare, la Prof.ssa Decadri assegnerà a ogni gruppo un argomento sotto forma di una domanda di ricerca già formulata, e fornirà un set di dati appropriato per affrontarla. A partire da questi elementi, ogni gruppo dovrà: 1. formulare ipotesi verificabili; 2. tra i modelli statistici disponibili coperti durante il corso, selezionare quello più adatto per verificare tali ipotesi (statistiche descrittive, tabulazioni, diversi modelli di regressione OLS bivariate e multivariate); 3. eseguire le necessarie analisi statistiche descrittive e inferenziali; 4. scrivere una breve nota di ricerca (massimo 4000 parole: titolo, abstract, parole chiave, tabelle, figure e riferimenti inclusi).
Struttura del corso
Modulo 1 - Prof. Pagano (30 ore)
Fondamenti di disegno della ricerca in scienze sociali e politiche
Revisione di analisi univariata e bivariata, e del modello di Ordinary Least Squares (OLS) regression
Regressioni non lineari - interazioni e modelli quadratici
Modelli a variabile dipendente limitata - Regressioni logit e probit
Tecniche avanzate per l'analisi quantitativa (come analisi di serie temporali e panel data) da concordare con gli studenti
Le lezioni saranno intervallate con sessioni di laboratorio per l'analisi dei dati attraverso il software statistico R.
Modulo 2 - Prof. Decadri (10 ore)
Sessioni dedicate all'elaborazione di un disegno di ricerca e alla preparazione da parte degli studenti del loro Progetto di Ricerca di Gruppo
Project Colloquia
Prerequisiti
È richiesta padronanza dei concetti e degli argomenti coperti nel corso di Data Analysis, oltre a una conoscenza di base del linguaggio di programmazione statistico R. Le conoscenze matematiche richieste sono minime; sono sufficienti nozioni basilari di algebra.
Metodi didattici
Lezioni frontali, sessioni di laboratorio di analisi dati in R, e lavoro di gruppo.
Materiale di riferimento
Il programma è il medesimo per studenti frequentanti e non frequentanti.
Testi:
1. Paul M. Kellstedt and Guy D. Whitten(2009-2013). The Fundamentals of Political Science Research (2nd edition). Cambridge University Press, Chapters 1, 2, 3, 4, 5, 6, 12; Chapters 7-11 (read only).
2. Thomas Brambor, William Roberts Clark, and Matt Golder (2006). Understanding Interaction Models: Improving Empirical Analyses. Political Analysis.14(1): 63-82.
3. John Fox and Sanford Weisberg (2019). An R Companion to Applied Regression (3rd edition). SAGE Publications, Chapters 4, 5, 6, 8, 9.
Testi:
1. Paul M. Kellstedt and Guy D. Whitten(2009-2013). The Fundamentals of Political Science Research (2nd edition). Cambridge University Press, Chapters 1, 2, 3, 4, 5, 6, 12; Chapters 7-11 (read only).
2. Thomas Brambor, William Roberts Clark, and Matt Golder (2006). Understanding Interaction Models: Improving Empirical Analyses. Political Analysis.14(1): 63-82.
3. John Fox and Sanford Weisberg (2019). An R Companion to Applied Regression (3rd edition). SAGE Publications, Chapters 4, 5, 6, 8, 9.
Modalità di verifica dell’apprendimento e criteri di valutazione
La frequenza non è obbligatoria, ma è caldamente consigliata.
Gli studenti che partecipano alle lezioni saranno valutati sulla base di: (1) un esame intermedio individuale alla conclusione del Modulo 1 e (2) un Progetto di Ricerca di Gruppo finale.
L'esame intermedio (1) consisterà in una combinazione di domande a scelta multipla ed esercizi. A partire dal dataset fornito, gli studenti dovranno effettuare analisi descrittive e inferenziali utilizzando R. Le domande completate e lo script di R corrispondente dovranno essere inviati via e-mail al Prof. Pagano che ne confermerà la ricezione agli studenti. I risultati dell'esame contribuiranno al 50% del voto finale, e verranno comunicati individualmente a ciascuno studente via e-mail.
Per il Progetto di Ricerca di Gruppo finale (2), alla fine del Modulo 2, gli studenti presenteranno il loro disegno di ricerca e i risultati preliminari ai loro colleghi e alla Prof.ssa Decadri durante il Project Colloquium. La nota di ricerca finale in formato .pdf, insieme al dataset e allo script di R per replicare le analisi, dovranno essere inviati via e-mail alla Prof.ssa Decadri entro il 7 luglio. Le relative valutazioni, che rappresentano il 50% del voto finale, verranno comunicate individualmente via e-mail.
Gli studenti che non possono partecipare alle lezioni verranno valutati attraverso un unico esame scritto. L'esame consisterà in una combinazione di domande a scelta multipla e a risposta aperta, nonché in analisi descrittive e inferenziali su R a partire da un dataset di dati fornito dagli istruttori. La valutazione su questa prova determinerà il voto finale.
Gli studenti che partecipano alle lezioni saranno valutati sulla base di: (1) un esame intermedio individuale alla conclusione del Modulo 1 e (2) un Progetto di Ricerca di Gruppo finale.
L'esame intermedio (1) consisterà in una combinazione di domande a scelta multipla ed esercizi. A partire dal dataset fornito, gli studenti dovranno effettuare analisi descrittive e inferenziali utilizzando R. Le domande completate e lo script di R corrispondente dovranno essere inviati via e-mail al Prof. Pagano che ne confermerà la ricezione agli studenti. I risultati dell'esame contribuiranno al 50% del voto finale, e verranno comunicati individualmente a ciascuno studente via e-mail.
Per il Progetto di Ricerca di Gruppo finale (2), alla fine del Modulo 2, gli studenti presenteranno il loro disegno di ricerca e i risultati preliminari ai loro colleghi e alla Prof.ssa Decadri durante il Project Colloquium. La nota di ricerca finale in formato .pdf, insieme al dataset e allo script di R per replicare le analisi, dovranno essere inviati via e-mail alla Prof.ssa Decadri entro il 7 luglio. Le relative valutazioni, che rappresentano il 50% del voto finale, verranno comunicate individualmente via e-mail.
Gli studenti che non possono partecipare alle lezioni verranno valutati attraverso un unico esame scritto. L'esame consisterà in una combinazione di domande a scelta multipla e a risposta aperta, nonché in analisi descrittive e inferenziali su R a partire da un dataset di dati fornito dagli istruttori. La valutazione su questa prova determinerà il voto finale.
Docente/i