Tecnologie digitali per le organizzazioni

A.A. 2023/2024
6
Crediti massimi
40
Ore totali
SSD
INF/01
Lingua
Italiano
Obiettivi formativi
L'insegnamento ha il duplice obiettivo di 1) familiarizzare gli studenti con tecnologie professionali e di ampio utilizzo per l'organizzazione, l'analisi e la visualizzazione di dati strutturati; 2) introdurre alla logica e all'uso di sequenze di comandi e costrutti di controllo (scripting) per l'analisi di dati.

Più in dettaglio, il corso ha i seguenti obiettivi:
1) Introdurre gli studenti all'analisi di dati per le Scienze Sociali e alle tecnologie open source;
2) Apprendere i principi di analisi di dati con R: linguaggio R, librerie, RStudio;
3) Imparare i principi della logica computazionale con tecnologie a linea di comando;
4) Apprendere i passi fondamentali per l'analisi dei dati: operazioni di data tidying e trasformazione;
5) Introdurre ai principi di visualizzazione di dati e delle principali tipologie di grafici (scatterplot, lineplot, bar chart, istogrammi, boxplot, marginals e varianti) attraverso l'uso della libreria ggplot2;
6) Introdurre all'uso di open data con esercizi utilizzando dati nel pubblico dominio di medio-bassa complessità;
7) Utilizzo di testi e documentazione tecnica in formato open, online e in lingua inglese.
Risultati apprendimento attesi
Lo studente dovrà essere in grado di comprendere il significato e gli effetti di comandi in serie per l'organizzazione, l'analisi e la visualizzazione di dati. Dovrà essere in grado di realizzare gli script corrispondenti a richieste di selezione, manipolazione e visualizzazione rispetto a dataset predefiniti. Dovrà essere inoltre in grado di interpretare e correggere errori di sintassi e semantica nell'uso del linguaggio di specifica dei comandi. Dovrà infine essere in grado presentare argomentazioni circa le possibilità di analisi di dataset predefiniti, i risultati attesi o ottenibili dallo strumento utilizzato e le potenziali applicazioni.
Corso singolo

Questo insegnamento può essere seguito come corso singolo.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Primo trimestre

Programma
1. Introduzione alla data science per le Scienze Sociali
2. Open Data, Open Access, Open Source
3. Il linguaggio R e il programma RStudio
4. Operazioni di Data Wrangling
5. Lettura di dati e operazioni di trasformazione fondamentali
6. Operazioni su date, stringhe alfanumeriche e valori mancanti
7. Gruppi e operazioni di aggregazione
8. Funzioni e operazioni multicolonna
9. Join di data frame
10. Operazioni su liste

Tutti gli argomenti sono corredati da esercitazioni pratiche, svolte o discusse in aula e da svolgere autonomamente su casi reali ricavati da Open Data pubblicamente disponibili. Svolgere numerosi esercizi è parte indispensabile della preparazione richiesta.
Prerequisiti
Lettura e comprensione testi tecnici in inglese: conoscenza di base.
Uso di base di un personal computer e rete internet (es. creazione e gestione di file, cartelle, regole per i nomi dei file, installazione guidata di un programma, uso di browser e motori di ricerca, etc.) .
Metodi didattici
Metodi didattici
Le lezioni sono di tipo frontale. È utile avere un proprio laptop per seguire gli esempi e le esercitazioni discusse in aula.

Alcune esercitazioni saranno svolte dalla tutor del corso. La modalità potrà essere online o in presenza a seconda della disponibilità di aule. Queste ore di esercitazione sono in aggiunta alle 40 ore del corso tenute dal docente, non includono contenuti diversi da quelli discussi dal docente e pertanto sono facoltative ai fini della preparazione all'esame, tuttavia rappresentano un supporto all'apprendimento utile a numerosi studenti.
Materiale di riferimento
LIBRO DI TESTO
FONDAMENTI DI DATA SCIENCE - Python, R e OpenData
Marco Cremonini, Egea Editore, Giugno 2023. ISBN/EAN: 9788823823501
https://www.egeaeditore.it/ita/prodotti/ict-e-sistemi-informativi/fondamenti-di-data-science.aspx

Di questo testo useremo le sezioni dedicate al linguaggio R.
Altro materiale sarà tratto online sotto forma di dati open pubblici o riferimenti a documentazione tecnica.
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame è esclusivamente scritto con esercitazioni che richiedono l'uso del pc e dei software utilizzati durante il corso.
Non sono previste prove intermedie.
La valutazione si baserà sul grado di comprensione della logica computazionale, della familiarità raggiunta nell'analisi dei dati e nell'uso delle tecnologie impiegate durante il corso.
INF/01 - INFORMATICA - CFU: 6
Lezioni: 40 ore
Docente: Cremonini Marco
Docente/i
Ricevimento:
da concordare
online