Social media mining

A.A. 2021/2022
12
Crediti massimi
120
Ore totali
SSD
INF/01
Lingua
Italiano
Obiettivi formativi
L'insegnamento ha lo scopo di introdurre i concetti fondamentali riguardanti l'analisi di reti sociali complesse, illustrando le basi teoriche della scienza delle reti, i metodi e gli algoritmi principali della analisi di reti sociali.
Risultati apprendimento attesi
Lo studente dovrà essere in grado di applicare le teorie, i metodi e i modelli presentati nell'insegnamento al progetto di analisi di una rete sociale complessa. Lo studente sarà in grado di progettare e condurre studi di grandi reti sociali.
Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo semestre
Programma
L'insegnamento si articola in una parte di teoria e in una parte di laboratorio.
La parte di teoria verte sui seguenti argomenti:
Modelli di rete
Elementi costituenti e loro misure
- Componenti connesse
- Grado dei nodi e reti scale-free
- Diadi e reciprocità
- Triadi e coefficiente di Clustering
- Similarità dei nodi
- Assortatività
Applicazioni
- Community detection
- Information diffusion
- Link prediction
Introduzione all'apprendimento supervisionato e non supervisionato
La parte di Laboratorio verte sui seguenti argomenti:
- Data gathering: web scraping e social media API
- Visualizzazione di reti sociali tramite Gephi
- Analisi di reti sociali reali utilizzando la libreria Pyton NetworkX
- Link prediction tramite apprendimento supervisionato
- Clustering
Prerequisiti
E' richiesta la conoscenza delle nozioni fondamentali di matematica discreta, statistica e programmazione.
Metodi didattici
La parte di teoria viene svolta mediante lezioni frontali. La parte di laboratorio alterna lezioni frontali a esercitazioni e attività pratiche svolte individualmente o in piccoli gruppi.
Materiale di riferimento
Sito web:
https://sgaitomasn.ariel.ctu.unimi.it/

Testo di riferimento:
Social Media Mining, Reza Zafarani, Mohammad Ali Abbasi, Huan Liu, Cambridge University Press, 2014

Altri testi consigliati:
Albert-LászlóBarabási: "Network Science" per la trattazione delle scale-free networks.
D. Easley, J. Kleinberg, "Networks, Crowds, and Markets: Reasoning About a Highly Connected World" per la trattazione di strong-weak ties.

Ulteriore materiale integrativo, preparato dai docenti, viene reso disponibile sul sito web dell'insegnamento.
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame consiste di una prova scritta, di un progetto di laboratorio e di una prova orale.
Nella prova scritta, della durata di due ore, viene richiesta la risoluzione di alcuni esercizi, basati su domande a risposta aperta, e la trattazione sintetica di alcune degli argomenti presentati nell'insegnamento.
Il progetto di laboratorio consiste in un progetto di analisi di un social media a scelta dello studente.
L'esame si conclude con la prova orale, che verte sulla presentazione orale del progetto di laboratorio di circa 15 minuti seguita da una discussione sugli elementi salienti del progetto stesso e sulle teorie applicate.

Al termine della prova orale viene formulata la valutazione complessiva, espressa in trentesimi, tenendo conto dei seguenti parametri: grado di conoscenza degli argomenti, capacità di applicare le conoscenze alla risoluzione di problemi concreti, capacità di ragionamento critico, chiarezza espositiva e proprietà di linguaggio.
INF/01 - INFORMATICA - CFU: 12
Laboratori: 48 ore
Lezioni: 72 ore
Docente/i
Ricevimento:
su appuntamento via email (by appointment via email)
ufficio (Celoria 18, VII piano) o online (emergenza covid)