Statistica per big data economico/aziendali

A.A. 2025/2026
6
Crediti massimi
40
Ore totali
SSD
SECS-S/03
Lingua
Italiano
Obiettivi formativi
Il corso si propone di introdurre ed illustrare specifiche metodologie statistiche, informatiche e di machine learning per l'analisi dei Big Data nelle applicazioni economiche, aziendali e finanziarie. Tutto il corso verterà principalmente sul linguaggio di programmazione Python che di gran lunga è il più usato nelle applicazioni Big Data, ma si dedicheranno alcune parti al linguaggio R e ad altri linguaggi più classici come Java. Sul lato statistico si proporranno temi di statistical learning supervisionato e non supervisionato con qualche accenno alla statistica bayesiana.
Risultati apprendimento attesi
Al termine del corso, lo studente avrà acquisito adeguate competenze statistiche e di programmazione che gli consentiranno di padroneggiare gli strumenti necessari per l'analisi dei Big Data e l'estrapolazione delle informazioni di interesse in ambito economico, aziendale e finanziario.
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Terzo trimestre

Programma
Gli argomenti del corso sono:
- algebra matriciale, matrici dei dati e statistiche descrittive
- Cluster analysis (metodi gerarchici e non gerarchici) con interpretazione in R
- Analisi delle componenti principali con interpretazione in R
- Alberi decisionali (CART) con interpretazione in R
- Bootstrap con interpretazione in R
- Random forest con interpretazione in R
Prerequisiti
Al fine di affrontare adeguatamente i contenuti proposti nel corso, gli studenti dovranno aver maturato adeguate competenze in ambito statistico e matematico.
Metodi didattici
Il corso sarà organizzato attraverso lezioni teoriche e lezioni pratiche dove interpretare output in R
Materiale di riferimento
- Slides a disposizione sul sito del corso;
- Witten et al. (2020). Introduzione all'apprendimento statistico, Piccin (https://www.piccin.it/it/statistica
introduzione-all-apprendimento-statistico-con-applicazioni-in-r-9788829930944.html).
- Crawley (2012) The R book, Wiley.
- Parte informatica (Python): Bowles (2015). Machine Learning in Python, Wiley.
- Parte informatica (Cloud computing): Barrie Sosinsky (2010): Cloud Computing Bible,
Wiley.
- Parte informatica (Database relazionali): Atzeni et al. (2018).Basi di dati. McGraw-
Hill
Modalità di verifica dell’apprendimento e criteri di valutazione
Tre Homeworks facoltativi.
Esame scritto con domande aperte e domande a risposta multipla sulla teoria, su R e su Python
SECS-S/03 - STATISTICA ECONOMICA - CFU: 6
Lezioni: 40 ore
Docente: Rossini Luca
Docente/i
Ricevimento:
Ogni Mercoledì 10-12
DEMM, stanza 31, 3° p (Previa Appuntamento inviando una mail)