Statistica per big data economico/aziendali

A.A. 2023/2024
6
Crediti massimi
40
Ore totali
SSD
SECS-S/03
Lingua
Italiano
Obiettivi formativi
Il corso si propone di introdurre ed illustrare specifiche metodologie statistiche, informatiche e di machine learning per l'analisi dei Big Data nelle applicazioni economiche, aziendali e finanziarie. Tutto il corso verterà principalmente sul linguaggio di programmazione Python che di gran lunga è il più usato nelle applicazioni Big Data, ma si dedicheranno alcune parti al linguaggio R e ad altri linguaggi più classici come Java. Sul lato statistico si proporranno temi di statistical learning supervisionato e non supervisionato con qualche accenno alla statistica bayesiana.
Risultati apprendimento attesi
Al termine del corso, lo studente avrà acquisito adeguate competenze statistiche e di programmazione che gli consentiranno di padroneggiare gli strumenti necessari per l'analisi dei Big Data e l'estrapolazione delle informazioni di interesse in ambito economico, aziendale e finanziario.
Corso singolo

Questo insegnamento può essere seguito come corso singolo.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Terzo trimestre

Programma
PRIMA PARTE: Metodi statistici
1.1 Cluster analysis: metodi avanzati
1.2 Analisi delle componenti principali e cenni ad altri metodi di riduzione dimensionale
1.3 Alberi decisionali
1.4 Il bootstrap
1.5 Random forest
SECONDA PARTE: Introduzione alla programmazione e al data management
1) Introduzione alla programmazione in R e Python per le applicazioni statistiche ed economiche
2) Introduzione al cloud computing
3) Introduzione al web scraping
4) Introduzione al database relazionale e non relazionale
5) Cenni al linguaggio SQL
Prerequisiti
Conoscenza delle tecniche statistiche e matematiche di base. La conoscenza di alcune tecniche di programmazione è utile ma non essenziale.
Metodi didattici
Le lezioni saranno svolte con il coinvolgimento attivo degli studenti, soprattutto nella parte di programmazione. Gli studenti saranno spesso invitati a seguire attivamente (cioè anche sui loro portatili personali) passi di programmi informatici proposti in aula assieme al docente, in un approccio "what-if". Si lavorerà anche in gruppi per condividere l'apprendimento.
Materiale di riferimento
James, Witten, Hastie, Tibshirani (2013). Introduction to Statistical Learning, Springer
Sosinsky (2010). Cloud Computing Bible, Wiley
Crawley (2012) The R book, Wiley.
Raschka, Mirjalili (2013). Python Machine Learning
Wiktorski, (2019). Data-intensive Systems, Springer.
Atzeni et al. (2018).Basi di dati. McGraw-Hill.
Modalità di verifica dell’apprendimento e criteri di valutazione
L'esame consisterà in un test con domande che prevedono risposte multiple. Durante il corso si proporranno alcuni task sia in aula che da consegnare a breve termine che concorreranno al punteggio finale.
SECS-S/03 - STATISTICA ECONOMICA - CFU: 6
Lezioni: 40 ore
Docente: Cappozzo Andrea
Docente/i
Ricevimento:
Venerdì dalle 10 alle 12
Ufficio n.29, III piano di via Conservatorio