Basi di dati

A.A. 2018/2019
12
Crediti massimi
120
Ore totali
SSD
INF/01
Lingua
Italiano
Obiettivi formativi
Illustrare i concetti fondamentali delle basi di dati relazionali e dei sistemi di gestione, le metodologie di progettazione delle basi di dati, la struttura interna di un sistema di gestione delle base di dati, la gestione delle transazioni, le basi di dati distribuite, e alcune direzioni di evoluzione della tecnologia delle basi di dati quali la gestione dei dati semistrutturati, le basi di dati attive e le basi di dati per il supporto alle decisioni.
Risultati apprendimento attesi
Non definiti
Corso singolo

Questo insegnamento non può essere seguito come corso singolo. Puoi trovare gli insegnamenti disponibili consultando il catalogo corsi singoli.

Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo semestre

STUDENTI FREQUENTANTI
Programma
1. Introduzione alle basi di dati. Sistemi Informativi, sistemi organizzativi e sistemi informatici. Concetto di informazione e dato. Introduzione a basi di dati e DBMS, modello dei dati, concetto di schema ed istanza. Indipendenza logica e fisica dei dati, tipologia di linguaggi per basi di dati, entità coinvolte nella gestione delle basi di dati.
2. Modello relazionale. Modelli logici. Modello relazionale: relazioni vs tabelle; relazioni con attributi; notazioni; informazione incompleta e valori nulli. Vincoli di integrità: vincoli di tupla; chiavi e valori nulli; vincoli di integrità referenziale.
3. Algebra relazionale. Operatori di base (unione, intersezione, differenza, selezione e proiezione) ed operatori derivati (natural join, theta join, semi-join). Interrogazioni in algebra relazionale ed equivalenza di espressioni algebriche. Idiomi di interrogazione.
4. SQL. Data Definition Language: i domini elementari, definizione di schema, tabelle e di domini. Vincoli intrarelazionali ed interrelazionali. Interrogazioni in SQL: interrogazioni semplici, operatori aggregati, clausola di GROUP BY, interrogazioni di tipo insiemistico e nidificate. Operazioni di inserimento, modifica e cancellazione. Definizione di vincoli di integrità generici, asserzioni e viste. Controllo dell'accesso.
5. Progettazione di basi di dati. Ciclo di vita dei sistemi informativi. Raccolta e analisi dei requisiti. Metodologia di progettazione. Fasi della progettazione. Il modello Entità-Relazione: costrutti (entità, relazione, attributo, cardinalità, identificatori, gerarchie); documentazione di schemi; regole. Strategie di progetto: top-down, bottom-up, inside-out, mista. Qualità di uno schema concettuale. Progettazione logica: ristrutturazione di schemi E-R (eliminazione delle gerarchie; scelta degli identificatori principali; partizionamento/accorpamento di entità e relazione); traduzione verso il modello relazionale; documentazione di schemi logici. Cenni alla progettazione fisica.
6. Organizzazione fisica delle basi di dati. Moduli per l'accesso ai dati. Memoria principale, memoria secondaria e buffer. Gestore del buffer e sue primitive. Organizzazione dei file: struttura sequenziale (seriale, ad array, ordinata), ad accesso calcolato (hash-based), ad indici (alberi). Alberi B e B+. Gestione delle tuple nelle pagine. Progettazione fisica e definizione degli indici.
7. Gestione delle transazioni. Definizione di transazione. Proprietà ACIDe delle transazioni. Transazioni e moduli di sistema. Gestore dell'affidabilità. Memoria stabile. Log: organizzazione, record e gestione. Guasti e loro gestione: ripresa a caldo e a freddo. Controllo della concorrenza. Anomalie delle transazioni concorrenti. Schedule seriali e serializzabili. View-equivalenza e conflict equivalenza. Locking a due fasi e sue varianti. Timestamp (monoversione e multiversione). Lock e loro gestione. Locking e livelli di isolamento in SQL. Deadlock e sua gestione. Livelock e starvation.
8. Architetture distribuite. Paradigmi per la distribuzione dei dati. Tipologie di architetture. Proprietà dei sistemi distribuiti. Architettura client-server. Basi di dati distribuite. Frammentazione e allocazione dei dati. Livelli di trasparenza. Transazioni in basi di dati distribuite: classificazione e gestione delle proprietà ACIDe. Ottimizzazione di query distribuite. Metodo di Lamport. Deadlock distribuiti: definizione e gestione. Protocolli di commit distribuito: commit a due fasi e sue varianti.
9. Dati semistrutturati. XML. Definizione di dati semistrutturati in XML. Interrogazione di dati XML: XQuery e XPath; espressioni FLOWR.
10. Basi di dati attive. Regole E-C-A. Trigger. Livelli e modalità di esecuzione. Caratteristiche evolute delle regole attive. Proprietà delle regole attive: terminazione, confluenza, determinismo delle osservazioni. Analisi di terminazione. Applicazioni delle regole attive.
11. Basi di dati per il supporto alle decisioni. OLTP vs OLAP. Basi di dati per il supporto alle decisioni (OLAP). Data warehouse: caratteristiche e architettura. Rappresentazione multidimensionale dei dati. Operazioni su dati multidimensionali. Realizzazione di un data warehouse. Progettazione di un data warehouse: schema a stella e a fiocco di neve. Operazioni su ROLAP. Aggregazione in SQL. Data mining: regole di associazione e di classificazione
Propedeuticità
Nessuna
Prerequisiti
Concetti di informatica di base
Basic concepts of computer science

====
Concetti di base di: sicurezza e privatezza; basi di dati
Basic concepts of: security and privacy, databases

L'esame consiste in una prova scritta (ed eventuale discussione orale sulla stessa) volta ad accertare la preparazione e la comprensione della materia. La prova comprende domande di teoria ed esercizi.
Metodi didattici
Lezioni frontali
Materiale di riferimento
· P. Atzeni, S. Ceri, P. Fraternali, S. Paraboschi, R. Torlone, Basi di Dati, 5 ed., McGraw-Hill Italia, 2018
· Slide disponibili sul sito web del corso
STUDENTI NON FREQUENTANTI
Prerequisiti
Concetti di informatica di base
Basic concepts of computer science

====
Concetti di base di: sicurezza e privatezza; basi di dati
Basic concepts of: security and privacy, databases

L'esame consiste in una prova scritta (ed eventuale discussione orale sulla stessa) volta ad accertare la preparazione e la comprensione della materia. La prova comprende domande di teoria ed esercizi.
INF/01 - INFORMATICA - CFU: 12
Laboratori: 48 ore
Lezioni: 72 ore
Docente/i
Ricevimento:
su appuntamento
piano 6 - via Celoria, 18 - Milano (MI)
Ricevimento:
Su appuntamento
Dipartimento di Informatica