Scienze dell'informazione e della comunicazione sul web

A.A. 2020/2021
6
Crediti massimi
40
Ore totali
SSD
INF/01
Lingua
Italiano
Obiettivi formativi
La comprensione e l'impiego delle tecniche e degli strumenti che determinano la visibilità dei contenuti web è un tema trasversale e pervasivo nell'ambito dell'Information and Communication Technology (ICT). Esso risulta di interesse non solo per i professionisti delle discipline informatiche, ma anche per gli esperti di comunicazione e per gli studiosi umanisti in generale. La prima parte del corso fornisce le nozioni fondamentali relative alla struttura del web, ai motori di ricerca e alle tecniche per il reperimento delle informazioni. La seconda parte illustra le tecniche per migliorare la visibilità dei contenuti pubblicati su web, più comunemente note come tecniche di Search Engine Optimization (SEO). Inoltre, quest'ultima parte presenta il tema emergente del "web dei dati", ne descrive le principali caratteristiche e differenze rispetto al modello tradizionalmente noto come "web delle informazioni" e infine fornisce le conoscenze necessarie per valutare l'impatto che queste nuovi strumenti hanno sulle convenzionali tecniche SEO.
Risultati apprendimento attesi
Lo studente dovrà possedere un'adeguata misura di Conoscenze e Competenze.
Conoscenze: lo studente dovrà possedere conoscenze relative al reperimento delle informazioni sul web con particolare enfasi rispetto ai motori di ricerca e alle relative tecniche di trasformazione del testo, indicizzazione e elaborazione delle interrogazioni. Saprà descrivere le caratteristiche dei principali modelli di reperimento (booleano vs. vettoriale) e le tecniche per valutare l'efficacia del reperimento con le metriche di precision, recall e misura-F. Inoltre, lo studente dovrà possedere conoscenze relative al tema della visibilità dei siti in termini di reperibilità sui motori di ricerca (il cosiddetto SEO - Search Engine Optimization). A tale scopo, lo studente dovrà conoscere i principali costrutti del linguaggio HTML5, le tecniche di analisi dei link (link analysis), così come la definizione di "web dei dati", le varie tipologie di microdati e l'impatto che tali nozioni hanno sulle tecniche SEO sia di tipo "on-site" sia di tipo "off-site".
Competenze: lo studente acquisirà le seguenti competenze:
· distinguere le caratteristiche e gli ambiti applicativi del modello di reperimento booleano rispetto al modello vettoriale;
· saper applicare le tecniche di trasformazione del testo, indicizzazione e elaborazione delle interrogazioni di un sistema di reperimento delle informazioni;
· saper applicare le tecniche di misurazione della rilevanza di un sistema di reperimento di tipo vettoriale basate su TF-IDF;
· saper applicare le tecniche di valutazione di un sistema di reperimento delle informazioni basate su precision, recall e misura-F;
· saper utilizzare il linguaggio HTML5 per la realizzazione di pagine web;
· saper descrivere le tecniche di analisi dei link e i principali algoritmi basati su analisi dei link per l'ordinamento dei risultati di un motore di ricerca;
· distinguere le caratteristiche dei principali formati per il "web dei dati", quali microdati, RDFa e JSON-LD;
· saper applicare le tecniche SEO.
Programma e organizzazione didattica

Edizione unica

Responsabile
Periodo
Secondo semestre
Le seguenti indicazioni sono da considerare valide solo nel caso di restrizioni per ragioni sanitarie da parte delle autorità competenti (lockdown).

Metodi didattici:
Le lezioni si terranno in videoconferenza utilizzando lo strumento Microsoft Teams secondo l'orario ufficiale. Inoltre, le lezioni saranno registrate e lasciate a disposizione degli studenti sulla pagina Ariel dell'insegnamento.
Il calendario delle lezioni e gli eventuali aggiornamenti alle attività del corso saranno pubblicati sul sito Ariel dell'insegnamento.

Materiali di riferimento:
Il programma d'esame e il materiale di riferimento sono invariati.

Modalità di verifica dell'apprendimento e criteri di valutazione:
La prova d'esame si svolgerà in modalità remota secondo le disposizioni dell'Ateneo che saranno comunicate sulla pagina Ariel dell'insegnamento. Lo studente può scegliere di sostenere l'esame con la modalità "studente frequentante" o "studente non frequentante" in base alla propria preferenza. La struttura delle prove d'esame e i criteri di valutazione sono invariati.
Programma
L'insegnamento è organizzato in due parti.
Il programma della parte A (20 ore - 3CFU) prevede la trattazione dei seguenti argomenti:
· Reperimento delle informazioni e motori di ricerca
· Modelli di reperimento (booleano vs. vettoriale)
· Tecniche di analisi automatica del testo
· Indicizzazione di contenuti web
· Elaborazione delle interrogazioni
· Valutazione di un sistema di reperimento delle informazioni

Il programma della parte B (20 ore - 3CFU) prevede la trattazione dei seguenti argomenti:
· Tecniche di analisi dei link (link analysis)
· Nozioni di HTML5
· Linguaggi per il web dei dati
· Visibilità dei siti e tecniche SEO (Search Engine Optimization)
· Tecniche SEO "on-site"
· Tecniche SEO "off-site"
Prerequisiti
Non sono richieste conoscenze preliminari.
Metodi didattici
Sono previste lezioni frontali con l'ausilio di slide e materiali didattici che saranno progressivamente resi disponibili sul sito web dell'insegnamento in piattaforma Ariel. Uno spazio specifico è riservato all'analisi di casi di studio reali mirati a illustrare l'applicazione concreta dei contenuti teorici affrontati durante lo svolgimento delle lezioni. Sono previsti seminari con testimonianze di professionisti esterni in materia di comunicazione sul web.
La frequenza, per quanto non obbligatoria, è fortemente consigliata. Sono considerati studenti frequentanti coloro che partecipano almeno ai due terzi delle lezioni.
Materiale di riferimento
Il materiale di riferimento per studenti frequentanti e non frequentanti è il medesimo.
Per la parte A, un testo a scelta tra:
· C.D. Manning, P. Raghavan, H. Schütze. Introduction to Information Retrieval. Cambridge University Press. 2008. Testo in Inglese, disponibile gratuitamente online.
Capitoli: 1, 2, 3, 4, 6, 8, 19, 21.
· W.B. Croft, D. Metzler, T. Strohman. Search Engines, Information Retrieval in Practice. Pearson Education. 2015. Testo in Inglese, disponibile gratuitamente online.
Capitoli: 1, 2, 3 (esclusi 3.6 - 3.8), 4 (esclusi 4.2.2, 4.6, 4.7), 5 (esclusi 5.4 - 5.7), 6, 7.1, 8 (esclusi 8.5 - 8.7).

Per la parte B, un testo a scelta tra:
· M. Maltraversi. SEO e SEM. Guida avanzata al Web marketing (quarta edizione). LSWR edizioni. 2016. Testo in Italiano.
· E. Enge, S. Spencer, J.C. Stricchiola. The Art of SEO: Mastering Search Engine Optimization. O'Reilly Editore, terza edizione. 2015. Testo in Inglese. Di questo testo, è ammessa anche la versione tradotta e rivisitata in lingua italiana a cura di Jacopo Matteuzzi e Flavio Mazzanti edito da Flacowski.
Modalità di verifica dell’apprendimento e criteri di valutazione
Studenti frequentanti: la verifica dell'apprendimento consiste in due prove scritte e una prova di approfondimento. La prima prova scritta si svolge a circa metà dell'insegnamento e verte sui contenuti della parte A. La seconda prova scritta si svolge al termine dell'insegnamento e verte sui contenuti della parte B. Entrambe le prove sono composte da domande aperte ed esercizi e hanno durata di un'ora ciascuna. I parametri di valutazione sono la capacità di presentare chiaramente la conoscenza, la completezza delle risposte, la correttezza dei ragionamenti nello svolgimento degli esercizi. Il risultato delle prove scritte è pubblicato sul sito web dell'insegnamento in piattaforma Ariel.
La prova di approfondimento verte su un tema o un caso di studio concordato con il docente in seguito al superamento della prima prova scritta. I parametri di valutazione sono la capacita' di presentare in modo chiaro ed efficace le proprie considerazioni rispetto allo studio realizzato, la competenza nell'impiego della terminologia specialistica. La valutazione è espressa in trentesimi e risulta dalla media delle valutazioni conseguite nelle prove scritte e nell'approfondimento.

Studenti non frequentanti: la verifica dell'apprendimento consiste in una prova scritta sul programma delle parti A e B. I parametri di valutazione sono la capacita' di organizzare discorsivamente la conoscenza, l'esposizione chiara ed efficace di ragionamenti critici rispetto alle domande proposte dal docente, la competenza nell'impiego del lessico specialistico. La valutazione è espressa in trentesimi.

Gli studenti Erasmus incoming avranno la possibilità, se lo richiedono, di sostenere l'esame in lingua inglese secondo un programma che dovrà essere concordato con il docente.
Le modalità d'esame per studenti con disabilità e/o con DSA dovranno essere concordate col docente, in accordo con l'Ufficio competente.
Moduli o unità didattiche
Unita' didattica A
INF/01 - INFORMATICA - CFU: 3
Lezioni: 20 ore

Unita' didattica B
INF/01 - INFORMATICA - CFU: 3
Lezioni: 20 ore

Docente/i
Ricevimento:
Giovedì, ore 11-12 (controllare eventuali spostamenti alla pagina specificata)
Stanza 7015, Dipartimento di Informatica "Giovanni degli Antoni", Via Celoria 18 - 20133 Milano