Research data management @LaStatale

L’Università supporta i principi e le azioni favorevoli alla gestione aperta dei dati della ricerca, presupposto indispensabile della riproducibilità e dell’accesso aperto ai risultati della scienza. L’Università degli Studi di Milano, riconoscendo la rilevanza della gestione dei dati per il mantenimento dei valori di qualità e integrità della ricerca scientifica, si impegna ad applicare i più elevati standard per la loro raccolta, archiviazione e conservazione.

La Policy sulla gestione dei dati formalizza la piena adesione dell’Ateneo all’Open Research Data, stabilisce responsabilità, diritti e doveri dell’Ateneo e di chi fa ricerca in Università, proponendo un modello di Data Management Plan (DMP) per una corretta gestione dei dati a partire dalla raccolta, documentazione e archiviazione all’accesso, uso e conservazione (o distruzione) dei dati.

Per supporto nella compilazione di un Data management Plan dataverse@unimi.it

I dati della ricerca sono record fattuali (dati numerici, simboli, testi, immagini o suoni) utilizzati come fonti primarie della ricerca scientifica e necessari per convalidarne i risultati (policy RDM dell'Università Statale di Milano).

La gestione dei dati della ricerca durante l’intero ciclo di vita è un processo molto complesso ed è importante che sia impostato correttamente fin dall’inizio, secondo standard internazionali che ne definiscono le caratteristiche salienti.

Open Data sono dati che possono essere utilizzati, modificati e condivisi da chiunque, per qualsiasi motivo, a patto che se ne preservino provenienza e accesso aperto.

Cosa sono i dati FAIR? 

Perché possano rispondere alle aspettative della Commissione europea e alle politiche sull’Open Science, i dati devono avere determinate caratteristiche, in particolare devono essere:

Findable : rintracciabili e descritti utilizzando set di metadati standard (ad esempio dublin core) riconosciuti dalle diverse comunità disciplinari e devono adottare identificativi univoci (ad esempio il DOI)

Accessible: i dati devono essere sempre e comunque accessibili a chi ne faccia motivata richiesta, e devono essere aperti tutte le volte che ciò sia possibile.

Interoperable: devono poter essere letti e rielaborati da sistemi conformi ai principi FAIR

Reusable: devono essere corredati da una licenza che spiega quali sono gli utilizzi permessi e da tutta la documentazione necessaria per il loro riutilizzo (metodologia, strumenti utilizzati ecc.)

La Commissione Europea, così come altri enti finanziatori, richiede a coloro che hanno ottenuto un finanziamento (Horizon 2020, ERC) di rendere disponibili ad accesso aperto i risultati della ricerca che ne derivano.

Con risultati della ricerca si intendono le pubblicazioni scientifiche e i dati a esse sottesi e generati durante lo studio. La Commissione richiede che i dati siano disponibili in un repository in linea con i principi FAIR e con il minor numero di restrizioni possibili.

Nel 2017 la Commissione europea ha pubblicato le linee guida relative all’Open Access a pubblicazioni e dati della ricerca nei programmi di finanziamento. 

I dati devono essere as open as possible as closed as necessary. Non tutti i dati possono essere aperti, ma devono comunque essere accessibili.

L’opt out (che deve essere giustificato e motivato) è possibile in qualsiasi fase del progetto qualora:

  • il progetto non prevede di generare dati
  • ci sia incompatibilità con il regolamento sulla protezione dei dati personali/sensibili
  • i dati debbano essere utilizzati per le procedure di brevettazione
  • l'apertura dei dati possa ostacolare il raggiungimento degli obiettivi del progetto

E’ eventualmente possibile rendere aperti solo alcuni dataset.

Il DMP è lo strumento attraverso il quale i ricercatori pianificano la raccolta, conservazione, descrizione e disseminazione dei propri dati e metadati della ricerca secondo i principi FAIR.

Il piano deve essere compilato entro 6 mesi dall'approvazione del progetto ed è uno dei deliverable obbligatori a meno che non venga fatto un opt out.

La gestione dei dati di ricerca è un processo molto complesso, proprio per questo è importante impostarne le linee generali e il quadro di riferimento fin dall’inizio del progetto.

Il DMP è concepito come un living document da aggiornare, in versioni successive, nelle diverse fasi della ricerca, e segue l’intero ciclo di vita dei dati consentendone tracciabilità, disponibilità, autenticità, citabilità e una conservazione appropriata, tenendo conto anche degli aspetti etici e legati alla sicurezza.

L’Ateneo mette a disposizione un template per la gestione dei dati della ricerca, elaborato da un gruppo di Atenei italiani secondo gli standard internazionali.

L’Ateneo mette a disposizione di tutti coloro che devono archiviare i dati FAIR (siano essi aperti o chiusi) una installazione di DATAVERSE (uno strumento open source elaborato dall’Università di Harvard).

Per informazioni rivolgersi a dataverse@unimi.it

La European Open Science Cloud (EOSC) è lo strumento attraverso il quale la Commissione Europea intende costruire un'economia della conoscenza europea competitiva e fondata sui dati. E’ un luogo virtuale costituito da infrastrutture federate e interoperabili, dove ricercatori e fornitori di servizi si incontrano con lo scopo comune di una gestione dei dati FAIR che favorisca un linguaggio comune, al di là dei confini nazionali e di quelli fra discipline.

Nel 2017 viene lanciata dalla Commissione europea e nel 2017 viene diffusa la EOSC Declaration che ottiene il sostegno di enti di ricerca, finanziatori, editori scientifici, enti preposti alla fornitura di servizi connessi alla gestione dei dati.

Nel marzo del 2018 viene pubblicata la Roadmap per l'implementazione della Open Science Cloud e il 20 novembre dello stesso anno vede la luce la European Open science Cloud.

La EOSC offrirà a 1,7 milioni di ricercatori europei e a 70 milioni di professionisti nel campo delle scienze dure e delle scienze umani e sociali, un ambiente virtuale e con servizi aperti e continui per la conservazione, la gestione, l’analisi e il riutilizzo dei dati della ricerca, oltre i confini geografici e fra le diverse discipline, basato su un sistema federato di infrastrutture scientifiche attualmente disarticolate e residenti nei vari stati membri.