Hai bisogno di chiarimenti o supporto?

Consulta le domande frequenti

È un catalogo previsto dall’investimento 1.3.1 del Piano Nazionale di Ripresa e Resilienza (PNNR) che contiene ontologie, vocabolari controllati e schemi dati della pubblica amministrazione italiana, accessibile a chiunque voglia consultare o utilizzare degli asset semantici per garantire l'interoperabilità semantica e sviluppare servizi digitali semanticamente e sintatticamente coerenti.

L'interoperabilità semantica è la capacità di garantire che il formato e il significato delle informazioni scambiate siano preservati e compresi durante gli scambi tra le parti

Il catalogo si rivolge a tutti gli enti della pubblica amministrazione e ai privati che vogliono ricercare, consultare e utilizzare asset semantici e, in particolare, alle persone che sviluppano servizi digitali e quelle esperte di semantica.

Il catalogo serve a ricercare, consultare e riutilizzare ontologie, vocabolari controllati e schemi dati. È particolarmente utile agli enti che creano servizi digitali basati su API di altri enti per poter riutilizzare direttamente sia i modelli semantici che i vocabolari controllati esposti dal catalogo.

Le sue funzionalità principali sono:

harvesting: scarica automaticamente gli asset semantici dai repository ufficiali pubblicati dai vari enti;
ricerca: permette di ricercare e consultare asset semantici in modo semplice;
consultazione: espone API REST per la ricerca e per la lettura dei vocabolari controllati ed espone uno SPARQL endpoint per la ricerca di ontologie.

Inoltre, è in fase di sviluppo una funzionalità che permetterà di validare la semantica e la sintassi delle API REST rispetto ai contenuti semantici pubblicati nel catalogo. Questa funzionalità sarà rilasciata a partire da giugno 2022.

Scalabilità: ogni nuovo servizio richiede lo sviluppo di codice ad-hoc per validare, interpretare ed uniformare i dati ricevuti da enti diversi e l’interazione tra enti per verificare il significato e il contesto dei dati non è scalabile.
Riuso degli schemi: gli schemi dati non sono condivisi e quindi non sono facilmente riutilizzabili (né gli schemi, né il codice collegato). Il catalogo li rende riutilizzabili.
Interpretazione dei dati: il significato dei dati scambiati è ambiguo e spesso lasciato a interpretazione, con il rischio di inconsistenze anche sintattiche nei vari dataset e le API non sono semanticamente e sintatticamente interoperabili.
Cultura della semantica: lo sviluppo e pubblicazione di schemi avviene spesso in una logica a silos, impedendo l’interoperabilità semantica tra basi dati e servizi.
Creazione di nuovi servizi: risulta difficile creare nuovi servizi se i dati scambiati non hanno un significato chiaro (ad esempio, se si confonde il nucleo familiare con la famiglia anagrafica, o un tampone molecolare con uno rapido).

Immaginiamo un comune che deve creare dei moduli online per dei servizi digitali. Senza il catalogo, il comune e i suoi fornitori potrebbero ogni volta definire i possibili titoli di studio e la loro sintassi, con il rischio di generare possibili incoerenze fra diversi moduli e rendere la comprensione più complessa per i cittadini. Grazie al catalogo, potranno invece riutilizzare, tramite API, i valori pubblicati dal catalogo a partire dal vocabolario nazionale education-level.csv.

Le ontologie, i vocabolari controllati e gli schemi dati sono scaricati dai repository ufficiali (e.g. Github o Gitlab) degli enti della pubblica amministrazione. Il catalogo scarica i dati contenuti nella directory che ha subìto l'aggiornamento più recente. I dati provengono da fonti ufficiali in quanto ogni ente è titolare dei metadati pubblicati.

I dati contenuti e pubblicati sul catalogo sono asset semantici e per definizione non contengono dati personali, ma solo metadati. Di conseguenza, i dati sono distribuiti in formato open e con licenza aperta CC-BY 4.0. Qualsiasi dato pubblicato nel catalogo è anche disponibile nei repository resi pubblici dagli enti.

Si, le componenti di front-end e back-end del catalogo sono open source ed accessibili nei repository
https://github.com/teamdigitale/dati-semantic-backend
https://github.com/teamdigitale/dati-semantic-frontend
Puoi contribuire al miglioramento del catalogo aprendo una issue in uno dei repository menzionati.

La consultazione del catalogo non necessita di autenticazione: chiunque voglia consultare degli asset semantici lo può fare tramite all'indirizzo schema.gov.it. Inoltre, chiunque voglia scaricare i dati in modalità machine to machine potrà usare le API REST (per quanto riguarda i vocabolari controllati) oppure lo SPARQL endpoint (per interrogare le ontologie).

Le pubbliche amministrazioni possono contribuire pubblicando asset semantici nei loro repository ufficiali. Per essere conformi con le regole di harvesting e di pubblicazione della piattaforma, le pubbliche amministrazioni che creano e pubblicano asset semantici nei loro repository devono seguire le indicazioni fornite nella sezione “Come contribuire”.

Il progetto è coordinato dal Dipartimento per la trasformazione digitale, mentre la piattaforma è gestita e mantenuta da ISTAT.

In futuro sarà costituito un comitato centrale per la governance della semantica nazionale costituito da vari enti centrali della pubblica amministrazione. Questo comitato supervisionerà i vari enti esperti di dominio nel processo di creazione e pubblicazione degli asset semantici, e garantirà la coerenza e l’integrità dei contenuti pubblicati.

Schema è un catalogo in
continua evoluzione

Se trovi errori o bug apri una issue su github.

Vai su github

Schema

Hai bisogno di chiarimenti o supporto?

Che cos’è il catalogo nazionale per l’interoperabilità semantica?

Cos’è l’interoperabilità semantica?

A chi si rivolge il catalogo?

A cosa serve e quali sono le sue funzionalità?

Quali problemi risolve il catalogo?

Qual è un caso d’uso di esempio?

Chi pubblica i contenuti? I dati provengono da fonti ufficiali?

I dati contenuti rispettano le norme vigenti sulla privacy?

Il catalogo nazionale è open source? Come posso contribuire al suo sviluppo?

Come faccio ad utilizzare il catalogo?

Come posso contribuire alla pubblicazione di nuovi asset semantici?

Chi gestisce il catalogo?

Chi gestisce e governa la pubblicazione di asset semantici?

Schema è un catalogo in continua evoluzione

Schema è un catalogo in
continua evoluzione