Hai bisogno di chiarimenti o supporto?
Consulta le domande frequenti
È un catalogo previsto dall’investimento 1.3.1 del Piano Nazionale di Ripresa e Resilienza (PNNR) che contiene ontologie, vocabolari controllati e schemi dati della pubblica amministrazione italiana, accessibile a chiunque voglia consultare o utilizzare degli asset semantici per garantire l'interoperabilità semantica e sviluppare servizi digitali semanticamente e sintatticamente coerenti.
L'interoperabilità semantica è la capacità di garantire che il formato e il significato delle informazioni scambiate siano preservati e compresi durante gli scambi tra le parti
Il catalogo si rivolge a tutti gli enti della pubblica amministrazione e ai privati che vogliono ricercare, consultare e utilizzare asset semantici e, in particolare, alle persone che sviluppano servizi digitali e quelle esperte di semantica.
Il catalogo serve a ricercare, consultare e riutilizzare ontologie, vocabolari controllati e schemi dati. È particolarmente utile agli enti che creano servizi digitali basati su API di altri enti per poter riutilizzare direttamente sia i modelli semantici che i vocabolari controllati esposti dal catalogo.
Le sue funzionalità principali sono:
- harvesting: scarica automaticamente gli asset semantici dai repository ufficiali pubblicati dai vari enti;
- ricerca: permette di ricercare e consultare asset semantici in modo semplice;
- consultazione: espone API REST per la ricerca e per la lettura dei vocabolari controllati ed espone uno SPARQL endpoint per la ricerca di ontologie.
Inoltre, è in fase di sviluppo una funzionalità che permetterà di validare la semantica e la sintassi delle API REST rispetto ai contenuti semantici pubblicati nel catalogo. Questa funzionalità sarà rilasciata a partire da giugno 2022.
- Scalabilità: ogni nuovo servizio richiede lo sviluppo di codice ad-hoc per validare, interpretare ed uniformare i dati ricevuti da enti diversi e l’interazione tra enti per verificare il significato e il contesto dei dati non è scalabile.
- Riuso degli schemi: gli schemi dati non sono condivisi e quindi non sono facilmente riutilizzabili (né gli schemi, né il codice collegato). Il catalogo li rende riutilizzabili.
- Interpretazione dei dati: il significato dei dati scambiati è ambiguo e spesso lasciato a interpretazione, con il rischio di inconsistenze anche sintattiche nei vari dataset e le API non sono semanticamente e sintatticamente interoperabili.
- Cultura della semantica: lo sviluppo e pubblicazione di schemi avviene spesso in una logica a silos, impedendo l’interoperabilità semantica tra basi dati e servizi.
- Creazione di nuovi servizi: risulta difficile creare nuovi servizi se i dati scambiati non hanno un significato chiaro (ad esempio, se si confonde il nucleo familiare con la famiglia anagrafica, o un tampone molecolare con uno rapido).
Immaginiamo un comune che deve creare dei moduli online per dei servizi digitali. Senza il catalogo, il comune e i suoi fornitori potrebbero ogni volta definire i possibili titoli di studio e la loro sintassi, con il rischio di generare possibili incoerenze fra diversi moduli e rendere la comprensione più complessa per i cittadini. Grazie al catalogo, potranno invece riutilizzare, tramite API, i valori pubblicati dal catalogo a partire dal vocabolario nazionale education-level.csv.
Le ontologie, i vocabolari controllati e gli schemi dati sono scaricati dai repository ufficiali (e.g. Github o Gitlab) degli enti della pubblica amministrazione. Il catalogo scarica i dati contenuti nella directory che ha subìto l'aggiornamento più recente. I dati provengono da fonti ufficiali in quanto ogni ente è titolare dei metadati pubblicati.
I dati contenuti e pubblicati sul catalogo sono asset semantici e per definizione non contengono dati personali, ma solo metadati. Di conseguenza, i dati sono distribuiti in formato open e con licenza aperta CC-BY 4.0. Qualsiasi dato pubblicato nel catalogo è anche disponibile nei repository resi pubblici dagli enti.
Si, le componenti di front-end e back-end del catalogo sono open source ed accessibili nei repository
https://github.com/teamdigitale/dati-semantic-backend
https://github.com/teamdigitale/dati-semantic-frontend
Puoi contribuire al miglioramento del catalogo aprendo una issue in uno dei repository menzionati.
https://github.com/teamdigitale/dati-semantic-backend
https://github.com/teamdigitale/dati-semantic-frontend
Puoi contribuire al miglioramento del catalogo aprendo una issue in uno dei repository menzionati.
La consultazione del catalogo non necessita di autenticazione: chiunque voglia consultare degli asset semantici lo può fare tramite all'indirizzo schema.gov.it. Inoltre, chiunque voglia scaricare i dati in modalità machine to machine potrà usare le API REST (per quanto riguarda i vocabolari controllati) oppure lo SPARQL endpoint (per interrogare le ontologie).
Le pubbliche amministrazioni possono contribuire pubblicando asset semantici nei loro repository ufficiali. Per essere conformi con le regole di harvesting e di pubblicazione della piattaforma, le pubbliche amministrazioni che creano e pubblicano asset semantici nei loro repository devono seguire le indicazioni fornite nella sezione “Come contribuire”.
Il progetto è coordinato dal Dipartimento per la trasformazione digitale, mentre la piattaforma è gestita e mantenuta da ISTAT.
In futuro sarà costituito un comitato centrale per la governance della semantica nazionale costituito da vari enti centrali della pubblica amministrazione. Questo comitato supervisionerà i vari enti esperti di dominio nel processo di creazione e pubblicazione degli asset semantici, e garantirà la coerenza e l’integrità dei contenuti pubblicati.
Schema è un catalogo in
continua evoluzione
Se trovi errori o bug apri una issue su github.