Sign In
Cougar
Open DATAIl portale degli open data del lavoro

Introduzione:
Il Progetto

Il Ministero del Lavoro e delle Politiche Sociali rende disponibili, in formato aperto e liberamente riutilizzabili, i dati pubblicati sul sito e sul portale ClicLavoro, al fine di garantire una maggiore trasparenza nell'operato del Ministero. È stata creata una piattaforma tecnologica in grado di esporre contenuti rilevanti e di qualità, nel rispetto degli standard degli Open Data.

Questa iniziativa si inserisce in un ampio quadro di politiche internazionali, europee e nazionali di Open Government, che richiedono agli Enti pubblici di rendere disponibili i propri dati e le proprie informazioni in formato aperto e con licenze di riutilizzo, così da valorizzare il patrimonio informativo pubblico e incentivarne il riuso.

Per la sua realizzazione sono state seguite le principali linee guida, nazionali e internazionali, per la pubblicazione dei dati in formato aperto:

Per aumentare la comprensibilità dei dati pubblicati è stata creata l'ontologia di dominio ovvero una descrizione formale degli oggetti pubblicati e delle relazioni presenti tra di essi.

Open DATA e Linked Open DATA:
Cosa Sono e a Cosa Servono

Gli Open Data sono dati resi aperti e accessibili a cittadini, aziende e operatori pubblici e privati che possono essere liberamente utilizzati. Si tratta dell'insieme di dati e di informazioni che vengono resi disponibili dalla Pubblica Amministrazione che li ha prodotti, nell'ottica di un loro riutilizzo e distribuzione attraverso una grande varietà di formati.

I dati elaborabili sono pubblicati nel formato CSV, XML e nel formato RDF.

CSV (Comma-Separated Values) è un formato per la rappresentazione di dati in forma testuale, non prevede lo scambio di informazioni sulla struttura dei dati.

XML (eXtensible Markup Language) è un metalinguaggio per la condivisione di dati tra sistemi diversi; permette di scambiare informazioni strutturate.

RDF (Resource Description Framework) è lo strumento base - proposto dal World Wide Web Consortium (W3C) - per la codifica, lo scambio e il riutilizzo di metadati strutturati

I dati in forma testuale e i testi sono resi disponibili nel formato PDF (Portable Document Format).

Una delle opportunità più importanti dell'Open Data, infatti, è rappresentata dall'interoperabilità. Il valore dei dati, infatti, cresce proporzionalmente alla possibilità di effettuare correlazioni tra risorse indipendenti tra loro ma interoperabili dal punto di vista del formato, del modello dei dati e dei contenuti. I dati aperti in modalità "linked" permettono di raggiungere il massimo livello di interoperabilità tra risorse appartenenti a fonti diverse.

I LOD sfruttano le relazioni tra le entità in gioco, generando nuove informazioni e dunque accrescendo sensibilmente il valore dei dati iniziali.

Normativa

La trasparenza, intesa come accessibilità delle informazioni relative all'organizzazione e alle attività delle pubbliche amministrazioni, è strettamente connessa alla pubblicazione dei dati in suo possesso permettendo così di controllare le azioni di controllo sulle attività istituzionali e sull'utilizzo delle risorse pubbliche.

La trasparenza, come parte del rapporto dialogico tra Pubblica Amministrazione e cittadino, nasce con la Legge n. 241/1990.  Un importante passo avanti è rappresentato dal Codice dell'Amministrazione Digitale (D. Lgs. n. 82/2005) con l'introduzione di una normativa all'avanguardia per la gestione e l'accesso ai dati pubblici. Il Codice conferisce all'Agenzia per l'Italia Digitale (AgID) il compito di promuovere le politiche nazionali per la valorizzazione del patrimonio informativo pubblico e di indirizzare le amministrazioni verso un processo di produzione e rilascio dei dati pubblici, standardizzato e interoperabile su scala nazionale.

La ridefinizione del concetto di trasparenza, intesa come "accessibilità totale" è contenuta nell'art. 11 del Decreto Legislativo n. 150/2009. Qui si fa riferimento in primo luogo al rapporto fra amministrazione e cittadini, ma anche alle forme diffuse di controllo per il rispetto dei principi di buon andamento e imparzialità nella Pubblica Amministrazione.

Nel 2012, con il Decreto-Legge n. 83/2012 (Decreto Sviluppo) convertito con modificazioni della Legge n. 134/2012, il principio della trasparenza è stato esteso anche alla gestione degli incentivi alle imprese e di quegli interventi che comportano la spesa di denaro pubblico, permettendo di ottimizzare le politiche pubbliche economiche e industriali. La pubblicazione di questo tipo di dati deve avvenire con modalità tecniche e formati ispirati all'"open data" che consentano l'esportazione e la ricerca delle informazioni.

Lo stesso anno il Decreto-Legge n. 179/2012 (Decreto Crescita 2.0), convertito con modificazioni nella Legge n. 221/2012, ha stabilito per le PA l'obbligo di pubblicazione sul sito web di una sezione «Trasparenza, valutazione e merito» in cui diffondere il catalogo dei dati, delle banche dati e dei metadati in loro possesso e i regolamenti che ne disciplinano l'accesso e il riutilizzo.

L'ultimo intervento del Decreto Trasparenza (D.lgs 33/2013) riorganizza, modifica e integra la normativa in materia di obblighi di pubblicità, trasparenza e diffusione delle informazioni da parte delle PA, imponendo alcuni requisiti fondamentali per i dati. Obiettivo della norma è quello di favorire sempre più un controllo diffuso da parte del cittadino sull'operato delle istituzioni e sull'utilizzo delle risorse pubbliche.

L'Ontologia di Dominio

L'ontologia permette di rappresentare il dominio del Ministero del Lavoro e delle Politiche Sociali e definisce i concetti e le relazioni tra le classi che descrivono le risorse informative prese in esame. La rappresentazione ontologica consente, anche ai non specialisti, la comprensione della tematica trattata grazie alle descrizioni delle entità in gioco e all'esplicitazione dei legami che intercorrono tra i concetti.

Tale ontologia è pubblicata (scaricabile al seguente link)  in un formato standard (RDF/ OWL) e permette di effettuare deduzioni sui dati e di integrarli con altre fonti-dati nazionali e internazionali.

Al fine di garantire l'accesso alle risorse descritte nell'ontologia, nonché la loro integrazione e condivisione con altre risorse esterne al portale, particolare attenzione è stata posta sull'analisi degli standard e delle metodologie dell'Open Government.

In particolare l'ontologia di dominio si riferisce ai dati relativi al portale ClicLavoro; nello specifico quelli inerenti i curricula pubblicati, le offerte di lavoro e le Comunicazioni Obbligatori, con i relativi riferimenti agli standard nazionali, come ad esempio la Classificazione delle professioni definita dall'Istat o la Classificazione ATECO relativa alle attività economiche.

Standard Utilizzati

Per la realizzazione dell'ontologia del Ministero del Lavoro e delle Politiche Sociali, sono stati utilizzati:

Data Cube Vocabulary - modello per pubblicare dati multi-dimensionali, in modo da poterli collegare ad altri dati e documenti sul Web. Il modello e vocabolario Data Cube permette tali collegamenti grazie all'utilizzo dello standard W3C RDF (Resource Description Framework) e SKOS.

Dublin Core - standard di metadati per la descrizione delle risorse informative, del loro contenuto e dei processi di pubblicazione e gestione interni all'Istituto.

DCAT (Data Catalog Vocabulary) – standard di descrizione dei dataset.

SKOS (Simple Knowledge Organization System) - standard per rappresentare contenuto e struttura di tassonomie, vocabolari controllati, thesauri, classificazioni.

FOAF (Friend OF A Friend) - vocabolario per descrivere persone e organizzazioni, e le loro relazioni sul web.

SIOC (Semantically Interlinked Online Communities) - per rappresentare elementi dei social network e dei siti web.

ResumeRDF - per esprimere informazioni contenute in un curriculum vitae.

CPSV (Core Public Service Vocabulary) - per gli aspetti dei servizi delle Pubbliche amministrazioni.

ORG (Organization Ontology) - per la descrizione di strutture organizzative.

EUROVOC - thesaurus multilingue dell'Unione Europea, pluridisciplinare che raccoglie la terminologia dei settori d'attività dell'Unione europea.

Accesso ai Dati:
End Point SPARQL - Link

Su questa pagina si può interrogare il database semantico del Ministero del Lavoro e delle Politiche Sociali usando il linguaggio di interrogazione SPARQL, uno standard del World Wide Web Consortium (W3C).

Tramite questo servizio è possibile ottenere risultati nei più diffusi formati dati, come HTML (per la visualizzazione immediata), CSV e TSV (file di testo divisi da virgole o tabulatori), XML, JSON; in questo modo è possibile usare facilmente i dati con la maggior parte dei software di analisi e integrarli con le proprie applicazioni, avendo a disposizione dati standardizzati e interoperabili.

Riportiamo vari esempi che mostrano alcune tipologie di query che è possibile effettuare tramite Endpoint SPARQL.



Di seguito query SPARQL per generare dataset

Curriculum vitae per titolo di studio conseguito

Offerte di lavoro per tipologia contrattuale

Offerte di lavoro per il Comune di Milano

Qualifiche professionali maggiormente ricercate tra i curriculum vitae del portale cliclavoro

Curriculum vitae per livello di diffusione territoriale.

Rapporti di lavoro cessati per anno e motivo di cessazione