Sign In
Cougar
Open DATAIl portale degli open data del lavoro

Introduzione:
Il Progetto

Il Ministero del Lavoro e delle Politiche Sociali rende disponibili, in formato aperto e liberamente riutilizzabili, i dati pubblicati sul sito e sul portale ClicLavoro, al fine di garantire una maggiore trasparenza nell'operato del Ministero. È stata creata una piattaforma tecnologica in grado di esporre contenuti rilevanti e di qualità, nel rispetto degli standard degli Open Data.

Questa iniziativa si inserisce in un ampio quadro di politiche internazionali, europee e nazionali di Open Government, volte a creare strumenti e tecnologie che consentano alle amministrazioni di porsi in maniera "aperta" e "trasparente" nei confronti dei cittadini. Il fine è quello di favorire un controllo pubblico sull'operato delle pubbliche amministrazioni.

Nella realizzazione del progetto Open Data il Ministero ha seguito le principali linee guida, nazionali e internazionali, per la pubblicazione dei dati in formato aperto:

Per garantire la comprensione dei dati pubblicati, il Ministero del Lavoro e delle Politiche Sociali rende disponibile l'ontologia disegnata ad hoc per i dati del portale ClicLavoro. L'ontologia è uno strumento per rappresentare la conoscenza, ossia una descrizione formale dei concetti e delle relazioni presenti tra di essi.

Open DATA e Linked Open DATA:
Cosa Sono e a Cosa Servono

L'Open Data è, secondo la definizione dell'Open Knowledge Foundation, "un dato che può essere liberamente acceduto, utilizzato, modificato e condiviso da chiunque e per qualunque scopo". Si tratta quindi dell'insieme di dati e di informazioni che vengono resi disponibili dalla Pubblica Amministrazione che li ha prodotti, senza restrizioni di copyright, brevetti o altre forme di controllo che ne limitino la riproduzione.

In quest'ottica i dati devono essere disponibili in un formato utile e modificabile. Esistono diverse tipologie di dati che rientrano nel formato di esposizione Open Data, classificati in relazione alla loro capacità di essere riutilizzati:

  • Esposizione dei dati in qualsiasi formato, anche solo human readable (PDF, TXT)
  • Esposizione dei dati in formati strutturati (es. XLS)
  • Esposizione dei dati in formati strutturati e non proprietari (es. CSV e XML)
  • Esposizione dei dati in formati strutturati, usando URI per denotare entità nei dati (es. RDF)
  • Esposizione dei dati in formati strutturati, usando URI per denotare entità e creando link ad altre risorse sul web per connotare e ampliare il contenuto dei dati (es. OWL).

Il livello più alto di apertura dei dati è rappresentato dai Linked Open Data (RDF/OWL), dati aperti che permettono di raggiungere il massimo livello di interoperabilità tra risorse appartenenti a fonti diverse, generando nuove informazioni e dunque accrescendo sensibilmente il valore dei dati iniziali. Il valore dei dati, infatti, cresce proporzionalmente alla possibilità di effettuare correlazioni tra risorse indipendenti tra loro ma interoperabili dal punto di vista del formato, del modello dei dati e dei contenuti.

I Linked Open Data permettono di mappare qualsiasi concetto in un modello informativo esprimendosi secondo un semplice schema la cui unità di base è la tripletta "soggetto-predicato-oggetto" che richiama al modo di rappresentare il mondo esterno tipico della mente umana.

I dati del Ministero del Lavoro e delle Politiche Sociali sono stati elaborabili e pubblicati nei formati CSV, TSV, XML, HTML, JSONRDF/OWL.

Normativa

La trasparenza, intesa come accessibilità delle informazioni relative all'organizzazione e alle attività delle pubbliche amministrazioni con lo scopo di favorire azioni di controllo sulle attività istituzionali e sull'utilizzo delle risorse pubbliche, è strettamente connessa alla pubblicazione dei dati in suo possesso.

La trasparenza, e più in generale la regolamentazione del rapporto dialogico tra Pubblica Amministrazione e cittadino, nasce con la Legge n. 241/1990.

Con il Codice dell'Amministrazione Digitale (D. Lgs. n. 82/2005) l'Italia si è dotata di una normativa all'avanguardia relativamente alle modalità di gestione e accesso ai dati pubblici, conferendo nuovi significati al concetto di trasparenza. La normativa conferisce all'AgID (Agenzia per l'Italia Digitale) il compito di promuovere le politiche nazionali per la valorizzazione del patrimonio informativo pubblico e di indirizzare le amministrazioni verso un processo di produzione e rilascio dei dati pubblici standardizzato e interoperabile su scala nazionale.

L'art. 11 del Decreto Legislativo n. 150/2009 ridefinisce il concetto di trasparenza, intesa come "accessibilità totale", che fa riferimento in primo luogo al rapporto fra amministrazione e cittadini, ma che ha anche come scopo quello di favorire forme diffuse di controllo.

Il Decreto-Legge n. 83/2012 (Decreto Sviluppo) con modificazioni della Legge n. 134/2012 mira a garantire la trasparenza della gestione degli incentivi alle imprese e di quegli interventi che comportano la spesa di denaro pubblico, anche al fine di ottimizzare le politiche pubbliche economiche e industriali per la crescita produttiva. A tal proposito la pubblicazione dei dati deve avvenire con modalità tecniche e formati ispirati all'"open data" che consentano l'esportazione e la ricerca delle informazioni.

Il Decreto-Legge n. 179/2012 (Decreto Crescita 2.0) convertito con modificazioni nella Legge n. 221/2012, stabilisce per le PA l'obbligo di pubblicazione sul sito web una sezione «Trasparenza, valutazione e merito» in cui pubblicare il catalogo dei dati, delle banche dati e dei metadati in loro possesso e i regolamenti che ne disciplinano l'accesso e il riutilizzo.

Il D.lgs 33/2013 (Decreto Trasparenza) riorganizza, modifica e integra la normativa in materia di obblighi di pubblicità, trasparenza e diffusione delle informazioni da parte delle PA, imponendo requisiti fondamentali per i dati sulla trasparenza. Obiettivo della norma è quello di favorire un controllo diffuso da parte del cittadino sull'operato delle istituzioni e sull'utilizzo delle risorse pubbliche.

L'Ontologia di Dominio

Un'ontologia è una descrizione delle entità presenti in un sistema e delle loro relazioni; non è quindi un semplice vocabolario di termini, ma una rete di relazioni tra entità definite.

L'ontologia realizzata per il Ministero del Lavoro e delle Politiche Sociali è quindi una rappresentazione che permette di descrivere il contenuto del portale ClicLavoro definendo i concetti e le relazioni tra le classi che descrivono le risorse informative oggetto dell'intervento.

Tra i dati relativi al portale ClicLavoro, l'ontologia è relativa, in particolare, a quelli inerenti i curricula pubblicati, le offerte di lavoro e le Comunicazioni Obbligatori, con i relativi riferimenti agli standard nazionali, come ad esempio la Classificazione delle professioni definita dall'Istat o la Classificazione ATECO relativa alle attività economiche, che per la prima volta vengono qui rappresentati in linguaggio RDF/OWL.

La rappresentazione ontologica consente, anche ai non specialisti, la comprensione della tematica trattata grazie alle descrizioni delle entità in gioco e all'esplicitazione dei legami che intercorrono tra i concetti.

L'ontologia che il Ministero del Lavoro e delle Politiche Sociali rende disponibile (scaricabile al seguente link) è pubblicata  in un formato standard (RDF/ OWL) e permette di effettuare deduzioni sui dati e di integrarli con altre fonti-dati nazionali e internazionali.

Standard Utilizzati

Per la realizzazione dell'ontologia del Ministero del Lavoro e delle Politiche Sociali, sono stati utilizzati:

Data Cube Vocabulary - modello per pubblicare dati multi-dimensionali, in modo da poterli collegare ad altri dati e documenti sul Web. Il modello e vocabolario Data Cube permette tali collegamenti grazie all'utilizzo dello standard W3C RDF (Resource Description Framework) e SKOS.

Dublin Core - standard di metadati per la descrizione delle risorse informative, del loro contenuto e dei processi di pubblicazione e gestione interni all'Istituto.

DCAT (Data Catalog Vocabulary) – standard di descrizione dei dataset.

SKOS (Simple Knowledge Organization System) - standard per rappresentare contenuto e struttura di tassonomie, vocabolari controllati, thesauri, classificazioni.

FOAF (Friend OF A Friend) - vocabolario per descrivere persone e organizzazioni, e le loro relazioni sul web.

SIOC (Semantically Interlinked Online Communities) - per rappresentare elementi dei social network e dei siti web.

ResumeRDF - per esprimere informazioni contenute in un curriculum vitae.

CPSV (Core Public Service Vocabulary) - per gli aspetti dei servizi delle Pubbliche amministrazioni.

ORG (Organization Ontology) - per la descrizione di strutture organizzative.

EUROVOC - thesaurus multilingue dell'Unione Europea, pluridisciplinare che raccoglie la terminologia dei settori d'attività dell'Unione europea.

Accesso ai Dati:
End Point SPARQL - Link

È possibile interrogare il database semantico del Ministero del Lavoro e delle Politiche Sociali tramite endpoint SPARQL, linguaggio standard del W3C di interrogazione dati in RDF (Resource Description Framework) e OWL (Ontology Web Language).

L'endpoint è il "punto di pubblicazione", e permette la possibilità di definire sia delle query personalizzate che utilizzare percorsi guidati di ricerca. Nell'interfaccia web in questa sezione sono disponibili infatti una serie di query predefinite. L'endpoint SPARQL restituisce i dati richiesti in diversi formati: CSV, HTML XML, JSON, TSV. Questo permette di utilizzare i dati a più livelli, a seconda delle necessità degli utenti.



Di seguito query SPARQL per generare dataset

Curriculum vitae per titolo di studio conseguito

Offerte di lavoro per tipologia contrattuale

Offerte di lavoro per il Comune di Milano

Qualifiche professionali maggiormente ricercate tra i curriculum vitae del portale cliclavoro

Curriculum vitae per livello di diffusione territoriale.

Rapporti di lavoro cessati per anno e motivo di cessazione