giovedì 17 luglio 2014

Ancora "more openess" su RomaLabor

Come già preannunciato nel post precedente, ora su RomaLabor è presente un file xml che rappresenta l'alberatura degli opendata pubblicati del portale. Tale file mostra in dettaglio tutte le categorie e tutti i vari dati in esse presenti, e per ciascun file viene specificato il percorso completo e il link diretto per il download.

L'albero degli opendata può essere scaricato direttamente da questo indirizzo:
http://85.18.173.40/aspnet_dati/elencodataset.xml

Inoltre, tra i Servizi on line del portale

http://romalabor.provincia.roma.it/RomaLabor/it/dettagli.page?contentId=PAG1215

abbiamo inserito uno strumento di analisi degli avviamenti al lavoro avvenuti nel primo semestre 2014.
Attraverso questo servizio on line è possibile calcolare, in maniera interattiva, le 10 qualifiche più utilizzate nel periodo preso in considerazione, ed è quindi un utile strumento per decifrare cosa effettivamente richiede il mercato del lavoro, con l'ulteriore possibilità di analizzare solo determinati territori, o determinate fasce d'età, o solo i contratti a tempo indeterminato.

La peculiarità di tale servizio, è che tutti i dati estratti possono essere scaricati in formato open, scegliendo come al solito tra xml, csv, csv "italiano", tsv e json.

Insomma, abbiamo ritenuto che, per essere veramente utile, lo strumento dovesse necessariamente coniugare l'analisi interattiva con i formati aperti, rendendo così un servizio semplice, utile e di più facile decifrazione.

sabato 12 luglio 2014

I formati di pubblicazione - Aumentare la readability

I dati aperti relativi ai settori formazione e lavoro della Provincia di Roma, pubblicati su RomaLabor alla pagina

http://romalabor.provincia.roma.it/RomaLabor/it/dettagli.page?contentId=PAG1169

sono stati inizialmente forniti in 4 formati: xml, tsv, csv e csv leggibile da Excel italiano. Tale scelta ha ricalcato quella del portale opendata.provincia.roma.it, e si basa su valutazioni che io stesso stabilii nel 2012.

Per rendere però maggiormente fruibili i dati, abbiamo stabilito di aggiungere, per ogni dataset, una ulteriore pubblicazione in formato json, nonchè di fornire un file xml per descrivere la struttura di ciascuna tipologia di dato pubblicato.
Tale aggiornamento è stato appena completato. Pertanto già da ora gli utenti trovano, per ciascun dataset, 6 file differenti. Lo scopo è ovviamente quello di consentire un accesso ai dati che sia il più facile e il più chiaro possibile, nonchè quello di aumentare la "machine readability" di quanto pubblicato.

Un ulteriore sviluppo che stiamo portando avanti è quello di fornire un file xml contenente l'indice dei dati pubblicati. L'obiettivo è quello di creare una "directory tree" di tutti i dataset, che consenta una visione d'insieme delle informazioni presenti e che permetta un download diretto oppure, ove possibile, una anteprima del dato.
In tale file verranno fornite anche una serie di indicazioni ausiliari, quali ad esempio la data di creazione del dataset o il significato specifico del fileset stesso.

Contiamo di presentare questo file indice entro la prossima settimana, insieme ad uno strumento di analisi interattiva dei dati degli avviamenti al lavoro che consentirà l'esportazione automatica dei risultati in formato open.