Cosa sono i linked data?
I linked data sono un metodo per pubblicare i dati strutturati usando vocabolari come schema.org che possono essere collegati tra loro e interpretati dalle macchine.
Grazie all’uso dei linked data, affermazioni codificate in triple possono essere condivise su diversi siti web. Per esempio, sul sito web A possiamo presentare l’entità Jason e affermare che conosce Marie; sul sito B possiamo introdurre tutte le informazioni su Marie, mentre sul sito C possiamo trovare le informazioni che riguardando il Paese dov’è nata Marie.
Ciascuna pagina contiene i dati strutturati che la descrivono ed è collegata a entità che possono essere descritte anche nel contesto di altri siti web.
Nel 2006, Tim Berners Lee ha descritto i linked data in questa maniera.
Il web semantico non riguarda solo la pubblicazione di dati sul web. Si tratta di fare collegamenti in modo tale che le persone e le macchine possano esplorare il web dei dati. Con i linked data, le relazioni tra i dati ti permettono di scoprire altri dati correlati.
In informatica, il concetto di linked data descrive un metodo di pubblicazione e collegamento dei dati che provengono da diverse fonti che possono essere interconnesse e condivise.
I Linked Data si basano su tecnologie standard del web come il protocollo HTTP e gli URI, ma anziché usarle per permettere ai lettori di accedere alle pagine web, le estende in modo tale da condividere le informazioni anche con i computer che possono così leggere automaticamente le informazioni contenute. In questo modo, diventa possibile collegare e i dati provenienti da diverse fonti e ricavarne ulteriori informazioni.
Le ricerche sui linked data si realizzano grazie a un linguaggio di query semantiche conosciuto come SPARQL che ci permette di ritrovare e manipolare i dati raccolti all’interno del formato RDF (Resource Description Framework).
I Linked Data in parole semplici
Ecco un ottimo video di @manusporny che ci introduce il concetto di di Linked Data, il Google Knowledge Graph e il protocollo Facebook Open Graph.
Perché è importante pubblicare 5-stars Linked Data?
Ci sono quattro semplici principi da rispettare quando si pubblicano dati sul web (proprio così, i linked data sono al tempo stesso open data, in quanto sono pienamente accessibili).
- Usare URI per nominare le cose (si tratta dell’identificativo unico che abbiamo introdotto sopra)
- Usare URI HTTP in modo che le persone possano avervi accesso (in altre parole, l’ID di ciascuna entità deve essere accessibile attraverso una URI HTTP)
- Guardando una URI è possibile ottenere informazioni utili che seguono standard precisi. Dietro questi URI dobbiamo pubblicare i dati usando uno standard di linked data conosciuto come RDF.
- Includere i link verso altri URI, in modo che sia possibile scoprire nuove informazioni (ecco perché dobbiamo aggiungere la proprietà owl:sameAs).
Semplificando, un dataset aperto a 5 stelle è semplicemente un modo per pubblicare i metadati (usando lo standard dei linked data) che li rende accessibili e comprensibili per le macchine.
Ecco per quale motivo collegando un testo, scritto da una persona, con un dataset aperto creato da una macchina, i nostri contenuti diventano completamente accessibili e a prova di macchina.
Alcuni dei principali dataset che implementano la tecnologia dei 5-stars linked data sono fondamentali per gli algoritmi di machine learning dietro motori di ricerca semantici come Google e Bing e per gli assistenti personali come Alexa, Cortana e il Google Assistant.
Questi dataset (come DBpedia, Wikidata, Geonames giusto per menzionarne alcuni) sono tutti collegati tra loro e rappresentano il Cloud dei Linked Open Data.
Quando aggiungi i dati strutturati al tuo sito web per WordPress usando un plugin come WordLift, quei dati strutturati sono pubblicati come open linked data. In altre parole, il tuo sito web e i metadati collegati ai tuoi contenuti entrano a far parte del Linked Open Data Cloud.
Quindi, aggiungendo un ulteriore livello al web semantico, il tuo sito web ne entra a far parte.