Linked Data

Cosa sono i linked data?

I linked data sono un metodo per pubblicare i dati strutturati usando vocabolari come schema.org che possono essere collegati tra loro e interpretati dalle macchine.

Grazie all’uso dei linked data, affermazioni codificate in triple possono essere condivise su diversi siti web. Per esempio, sul sito web A possiamo presentare l’entità Jason e affermare che conosce Marie; sul sito B possiamo introdurre tutte le informazioni su Marie, mentre sul sito C possiamo trovare le informazioni che riguardando il Paese dov’è nata Marie.

Linked Open Data

Ciascuna pagina contiene i dati strutturati che la descrivono ed è collegata a entità che possono essere descritte anche nel contesto di altri siti web.

Nel 2006, Tim Berners Lee ha descritto i linked data in questa maniera.

Il web semantico non riguarda solo la pubblicazione di dati sul web. Si tratta di fare collegamenti in modo tale che le persone e le macchine possano esplorare il web dei dati. Con i linked data, le relazioni tra i dati ti permettono di scoprire altri dati correlati.

In informatica, il concetto di linked data descrive un metodo di pubblicazione e collegamento dei dati che provengono da diverse fonti che possono essere interconnesse e condivise.

I Linked Data si basano su tecnologie standard del web come il protocollo HTTP e gli URI, ma anziché usarle per permettere ai lettori di accedere alle pagine web, le estende in modo tale da condividere le informazioni anche con i computer che possono così leggere automaticamente le informazioni contenute. In questo modo, diventa possibile collegare e i dati provenienti da diverse fonti e ricavarne ulteriori informazioni.

Le ricerche sui linked data si realizzano grazie a un linguaggio di query semantiche conosciuto come SPARQL che ci permette di ritrovare e manipolare i dati raccolti all’interno del formato RDF (Resource Description Framework).

I Linked Data in parole semplici

Ecco un ottimo video di @manusporny che ci introduce il concetto di di Linked Data, il Google Knowledge Graph e il protocollo Facebook Open Graph. 

Perché è importante pubblicare 5-stars Linked Data?

Ci sono quattro semplici principi da rispettare quando si pubblicano dati sul web (proprio così, i linked data sono al tempo stesso open data, in quanto sono pienamente accessibili).

  1. Usare URI per nominare le cose (si tratta dell’identificativo unico che abbiamo introdotto sopra)
  2. Usare URI HTTP in modo che le persone possano avervi accesso (in altre parole, l’ID di ciascuna entità deve essere accessibile attraverso una URI HTTP)
  3. Guardando una URI è possibile ottenere informazioni utili che seguono standard precisi. Dietro questi URI dobbiamo pubblicare i dati usando uno standard di linked data conosciuto come RDF.
  4. Includere i link verso altri URI, in modo che sia possibile scoprire nuove informazioni (ecco perché dobbiamo aggiungere la proprietà owl:sameAs).

Semplificando, un dataset aperto a 5 stelle è semplicemente un modo per pubblicare i metadati (usando lo standard dei linked data) che li rende accessibili e comprensibili per le macchine.

Ecco per quale motivo collegando un testo, scritto da una persona, con un dataset aperto creato da una macchina, i nostri contenuti diventano completamente accessibili e a prova di macchina.

Alcuni dei principali dataset che implementano la tecnologia dei 5-stars linked data sono fondamentali per gli algoritmi di machine learning dietro motori di ricerca semantici come Google e Bing e per gli assistenti personali come Alexa, Cortana e il Google Assistant.

Questi dataset (come DBpedia, Wikidata, Geonames giusto per menzionarne alcuni) sono tutti collegati tra loro e rappresentano il Cloud dei Linked Open Data.

LOD Cloud

Quando aggiungi i dati strutturati al tuo sito web per WordPress usando un plugin come WordLift, quei dati strutturati sono pubblicati come open linked data. In altre parole, il tuo sito web e i metadati collegati ai tuoi contenuti entrano a far parte del Linked Open Data Cloud.

Quindi, aggiungendo un ulteriore livello al web semantico, il tuo sito web ne entra a far parte.