g

Pubblicato da Gennaro Cuofano 3 anni fa

Secondo statcounter, Google in Italia è il motore di ricerca più utilizzato con una market share del 94,37%. Questo non dovrebbe sorprenderti visto che Google sembra essere il più intelligente dei motori di ricerca. Infatti, già da qualche anno al Googleplex (il quartier generale di Google) gli esperimenti con l’intelligenza artificiale hanno portato a risultati eccezionali. Questi risultati non influiscono solo su Google.com ma anche su Google.it.

Ehi! Questa guida è molto lunga, ti avverto

Se ora vai di corsa, possiamo mandartela via email, così potrai leggerla con calma quando avrai un po’ di tempo. Ok? Compila il form qui sotto e il gioco è fatto. ?

Partiamo da un esempio banale, ma comunque significativo, per capire quanto sia intelligente il nostro amico californiano. Se digito nella barra di ricerca di Google ‘Presidente della Repubblica Italiana’, ecco cosa ottengo:

Sergio Mattarella - Google AI

A questo punto mi dirai, cosa c’è di speciale in questa risposta?

A pensarci bene, Google sta facendo un matching di una parola chiave ‘Presidente della Repubblica Italiana’ (che in gergo tecnico viene definita long-tail keyword) con quanto c’è di corrispondente nel suo indice.

Voglio farti vedere uno step aggiuntivo che ti lascerà di stucco. Se scrivo nella barra di ricerca ‘chi è il Capo di Stato Italiano?’ ecco cosa ottengo:

Sergio Mattarella - Google AI

Per mettere alla prova Google voglio fargli un’altra domanda un pò più ambigua, ‘chi è il Presidente della Repubblica?’ senza specificare di quale Repubblica si sta parlando ed ecco cosa ottengo:

Sergio Mattarella e l'intelligenza artificiale di Google

Cosa voglio dimostrare con questo? Il punto centrale è che Google impara attraverso concetti che desume dal contesto della ricerca effettuata da un utente.

Ad esempio, se digito nella casella di ricerca ‘pizza Margherita’, potrei cercare qualcosa da mangiare o solo la storia dietro quel cibo. Certo, se faccio questa ricerca alle otto del mattino, probabilmente sono più interessato a imparare la storia della pizza Margherita. Se faccio la stessa ricerca alle otto di sera, forse ho davvero fame, quindi Google può finalmente mostrare dei ristoranti in zona.

Ma come fa il motore di ricerca a sapere qual è il contesto? In realtà il motore di ricerca legge i metadati, che stanno alla base della SEO semantica.

Quindi, prima di capire come funziona la SEO semantica, cerchiamo di capire perché è importante.

Perché la SEO semantica è fondamentale per la tua attività online?

Per passare ad esempi pratici, pensa alla parola ‘calcio’, cosa ti viene in mente?

Se sei un fanatico di sport forse penserai ad una squadra di calcio. Ma potrebbe essere anche un’azione. O perché no, anche il minerale che rende le tue ossa così forti. Come fai a capire di cosa si sta parlando?

Fortunatamente per noi esseri umani la capacità di disambiguare è così automatica che è nella maggior parte dei casi subconscia. Come riesce, invece, un motore di ricerca (pensa a Google) a capire di cosa stai parlando? Il contesto può essere creato nel linguaggio scritto da parole che connotano una situazione concreta. Infatti, se parlo di ‘calcio di rigore’, non c’è alcun dubbio. Si sta parlando di sport.

Ma se noi umani siamo in grado di dedurre ed estrarre il contesto grazie a termini chiave, come può un motore di ricerca fare lo stesso? La risposta risiede nella SEO semantica.

Si tratta di una strategia di marketing digitale che permette a un sito web di “essere tradotto” in dati che il motore di ricerca può leggere, interpretare e manipolare in modo da comprendere liberamente di cosa si sta parlando. Facciamo qualche passetto indietro.

Visto che la tecnologia è un artefatto storico, ha senso approfondire la storia dei motori di ricerca per capire come e perché si sono evoluti nel modo in cui li conosciamo oggi.

Tutto comincia nel lontano 2009

Nel febbraio 2009 il padre fondatore del web, Sir Tim Berners-Lee, sul palco di un TED talk a Long Beach, in California, incalzava il pubblico parlando della formazione di un nuovo web, costruito sulle fondamenta del vecchio. Un web semantico basato su dati aperti. Guardalo, ne vale davvero la pena. Infatti, questo TED è diventato il manifesto del web semantico:

 

Il vecchio web

Dagli anni novanta ad oggi nessuno avrebbe potuto prevedere il successo del web (anche se oggi lo diamo per scontato). Oggi oltre un miliardo di siti rende il web una rete inestricabile di contenuti. In meno di vent’anni, il numero di siti web è cresciuto esponenzialmente.

Solo venti anni or sono il web, allora ancora allo stato embrionale, comprendeva milioni di pagine. Tim Berners-Lee aveva intuito che poteva connettere quelle pagine con quello che oggi tutti conosciamo come ipertesto.

Tuttavia, navigare sul web era ancora limitato perché si poteva passare da una pagina all’altra attraverso i link. Quindi, lo sforzo necessario per trovare quello che cercavi era enorme. All’epoca immaginare che un motore di ricerca, come Google, che potesse rispondere alle tue domande era pura fantascienza.

Per questo motivo molte menti brillanti si sono avventurate per cercare un modo più intuitivo di trovare pagine web che contenessero risposte alle nostre domande. Finalmente, nel 1998, due ragazzi di Stanford creano un algoritmo, chiamato PageRank.

L’algoritmo si basava sul meccanismo di citazione usato dagli accademici nelle loro ricerche. Infatti, nel mondo dell’accademia citare un documento è un po’ come conferire un voto relativo all’autorevolezza del documento stesso. Infatti, PageRank sostituiva alle citazioni i link. Quei collegamenti ipertestuali da un testo ad un altro funzionavano come un voto positivo che andava ad aumentare il punteggio del sito ricevente. Quello che oggi tutti nel mondo SEO conoscono come backlink.

Così nacque Google.

In breve, maggiore è la qualità dei backlink ricevuti da un sito Web, maggiore è la possibilità di ottenere un punteggio più elevato nella SERP (i risultati di ricerca di Google). I backlink sono ancora la spina dorsale del web; ciò che lo tiene unito. Tuttavia, su quella spina dorsale è sbocciato un nuovo web.

Il nuovo web

Nel 2012, il futurista Ray Kurzweil è arrivato a Google, con una missione: far capire al motore di ricerca il linguaggio umano. A questo scopo nel 2013 Google ha aggiornato il suo algoritmo introducendo l’analisi del linguaggio naturale con Hummingbird e dando un’ulteriore spinta in questa direzione, nel 2015, con l’intelligenza artificiale di RankBrain.

In breve, la semantica è diventata un fattore chiave per la ricerca. È stata una rivoluzione!

Infatti, tra gli oltre 200 fattori che Google esamina per valutare il posizionamento di una pagina, c’è anche l’Intelligenza Artificiale, usata per classificare e comprendere meglio le ricerche degli utenti e trovare il contenuto corrispondente all’interno di una pagina web.

Questo vuol dire che lato utente Google ha messo in campo risorse enormi per rendere la ricerca sempre più potente. L’algoritmo di Google è sempre più bravo a leggere ciò che c’è dietro una ricerca. Di carpire l’intento dell’utente.

L’analisi fatta finora prende in considerazione i risultati di ricerca. Dall’altro lato, come può fare un creatore di contenuti, web manager, SEO expert o chiunque scriva sul web a fare in modo che i propri contenuti siano facilmente interpretati dal motore di ricerca?

La risposta è in quella che nel contesto del web semantico viene definita entità. Le entità sono organizzate in grafi della conoscenza che lo stesso Google fin dal 16 maggio 2012 utilizza per classificare parte della propria knowledge base. Sei confuso da tutti questi termini nuovi? Entità, knowledge graph e metadati sono alla base del web semantico.

Alla fine di questa lettura avrai ben chiaro in mente cosa sono, a cosa servono e perchè sono fondamentali per far parte della rivoluzione che sta avvenendo oggi sul web!

Cos’è un’entità?

Secondo Wikipedia:

Rappresentano classi di oggetti (fatti, cose, persone, …) che hanno proprietà comuni ed esistenza autonoma ai fini dell’applicazione di interesse. Un’occorrenza di un’entità è un oggetto o istanza della classe che l’entità rappresenta. Non si parla qui del valore che identifica l’oggetto ma dell’oggetto stesso. Un’interessante conseguenza di questo fatto è che una occorrenza di entità ha un’esistenza indipendente dalle proprietà ad essa associate. In questo, il modello E-R presenta una marcata differenza rispetto al modello relazionale nel quale non possiamo rappresentare un oggetto senza conoscere alcune sue proprietà.

Nel Web semantico un’entità è l’oggetto descritto in un documento. Grazie ad essa permetti ai computer a capire tutto ciò che sai circa una persona, un’organizzazione o un luogo menzionato in un documento.

Tutti questi fatti sono organizzati in dichiarazioni – note come triple – che sono espresse sotto forma di soggetto, predicato e complemento oggetto (ad esempio: Io sono Gennaro, Gennaro conosce Andrea).

Perché le entità sono più efficaci delle parole chiave?

Per tre semplici motivi. Le entità sono:

  • collegate
  • disambiguate
  • contestuali

Attraverso le entità si creano relazioni significative che possono essere lette, comprese e interpretate dai motori di ricerca. Questo è ciò che la  SEO semantica ti permette di ottenere. Le entità, nel contesto del Web Semantico, sono in realtà dati che i computer possono usare per analizzare e interpretare il linguaggio umano. Ma se le entità sono oggetti o cose definite, indipendentemente dal contesto, come fanno ad acquisire un contesto?

Servono metadati!

Metadati: dati che descrivono dati

Nella sua definizione più semplice, un metadato è un dato che descrive un altro dato. Il concetto di metadati non è nuovo. Infatti, i bibliotecari li usano da molto tempo per gestire e trovare documenti. Immagina di aver avuto la premura di classificare ogni documento che possiedi in base all’autore, alla data di pubblicazione, alla lunghezza e così via. Questa classificazione ti permette di ritrovare documento più facilmente.

Per funzionare in modo appropriato, i metadati devono seguire una logica di classificazione che tutti comprendono. In breve, ci deve essere un insieme di regole, uno standard che tutti possono seguire per far funzionare il sistema. Come in una grammatica, in cui le regole grammaticali sono si sono evolute fino a creare un linguaggio standard.

Le ontologie stanno alla base dei metadati. La forma più semplice di ontologia è un vocabolario. Il vocabolario che rende possibile la SEO semantica è chiamato schema.org. Schema.org

Schema Markup: il Gold Standard del web semantico

In pratica, il pilastro del web semantico è un vocabolario aperto e condiviso, guidato da una comunità open source e utilizzabile insieme ad altri vocabolari e ontologie. Come nella lingua, dove la mancanza di regole grammaticali standard rende difficile se non impossibile comunicare, allo stesso modo il web semantico non sarebbe qui senza un gold standard.

Un insieme di regole riconosciute collettivamente che rendano solide le fondamenta di questo nuovo web. Ebbene, Schema.org è il gold standard del web semantico. In effetti, tra tutti gli standard concorrenti, Schema.org è stato il primo vocabolario open linked data introdotto per uno scopo commerciale (aiutare i motori di ricerca commerciali, come Google, a organizzare il web e a migliorare la qualità dei risultati).

Oggi nel mondo ci sono 617 vocabolari open a livello globale. Questi vocabolari possono essere combinati per organizzare e strutturare diversi domini della conoscenza. Vocabolari nel LOD Schema è il vocabolario che ha prevalso sugli altri perché si è dimostrato più efficace (o potremmo dire che l’adozione di schema.org da parte dei maggiori motori di ricerca al mondo, ha aumentato l’efficacia dello stesso – un po’ come il problema dell’uovo e della gallina).

Aggiungendo lo schema markup o marcatura schema alle pagine web, il contenuto si trasforma in una serie di dati connessi che aprono un universo di possibilità!

Che cosa sono i dati strutturati?

I dati strutturati sono un formato standardizzato che permette di fornire informazioni relative a una pagina web in modo che  i contenuti siano classificati e diventino comprensibili per i motori di ricerca.

Ad esempio, se stai pubblicando la ricetta delle ‘Arancine siciliane’, dovrai specificare gli ingredienti, i tempi di preparazione, il tipo di cucina. In breve, dovrai spiegare al motore di ricerca che la ricetta è composta da un kg. di riso, 2,5 litri d’acqua, 100 grammi di burro e così via. Tramite i dati strutturati puoi dare spazio a queste informazioni e renderle finalmente intellegibili per  al motore di ricerca.

Oggi schema.org può essere incorporato nelle pagine web utilizzando tre formati:

  • JSON-LD
  • Microdata
  • RDFa

Immagina un libro supportato in tre formati diversi: ebook, brossura e copertina rigida. Ognuno ha diversi pesi, dimensioni e così via. Allo stesso modo, schema.org può essere implementato attraverso i tre formati elencati sopra.

Sebbene non ci sia un formato migliore,JSON-LD è il formato preferito da Google. Infatti, si tratta di un JavaScript incorporato in un tag nell’head o nel body della pagina web. Il codice racchiude informazioni utili e contestuali riguardanti l’articolo, comunicate attraverso lo standard dei linked data.

I Linked Open Data vengono espressi in JSON-LD seguendo la struttura di semplici triple. A questo punto ti sarai chiesto, “perché JSON-LD e non altri formati?

Perché JSON-LD è il formato da utilizzare per i dati strutturati?

I vantaggi dell’utilizzo di JSON-LD sono i seguenti:

    • Non influisce sulle prestazioni della pagina web o sito perché viene caricata in modo asincrono
    • Viene iniettato nella pagina senza influire sulla struttura e sui tag HTML esistenti
    • È facile da utilizzare per gli sviluppatori web perché segue la sintassi JSON
    • Sfrutta i linked data

Quest’ultimo è anche il motivo per cui Google incentiva i proprietari di siti web a utilizzare i dati strutturati su una pagina Web sotto forma di JSON-LD. Questo formato consente alle entità, quindi a nomi e concetti di essere collegati.

Tuttavia, tali informazioni possono ancora essere ambigue. Ad esempio, immaginiamo il caso in cui stiamo parlando di Ligabue. Non il cantante, ma il pittore italiano del primo Novecento. Ancora una volta, i linked data saranno in grado di dire al motore di ricerca di quale Ligabue si sta parlando grazie al contesto creato dai dati stessi.

Perché i linked data sono così importanti?

Ricapitolando quanto detto fin’ora, schema.org è il vocabolario utilizzato per aiutare un motore di ricerca a comprendere il contenuto delle pagine web. I linked data sono un metodo per pubblicare dati strutturati usando vocabolari come Schema. Questi vocabolari possono essere collegati tra loro e quindi interpretati dalle macchine.

Utilizzando i linked data, le informazioni codificate in triple possono essere distribuite su diversi siti web. Sul sito A possiamo mostrare che l’entità Andrea (persona) conosce Francesco (persona) che è stato descritto sul sito B.

In questo modo i dati presenti su due siti diversi diventano interconnessi.

Plugin semantici come WordLift possono collegare un’entità con un’altra in maniera automatica, leggendo i metadati contenuti in pagina. Ma come puoi assicurarti che il motore di ricerca comprenda queste pagine in maniera inequivocabile?

Ci sono due modi:

    • implicitamente, il motore di ricerca potrebbe capire che su un sito web siamo più propensi a parlare di Ligabue pittore perchè è il contesto stesso, descritto tramite l’infrastruttura di metadati a segnalarlo a Google (tramite vettori che con un certo grado di probabilità segnalano quale sia il significato corretto da attribuire)
    • esplicitamente:

a) leggendo un attributo di dati collegato chiamato @id (un identificativo univoco per l’entità che potrebbe essere già noto al motore di ricerca) o

b) leggendo qualsiasi link sameAs per l’entità che punta a un set di dati noto. Lo scopo di questi collegamenti è di dire alla macchina che l’entità è equivalente a un’altra entità in un’enciclopedia aperta come Wikipedia o direttamente nel Google Knowledge Graph.

Come posso collegare le entità l’una con l’altra?

Schema.org, definisce la proprietà sameAs in questo modo:

La URL di una pagina Web di riferimento che indica in modo inequivocabile l’identità dell’oggetto. Ad esempio, la URL della pagina Wikipedia dello stesso oggetto, la voce di Wikidata o il sito web ufficiale.

È come dire al motore di ricerca: “questa è la stessa cosa che trovi anche a questo indirizzo”. Oggi questa proprietà è poco usata sul web: si stima che sia presente su un numero di domini compreso tra 10.000 e 50.000. Ecco il motivo per cui usandola puoi davvero differenziare la tua strategia SEO rispetto alla concorrenza.

Tuttavia, la proprietà sameAs non basta se vuoi poter eseguire delle query sui dati che pubblichi (o se, magari, vuoi condividere i dati con altri dataset).

Arrivati questo punto, bisogna fare un passo in più. Questo passo consiste nella pubblicazione dei dati seguendo lo schema dei 5 stars linked open data introdotto da Berners-Lee, che richiede il collegamento di ciascun dato con altri dati.

È qui che la proprietà owl:sameAs entra in gioco.

Perché è importante pubblicare 5 stars linked open data?

Ci sono quattro semplici principi da seguire quando si pubblicano dati sul web (e sì, i dati strutturati sono dati aperti in quanto completamente accessibili).

    1. Usare gli URI per identificare le entità
    2. Usare gli URI HTTP in modo che gli utenti possano cercare queste entità (questo significa che l’ID di ogni entità deve essere accessibile tramite URI HTTP)
    3. Pubblicare i dati usando uno standard di linked data chiamato RDF
    4. Includere collegamenti ad altri URI, in modo che i dati possano essere arricchiti attraverso ulteriori informazioni (e – ancora una volta – ecco perché dobbiamo aggiungere la proprietà owl:sameAs).

Per semplificare, un dataset di 5 stars linked open data è un modo per pubblicare i metadati  rendendoli leggibili e accessibili per le macchine.

È così che perché collegando un testo, scritto da una persona con un dataset aperto, i nostri contenuti diventano completamente accessibili e compatibili con le macchine.

Linked Open Data

In altre parole, la SEO semantica si occupa di aiutare la macchina a comprendere i nostri contenuti utilizzando uno standard web aperto per descriverli.

Alcuni dei dataset che usano i 5 stars linked open data sono dei capisaldi fondamentali per gli algoritmi di machine learning dei motori di ricerca semantici come Google e Bing, e, a cascata, per gli assistenti digitali personali come Alexa, Cortana e il Google Assistant.

Questi dataset (come DBpedia, Wikidata, Geonames, solo per nominarne alcuni) sono tutti collegati tra loro e costituiscono insieme un Linked Open Data Cloud.

Datasets in LOD

Quando aggiungi dati strutturati al tuo sito Web in WordPress usando un plugin come WordLift, i dati strutturati sono pubblicati come dati aperti. In pratica, il tuo sito web in WordPress e i metadati relativi ai tuoi contenuti entrano a far parte parte del Linked Open Data Cloud.

Come puoi collegare le entità dal tuo sito in WordPress al Linked Open Data Cloud?

Immagina di voler spiegare a un motore di ricerca chi è Matt Mullenweg collegando la sua pagina sul mio blog con la sua entità nel Cloud LOD. Come faccio a farlo sul mio WordPress?

Matt Mullenweg - owl:sameAs

Come puoi vedere sopra, ho usato WordLift all’interno del mio WordPress per creare una pagina su Matt Mullenweg. Quella pagina è impostata come Person, come tipo di entità schema. Per chiarire di quale persona sto parlando, eseguo una ricerca usando WordLift, che attinge a grafi giganti pubblicati sul LOD e in un attimo ottengo il riferimento all’entità di Matt Mullenweg su Freebase, Wikidata e DBpedia.

Una volta aggiornata la pagina, le proprietà schema sameAs e owl:sameAs vengono aggiunte automaticamente da WordLift e rese disponibili per i motori di ricerca.

Ora proviamo a usare il Google Structured Testing Tool per scoprire come il motore di ricerca vede la pagina:

Structured Data Testing Tool

I dati strutturati sono stati creati senza scrivere una singola riga di codice e ora Google può eseguire la scansione e indicizzare questa pagina in modo molto più efficiente. Tuttavia, c’è anche dell’altro.

Come abbiamo visto in precedenza, usando i 5 stars linked open data i miei dati diventano interoperabili con altri dataset e sono pubblicati anche fuori dalla mia pagina web, in un knowledge graph basato su RDF.

Correlare tutto grazie a un knowledge graph

Nel contesto del web semantico, un knowledge graph è una forma di rappresentazione della conoscenza. Si parte dalla definizione di qualche tripla e poi queste triple sono messe in relazione per costruire un grafo. Per fare esempio, diamo un’occhiata più da vicino – usando le tecnologie del web semantico – alla famosa entità Matt Mullenweg sul mio blog:

Matt Mullenweg - LOD

Come puoi vedere abbiamo una serie di triple che ci raccontano una storia: Matt Mullenweg, il cui nome completo è Matthew Charlie, è nato a Houston, ha frequentato la Houston University ed è un imprenditore.

Un knowledge graph non parla alcuna lingua particolare. La lingua è umana; mentre il knowledge graph viene espresso in linked open data, quindi nel il linguaggio delle macchine.

Immagina il tuo intero sito web descritto da un grande knowledge graph costituito da tutti i metadati che descrivono gli argomenti di cui scrivi. Quel knowledge graph diventa parte di un grafo più grande, che costituisce e descrive il nuovo web. Questo è il vero potere del web semantico.

Riassumendo…

In questo articolo, abbiamo visto che il web semantico è qui. C’è chi  ha già cominciato a usare le  tecnologie semantiche nell’ambito del digital marketing. I risultati sono estremamente promettenti dal punto di vista della SEO e della findability. Stiamo assistendo a una nuova branca della SEO comunemente nota come SEO semantica.

Anche se i backlink sono ancora il fondamento del web, le parole chiave cominciano a essere meno rilevanti e lo saranno sempre meno in futuro. La SEO semantica ti consente di strutturare i contenuti attorno agli argomenti principali per il tuo settore e di definire il contesto usato dai motori di ricerca per classificare i tuoi contenuti in base a uno specifico intento di ricerca.

I dati sono codificati in proprietà definite all’interno di una serie di proprietà definite da schema.org.

Aggiungere i linked data al tuo sito Web in WordPress usando un plugin come WordLift, significa pubblicare dati strutturati che possono essere letti e compresi rapidamente dai motori di ricerca. Da quei linked data, le macchine sono in grado di estrapolare estrapolare relazioni e contesto o, per dirla diversamente,argomenti e significati.

Quando i dati strutturati vengono pubblicati in un knowledge graph usando gli standard del web semantico, il tuo sito Web  entra nel Linked Open Data Cloud. Essere parte del web semantico significa rendere i propri dati accessibili per le macchine e consentire loro di analizzarli per fornire una contenuti migliori agli utenti e per migliorare in questo modo la qualità del traffico che ti porteranno.

Tutto questo significa anche un’altra cosa: pubblicando i dati hai ripreso il controllo dei tuoi contenuti. Insieme con  i contenuti, infatti, produci anche i metadati necessari per commercializzarli e monetizzarli.

Questi sono i mattoncini costitutivi della SEO semantica. Tutto ciò che devi fare per cominciare è installare un semplice plugin per WordPress.

Sei pronto per la nuova SEO?
Comincia a usare WordLift oggi stesso!

Continua a scalare la SERP con il tuo sito: l'AI di WordLift è in offerta al 50% fino al 7 Gennaio Compra Subito!

x