Torna al Blog

Quali sono i fattori di ranking per le Notizie Principali di Google

Google ha cambiato le Notizie Principali nei caroselli dei risultati di ricerca

Google ha fatto un annuncio sul suo blog The Keyword sulle notizie principali da siti non di news. Ce ne hanno parlato in Smarter organization of top stories in Search.

Iniziano il post dicendo:

Le persone vengono a cercare tutti i tipi di informazioni per aiutarle a capire meglio il mondo e gli argomenti che gli stanno più a cuore.

Abbiamo continuato a portare nuovi miglioramenti alla Ricerca per aiutare le persone a orientarsi meglio intorno a un argomento ed esplorare facilmente le idee correlate, in modo che possano passare più rapidamente dall’avere una domanda in mente a sviluppare una comprensione più profonda.

Ora, stiamo usando le ultime novità nel campo dell’apprendimento automatico per portare questo approccio alle storie più importanti nella ricerca di Google, rendendo più facile per le persone immergersi negli articoli più utili e attuali disponibili.

Vediamo le notizie principali nei caroselli dei risultati di ricerca organici quando ci sono storie rilevanti e tempestive da condividere su un argomento. Ecco un esempio dei caroselli sulle “notizie principali” che riguardano l’intelligenza artificiale:

Quando ho sentito questa notizia, ho fatto quello che faccio quando sento parlare di un cambiamento in Google, ho cercato tra i brevetti di Google per vedere se potevo trovarne un recente correlato e ne ho trovato uno concesso nel marzo dello scorso anno (2019).

Il post sul blog aveva più informazioni, ma il brevetto ci parla di Google che crea una selezione di notizie piena di “notizie principali”. Una cosa che il blog ha aggiunto riguardava gli approcci di apprendimento automatico utilizzando strumenti come BERT:

Per generare questi gruppi, usiamo varie tecniche di apprendimento automatico, compresi i modelli BERT, per esaminare gli articoli correlati e determinare dove finisce una storia e ne inizia un’altra.

La nostra ricerca ha dimostrato che il raggruppamento dei risultati storie chiaramente definite è fondamentale per aiutare le persone a navigare facilmente nei risultati e identificare il contenuto migliore per le loro esigenze.

Ora nel carosello delle “notizie principali” all’interno della ricerca presentiamo anche informazioni chiave, come citazioni degne di nota ed estratti di opinioni correlate. 

Oltre all’uso aggiunto del machine learning, ci è stato anche detto che questi risultati sono più completi e diversificati:

Ora nel carosello delle “notizie principali” all’interno della ricerca presentiamo anche informazioni chiave, come citazioni degne di nota ed estratti di opinioni correlate. 

Questi diversi tipi di contenuto forniscono alle persone una visione più completa di una notizia per aiutarle a decidere quale angolo esplorare più a fondo.

Brevetto per la selezione delle notizie di Google

Questo brevetto concesso nel marzo del 2019, ci permette di vedere cosa c’è dietro la selezione dei risultati che emergono nelle “notizie principali in quello che Google considera una  “selezione automatica delle notizie”.

Quando Google indicizza le notizie da fonti editoriali, i fornitori di questi contenuti si concentrano sul distribuire articoli di notizie recenti per “permettere a un utente di visualizzare gli articoli o le storie più condivise”.

Quindi cosa fa di nuovo questo brevetto per portare qualcosa di diverso da mostrare nei risultati di ricerca delle notizie?

Ci viene detto che ciò che è innovativo nel brevetto è il fatto di catturare le storie più interessanti in tempi diversi sulla base di un “punteggio di importanza” per quel periodo.

Vengono selezionate le storie più rilevanti, e le seconde notizie più importanti usano quei punteggi di importanza per entrare nella classifica di quelle che vengono  mostrate come “storie migliori”.

Gli articoli associati con le notizie più importanti per quell’intervallo temporale sono selezionati e visualizzati ed un numero predeterminato di articoli su ogni storia può essere deciso in anticipo. Le storie che vengono mostrate possono anche dipendere dalle categorie di interesse identificate nel profilo utente di chi fa la ricerca che potrebbe iniziare a guardarle (non menzionato nel brevetto, ma questo mi ricorda Google Discovery, e Google che raccoglie categorie di interesse quando decide cosa mostrare a chi fa una ricerca, mi fa pensare al post How Google Might Predict Query Intent Using Contextual Histories).

Punteggi di importanza per le Notizie Principali nella selezione automatica delle notizie

Quindi come fanno le “notizie principali” a diventare “notizie principali”?

Il sistema di selezione delle notizie, durante un certo lasso di tempo, può classificare ciascuna delle notizie principali in base a dalle istantanee di tempi/regioni/lingue. Per esempio, il sistema di raccolta delle notizie determina un punteggio per ciascuna delle storie, che rappresenta la sua importanza. Il sistema di selezione delle notizie a sua volta usa quel punteggio di importanza di ogni notizia principale per determinarne il punteggio finale.

Ogni istantanea nel database include dati che rappresentano una regione, una lingua o entrambe.

Il processo di classificazione delle notizie può decidere che le notizie A-B per l’istantanea A sono specifiche di una regione M e di una lingua N, ad esempio Nord America o gli Stati Uniti, e l’inglese.

Il processo di classificazione delle notizie determina un’altra istantanea per una regione diversa, come il Regno Unito, o un’altra lingua, come il francese o lo spagnolo.

Punteggi di importanza per le storie più rilevanti

Il punteggio di importanza per una particolare notizia può essere incluso nella stessa istantanea che identifica la particolare notizia. Queste sono le cose considerate nella creazione di tali punteggi di importanza:

  • Un numero di articoli scritti su una notizia (quando ogni notizia si riferisce a un evento generale come la neve a Washington D.C. e gli articoli separati sono stati pubblicati da diversi distributori di notizie);
  • Clic su articoli riguardanti una notizia;
  • Azioni sui social media (condivisioni, like, ecc.);
  • Richieste ricevute dai dispositivi degli utenti per i quali gli articoli per una notizia sono reattivi, sono selezionati, o entrambi;
  • Cambiamento di una metrica per una notizia (quando la metrica può diventare click, query, azioni sui social);
  • Un certo periodo di tempo, la freschezza di pubblicazione, quanto è recente una certa notizia;
  • La competenza di un editore in un certo argomento o area geografica (quando l’editore ha pubblicato un articolo relativo alla notizia);
  • Un tasso storico di clic sugli articoli dell’editore;
  • Citazioni fatte all’articolo e/o all’editore;
  • Pertinenza dell’articolo alla notizia;
  • Un’altra metrica appropriata;
  • Una combinazione di due o più di queste per determinare il punteggio della notizia.

Il sistema di selezione delle notizie può utilizzare qualsiasi segnale pertinente per determinare un punteggio e una classifica corrispondente delle notizie principali.

I punteggi di importanza sono usati per classificare le nuove storie come questa:

Il sistema di selezione delle notizie usa i punteggi per classificare le notizie. Per esempio, il sistema di selezione può determinare che una notizia principale A per il tempo di raccolta, per esempio, 30 gennaio 2016, ha un punteggio più basso che le notizie principali B attraverso H 108b – come indicato dalla notizia principale A che non è presentata nel ranking della storia di notizie.

Vantaggi di questo brevetto per la selezione automatica delle Notizie Principali di Google

Un sistema di selezione delle notizie può fornire:

  • Utenti con notizie più imparziali. Questi possono richiedere poco o nessun giudizio editoriale rispetto ai sistemi che hanno una revisione editoriale delle notizie;
  • Raccolta di notizie indipendentemente dal periodo di selezione, dalla regione, dalla lingua, o da una combinazione di due o più di questi;
  • Personalizzazione di una selezione di notizie secondo le impostazioni dell’utente. Come gli interessi personali di un utente;
  • Una raccolta di notizie selezionata in base al dispositivo dell’utente per un periodo di tempo durante il quale non è stato in grado di controllare le notizie;
  • Una raccolta di notizie in base al dispositivo dell’utente che include le storie principali per un periodo storico. Ad esempio dieci anni fa;
  • Una raccolta di notizie in base a un dispositivo dell’utente che include le storie principali per un particolare argomento di interesse. Come quando l’argomento particolare di interesse non ha storie di notizie frequenti.

Il brevetto di selezione automatica delle news è all’indirizzo:

Automated news digest

Inventori: Pan Gu, Mayuresh Saoji, Yuqiang Guan, Maricia Scott, Vikas Sukla e Anand Devraj Paka

Cessionario: Google LLC

Brevetto USA: 10,242,096

Concesso: 26 marzo 2019

Archiviato: 15 marzo 2016

Abstract (versione originale in inglese) 

Methods, systems, and apparatus, including computer programs encoded on computer storage media, automatic generation of news digests. One of the methods includes accessing a database storing news snapshots, each snapshot identifying a predetermined quantity of top news stories for some time, each of the top news stories in a particular snapshot for a particular period ranked according to an importance score that measures the importance of the news story relative to other news stories for the particular time, determining a digest period, determining, for the digest time, all of the snapshots with periods included in the digest time, generating, from the top news stories in the determined snapshots, a digest ranking of digest news stories, and providing, to a user device, data identifying one or more of the digest news stories for presentation according to the digest ranking.

Takeaways

Il post sul blog di Google ci ha detto alcune cose che non sono state menzionate nel brevetto di selezione automatica delle notizie.

Affinché gli articoli possano apparire in un carosello di Notizie Principali, non hanno bisogno di essere registrati come siti di notizie con Google. Così i post nei blog e gli articoli tempestivi che non sono presenti in siti di notizie, ma coprono una delle storie rilevanti in un certo periodo di tempo specifico, potrebbero essere inclusi nei caroselli.

Il post sul blog ci ha anche detto che Google avrebbe incluso citazioni degne di nota ed estratti di opinioni correlate nei caroselli. Lo scopo di questi è quello di assicurarsi che le notizie mostrate siano più dettagliate e diversificate.

L’approccio del punteggio di importanza per particolari notizie spiega come certe storie sono selezionate come notizie principali. Ma non come vengono selezionati gli articoli scelti per gli slot del carosello.

Vuoi far comparire i tuoi articoli nelle Notizie Principali di Google?

Scopri come fare con WordLift!