Categorie
News

Google Search: i dettagli sui suoi sistemi di ranking

Sono molteplici i miti che aleggiano su Google Search, il motore di ricerca più famoso del mondo: ora, Big G ha voluto condividere una guida con alcuni dettagli che riguardano il suo sofisticato e potente sistema di ranking.

Google Search e i numerosi fattori di ranking

Non è un mistero che Big G, sin dai suoi albori, puntasse ad imporsi come un motore di ricerca di riferimento, scalzando attori quali Altervista, Yahoo ed altri player che i «digitalizzati e digitalizzatori» della prima ora ricorderanno di sicuro.

Per raggiungere questo obiettivo, l’azienda di Mountain View ha messo in piedi un sistema automatizzato di ranking che tiene conto di molti fattori e signali per andare a pescare, tra centinaia di miliardi di pagine e contenuti, i risultati più pertinenti ed utili da restituire in SERP, in pochissimo tempo.

Google lavora costantemente all’aggiornamento e miglioramento dei suoi sistemi, con lunghe fasi di test e lavorazione, dando di tanto in tanto notizia di questi progressi portati avanti.

Con la recente guida che ha pubblicato, la società offre uno spaccato per meglio comprendere i sistemi di ranking più rilevanti, nonché alcune soluzioni tecnologiche particolarmente rilevanti per la restituzione di alcuni risultati in SERP in funzione delle query degli utenti.

Andiamo quindi con ordine, scoprendo qualche dettaglio in più sul mondo di Big G…

BERT

Questo acronimo sta per «Bidirectional Encoder Representations from Transformers» ed è sostanzialmente un sistema di intelligenza artificiale utilizzato da Big G per comprendere come, le combinazioni di parole, possano esprimere diversi significati ed intenti nella ricerca.

Crisis information systems

Big G ha realizzato dei sistemi che offrono informazioni utili e tempestive in contesti di crisi di diverso tipo, tra i quali, i seguenti:

  • Personal crisis: i sistemi di Mountain View si preoccupano di capire se gli utenti stanno cercando delle informazioni utili in situazioni critiche in cui sono coinvolte in prima persona, mostrando i numeri di emergenza e contenuti rilevanti da organizzazioni, con un elevato livello di reputazione ed affidabilità, che operano in questi comparti. Alcuni esempi di query di questo tipo riguardano ricerche che contengano termini relativi a tossicodipendenze, violenze sessuali, avvelenamenti, tendenze suicide o altre tematiche sensibili.
  • SOS Alerts: in contesti di disastri naturali o situazioni di crisi internazionale, il sistema di allerta mostra aggiornamenti e notizie dalle autorità di vari livelli. Tra queste informazioni, sono presenti numeri telefonici di emergenza, siti, mappe geografiche, conti per effettuare donazioni e tanto altro ancora.

Deduplication systems

Le ricerche tramite il motore di ricerca di Big potrebbero dar vita a milioni di risultati (pagine) tra le quali scegliere, magari molto simili tra loro. Per evitare di restituire inutili contenuti duplicati, i sistemi di Mountain View adottano tutta una serie di criteri di «de-duplicazione».

In questo modo, tra risultati semplici o featured snippet non si creano inutili doppioni.

Exact match domain system

I sistemi di ranking di Big G attribuiscono ai termini presenti in un nome a dominio il giusto peso che meritano. Ciò significa che siti dai nomi studiati a tavolino per rispondere a determinate query generiche non vengono restituiti automaticamente in SERP, nei primi risultati.

Il sistema interseca questo genere di tentativi di manipolazione della SERP, filtrando i clamorosi tentativi di spam.

Freshness systems

Google Search dispone di diversi strumenti per restituire in SERP dei contenuti che rispondano alle aspettative degli utenti. Mountain View, al proposito, cita l’esempio di un film. Se un internauta cercasse il titolo di una pellicola appena lanciata, Big G gli restituirebbe le recensioni più recenti, anziché i primi articoli riguardanti dettagli sulla produzione.

La contingenza temporale gioca in questo caso un ruolo preponderante nell’interpretare la pertinenza di una notizia recente, rispetto a trattati o approfondimenti scritti parecchio tempo prima.

Helpful content system

Questo sistema è stato introdotto da Big G per consentire al motore di ricerca di mostrare alle persone del contenuto originale ed utile, scritto da persone per persone, anziché contenuto creato principalmente per ottenere traffico dai motori di ricerca.

Big G può contare sulla disponibilità di alcuni sistemi che mira a comprendere come le pagine si collegano tra di loro, per comprendere esattamente quali siano gli argomenti che trattano e quali possano rispondere meglio alle richieste in SERP.

Tra questi si trova PageRank, una delle soluzioni core di ranking presente sin dai primordi all’epoca del lancio di Google. Lo strumento è ovviamente evoluto nel tempo e continua ad esser parte dell’algoritmo madre.

Local news systems

Google Search può contare anche su sistemi che si preoccupano di identificare e mappare le fonti di notizie rilevanti, individuando rubriche come quelle delle «migliori storie» o «news locali».

MUM

Questa sigla sta per «Multitask Unified Model» e si riferisce ad un sistema di intelligenza artificiale in grado di capire e generare del contenuto in lingua. Non è impiegato in modo globale per stabilire il ranking all’interno di Google Search, bensì per alcune specifiche applicazioni, come nel caso del reperimento di informazioni scientifiche particolarmente rilevanti o per migliorare i cosiddetti featured snippet.

Neural matching

Questo è un sistema di intelligenza artificiale di cui Google fa uso per comprendere la rappresentazione di concetti nelle query e nelle pagine, creando un abbinamento tra di loro.

Original content systems

Big G dispone di sistemi che gli permettono di mostrare nelle posizioni elevate delle SERP contenuti originali, tra i quali rientrano le attività di reporting all’orgine della diffusione di tanti altri contenuti secondari che li citano.

Big G offre in questo senso uno speciale markup canonical ai creatori di contenuti, che possono utilizzare a questo scopo per permettere al motore di ricerca di capire qual è la pagina principale da considerare (laddove la stessa fosse poi stata duplicata in altri percorsi).

Removal-based demotion systems

Big G dispone di una serie di misure che gli permettono la rimozione di alcuni tipi di contenuti che ritiene «incriminati». Per evitare che in SERP finiscano risultati scadenti, un sito potrebbe finire nel radar di questo sistema in modo particolare se:

  • Un portale viene segnalato a più riprese per la violazione dei diritti d’autore altrui (copyright), promuovendo piuttosto il materiale originale oggetto del plagio, oppure, per altri illeciti (prodotti contraffatti, ordini di tribunali, diffamazioni,…).
  • Le rimozioni di contenuti con informazioni/dettagli che riguardano persone (immagini del tipo porn-revenge, contenuti di doxxing, contenuti pubblicati su portali in cui, per la rimozione, vengono imposti costi).

Page experience system

Per rispondere alle esigenze degli utenti, le cui aspettative in termini di UX su un sito sono ormai molto elevate, Big G utilizza il sistema di page experience per valutare, secondo una serie di criteri (velocità nel tempo di caricamento, struttura mobile-friendly, assenza di contenuti interstiziali fastidiosi e soluzioni per un’esperienza di uso sicura,…).

In contesti in cui il sistema individua molteplici contenuti da mostrare in SERP, la priorità è accordata alle pagine che offrono una migliore UX.

Passage ranking system

Si tratta di un sistema di intelligenza artificiale che Google Search utilizza per individuare degli estratti (sezioni o passi di contenuto presente in una pagina) per meglio comprendere l’effettiva pertinenza della pagina rispetto ad un intento di ricerca.

Product reviews system

Questa parte del sistema di ranking di Big G mira invece a premiare le recensioni di prodotti di alta qualità, cioè, dei contenuti che offrono delle analisi dettagliate e ricerche originali, che siano scritte da esperti del settore o di appassionati che abbiano un buon livello di conoscenza dell’argomento.

RankBrain

Si tratta di un sistema di intelligenza artificiale che aiuta Big G a comprendere come le parole vengono messe in relazione ai concetti, in una logica semantica.

Ciò si traduce nel fatto che Google può restituire in modo più puntuale dei risultati che siano affini all’intento di ricerca, anche qualora i termini più appropriati non fossero presenti nella query di ricerca.

Reliable information systems

Questa parte del sistema di ranking è deputata ad un preciso criterio di selezione, vale a dire, quello dell’affidabilità più elevata possibile delle informazioni restituite in SERP alle richieste degli utenti.

In linea di principio, privilegia le pagine con un maggior livello di autorevolezza, scartando il contenuto di bassa qualità, promuovendo allo stesso tempo l’informazione offerta dal giornalismo di qualità.

Qualora i sistemi non trovassero informazioni affidabili, magari a causa di argomenti o eventi con un’elevata frequenza di aggiornamento delle notizie, è mostrato un apposito disclaimer, come abbiamo descritto nel nostro post dedicato al concetto di about this result.

Site diversity system

Questa soluzione di Big G mira a mostrare non più di due risorse provenienti dallo stesso sito nelle posizioni alte della SERP, proprio per evitare una posizione dominante di un attore rispetto agli altri.

Solo in alcuni casi selezionati, quando i sistemi di Big G attribuiscono una particolare rilevanza delle risorse rispetto all’intento di ricerca, possono essere mostrati in SERP più risultati appartenenti ad un dominio.

È interessante notare che anche i sottodominî vengono generalmente ritenuti parte del dominio root e, quindi, associati ad un solo sito. A questo principio, però, talvolta vengono applicate delle deroghe motivate dalle esigenze di offrire una risposta pertinente all’utente.

Spam detection systems

Così come le caselle di posta elettronica sono spesso sommerse di e-mail indesiderate, SPAM, anche i motori di ricerca – se gli algoritmi non presidiano correttamente il loro sistema di filtraggio del mare magnum di risorse – finiscono per restituire delle SERP poco utili all’utente.

Proprio per evitare ciò, Big G ha messo a punto un sistema di individuazione dello spam, che comprende SpamBrain, deputato proprio a contrastare questi comportamenti che violano le linee guida sullo spam.

Questi sistemi vengono aggiornati costantemente per offrire dei risultati utili agl’internauti che formulano le loro ricerche su Google Search.

Retired systems (sistemi «pensionati»)

Questa raccolta di aggiornamenti è una sorta di linea del tempo con lo storico dell’evoluzione di Big G. A seconda dei casi, alcuni sistemi sono stati poi incorporati nelle soluzioni tecnologiche successive, oppure, sono entrati a far parte del sistema core di ranking.

Hummingbird

Nell’agosto 2013, questo aggiornamento ha segnato un importante passo avanti, nel suo complesso, ai sistemi di ranking di Big G.

Mobile-friendly ranking system

Questo aggiornamento riguarda quei contesti in cui, per una data ricerca, esistono molteplici risultati da offrire in SERP con un livello paragonabile di pertinenza.

In quelle situazioni, il mobile friendly ranking system assegnava un livello di priorità ai contenuti il cui rendering su dispositivi mobile avveniva in maniera migliore, proprio per rispondere alle esigenze degli utenti che compiono delle ricerche tramite questo genere di device.

Questo aggiornamento è poi diventato parte integrante del sistema di page experience.

Page speed system

Questo aggiornamento è stato comunicato nel 2018, inizialmente con il nome di «Speed Update». Si tratta di una soluzione introdotta per privilegiare, a parità di rilevanza della risorsa, il contenuto il cui caricamento è più veloce per gli utenti mobile (sulle SERP mobile).

Sin dai primordi, è stato parte integrante del sistema di page experience.

Panda system

Questo aggiornamento è stato progettato per dare precedenza in SERP ai contenuti originali e di alta qualità. Introdotto nel lontano 2011 è evoluto fino a diventare parte del sistema core di ranking nel 2015.

Penguin system

Questa soluzione tecnologica è stata progettata, a suo tempo, per combattere l’attività di link building di tipo spam. L’aggiornamento, rilasciato nel lontano 2012, ricevette sùbito l’appellativo di «Penguin Update» e, dal 2016, fa parte del sistema core di ranking.

Secure sites system

Questo sistema – introdotto nel lontano 2014 – è stato il primo passo avanti per sancire l’esigenza di offrire risultati provenienti da siti che adottassero un principio di «privacy by design».

In sostanza, le risorse provenienti da portali con certificati SSL (di conseguenza, con trasmissione tramite il protocollo https) godono di una corsia preferenziale quando si tratta di considerazione da parte dei sistemi di ranking.

Questa soluzione, avveniristica per l’epoca, è poi confluita nel cosiddetto page experience system.