Categorie
News

Il «crawl budget»: un rompicapo per i contenuti

Il cosiddetto «crawl budget» è spesso tematica che occupa le discussioni tra esperti di ottimizzazione SEO e creatori di contenuti: e in questa eterna diatriba, quale posto occupano le risorse testuali nel determinare l’attività dello spider di Google?

In più di un’occasione, Big G è stata sollecitata ad offrire risposte sull’argomento del crawl budget. Dietro a questa definizione c’è una semplice regola: la quantità di risorse (in un dato tempo) delle macchine che viene consacrata dal motore di ricerca nell’esplorazione di un portale.

A questo punto, il primo quesito al quale è importante trovare una risposta è: l’architettura delle informazioni, con la sua struttura e ramificazione in molteplici risorse, è curata secondo un principio di ottimizzazione?

A questa domanda, bisogna rispondere tenendo conto della quantità di pagine presenti nel portale da sottoporre a scansione. Tanto più crescono i contenuti da esplorare, quanto più il crawl budget dovrà essere oggetto di attenzione per evitare degli inutili sperperi di risorse per lo spider.

Il crawl budget: il delicato equilibrio tra contenuti nuovi e storici

A scanso di equivoco, dobbiamo sottolineare un aspetto molto importante: Mountain View ha affermato che i portali con circa 100’000 link non sarebbero di principio confrontati con la problematica del crawl budget.

Questa pregiudiziale dovrebbe essere sufficiente per far dormire sonni relativamente tranquilli a coloro i quali posseggono siti con poche risorse (pagine), riservando dubbi e perplessità solo ai proprietari di grossi portali.

Quando i siti presentano però uno storico di contenuti sufficientemente ampio, si pone però spesso un bivio di fronte a chi deve occuparsi di ottimizzazione SEO: come non subire le conseguenze del crawl budget, quando ci sono risorse storiche e nuove da valorizzare?

Il crawl budget e i contenuti testuali: quando gli errori portano ad un vicolo cieco.
L’importante è non finire in un vicolo cieco…

Contenuti e crawl budget: gli strumenti per non perdere mai il focus

Oltre a ribadire quanto riferito su Twitter da John Muller – cioè che entro i 100’000 link difficilmente si presentano problemi di crawl budget – vogliamo ricordare anche un altro aspetto.

I motori di ricerca come Google, per offrire risposte pertinenti alle richieste degli utenti, interpretandone l’intento di ricerca nella maniera più appropriata, devono disporre di una miriade di contenuti nei loro archivi strutturati di informazioni da restituire all’occorrenza.

Tuttavia, la verticalità di un portale ha anche un ruolo non trascurabile nell’ottenimento di prestazioni interessanti in SERP, motivo per il quale il cosiddetto «budget di scansione» andrebbe sfruttato istradando il motore di ricerca verso ciò che riteniamo più rilevante per i nostri utenti.

Per ottenere questo scopo, potremmo ricorrere ad alcune soluzioni pratiche (tra le tante da considerare nei singoli casi):

  • uso ponderato dello strumento «canonical»;
  • miglioramento delle prestazioni secondo i canoni di PageSpeed;
  • correzione degli errori 404 et similia.

Dopo ogni ottimizzazione, è sempre ovviamente imprescindibile una fase di analisi dei risultati ottenuti nel tempo, con un puntuale audit.

Il crawl budget e la produzione di contenuti

Quando si è preso atto della necessità di non trascurare le logiche del crawl budget in un portale, da buoni copy – o, comunque, creatori di contenuto testuale – non si può fare a meno di soffermarsi alla questione della ripartizione degli argomenti tra le diverse pagine.

Anziché produrre nuove risorse che vadano a cannibalizzare inutilmente le pagine già correttamente indicizzate e posizionate in SERP, il consiglio è sempre quello di fare un’analisi preventiva di quanto è già presente, adottando delle soluzioni strategiche ad hoc.

In questo senso, una buona prassi da adottare per dare attuazione a questo approccio potrebbe comprendere (ma non solo) i passi seguenti:

Dopo aver accertato l’esigenza di revisionare l’alberatura, aggiugendo nuove risorse, si possono predisporre le attività di creazione dei nuovi contenuti senza ignorare le logiche del crawl budget.