Hummingbird scatenato
(Questa è la versione italiana del mio post pubblicato oggi su Moz)
A volte credo che noi SEO potremmo essere degli ottimi personaggi di un film di Woody Allen: siamo stressati, nervosi, paranoici, tendiamo a bruschi cambi di umore… D’accordo, forse sto esagerando un poco, ma in quel modo tendiamo a reagire ogni volta che Google annuncia un update.
Casi come questo webmaster, che disperato pensa di essere stato penalizzato da Hummingbird, non sono poi così rari.
Una cosa che certamente non aiuta è la mancanza di chiarezza da parte di Google, che non solo non cita mai Hummingbird in modo ufficiale (per esempio nel post del suo 15º anniversario), ma che anche evita di entrare nei dettagli di questo aggiornamento epocale nelle dichiarazioni “a microfono spento” di Amit Singhal. Infatti, quello che dice Google in parte ha contribuito alla confusione nata intorno all’interpretazione da dare a Hummingbird.
Quando Google annuncia un update – specialmente uno come Hummingbird – la cosa migliore da fare è evitare di cercare immediatamente di capire che cosa è realmente basandosi solo sull’intuizione. È meglio aspettare che le acque si calmino, recuperare i documenti originali, esaminare quelli relazionati ad essi (ed ogni loro variante), prendersi il tempo di vedere l’update in azione, investigare con calma, e solo dopo tutto questo cercare di trovare le risposte più plausibili.
Questo metodo non è sicuramente scientifico (pertanto le risposte non si possono mai definire come “sicuramente corrette”). Questo metodo è filologico, e nel caso degli update di Google credo che si tratti di un metodo ottimo.
I documenti originali sono lo Storify dell’evento per la stampa, durante il quale Google annunciò Hummingbird, e le FAQ che Danny Sullivan pubblicò immediatamente dopo quell’evento, e che fanno diretto riferimento alle dichiarazioni fatte da Amit Singhal durante e dopo l’annuncio di Hummingbird.
I documenti relazionati sono le patenti, che probabilmente sottostanno a Hummingbird, e le osservazioni che esperti come Bill Slawski, Ammon Johns, Rand Fishkin, Aaron Bradley ed altri hanno fatto sono i documenti derivati.
Questo post è il risultato del mio studio di questi documenti e delle osservazioni fatte direttamente delle SERPs.
Indice dei contenuti
- Perché Amith Singhal ha mescolato mele con arance?
- Come funziona Hummingbird?
- Il 90% delle queries sono influenzate da Hummingbird, davvero?
- Se Hummingbird rappresenta un virata decisa verso la SEO Semantica, questo significa che se uso Schema.org il mio sito rankerà meglio?
- È Hummingbird relazionato con l’aumento della presenza di Knowledge Graph e Answer Cards?
- Hummingbird è basato sul Knowledge Base?
- Hummingbird significa che la morte del Link Graph?
- Esiste una relazione tra Hummingbird è 100% (not provided)?
- Che cosa dobbiamo fare per essere Hummingbird-friendly?
Perché Amith Singhal ha mescolato mele con arance?
Mentre annunciava Hummingbird, Amit Singhal ha detto che era dai tempi di Caffeine (2010), che l’algoritmo di Google non era attualizzato così profondamente.
Il problema è che Caffeine non fu un update dell’algoritmo, ma un cambio infrastrutturale dell’indice.
Lo scopo di Caffeine, infatti, era quello di ottimizzare l’indicizzazione dei miliardi di documenti che Google crawlea, presentando così agli utenti un pool di risultati più ricco, grande e fresco.
Invece, l’obiettivo di Hummingbird non è una nuova ottimizzazione del processo di indicizzazione, ma capire meglio l’intento degli utenti quando realizzano una ricerca nel suo indice e, quindi, poter offrire loro i risultati più rilevanti.
Ciononostante, possiamo affermare che Hummingbird è anche un update infrastrutturale, perché esso governa i più di 200 elementi che compongono l’algoritmo di Google.
La (forse inconscia) associazione che Amit Singhal ha creato tra Caffeine e Hummingbird ci suggerisce che:
- Hummingbird non esisterebbe se prima non fosse stato creato Caffeine e, perciò, che lo si dovrebbe considerare un’evoluzione di Google Search e non una rivoluzione;
- Inoltre, Hummingbird potrebbe essere considerato come il tentativo più ambizioso da parte di Google di risolvere i problemi di qualità creati da Caffeine.
Fatemi spiegare quest’ultimo punto.
Caffeine, eliminando di fatto il cosiddetto “Sand-Box”, causò un’inondazione di documenti di scarsa qualità nell’indice.
Google reazionò con patches come Panda, Penguin e EMD, per citare gli update più importanti.
Questi update così efficaci in quelle che potremmo definire come head e middle tail queries, però non lo sono per un tipo di ricerca che – soprattutto a causa della sempre più crescente adozione della ricerca mobile – un numero sempre maggiore di persone ha cominciato ad usare: le long tail conversazionali, o quelle che Amit Singhal ha definito come “verbose queries”.
L’evoluzione del riconoscimento del linguaggio naturale da parte di Google, la migliorata capacità per disambuguare entità e concetti grazie alla tecnologia eredità da Metaweb e migliorata con Knowledge Graph, e l’enorme miglioramento fatto a livello di personalizzazione delle SERPs, tutte e tre hanno dato a Google gli strumenti teorici e pratici non solo per risolvere quel problema ancora aperto, ma anche per dare un nuovo inizio all’evoluzione della ricerca su Google.
Questa, sostanzialmente, è la storia, che spiega ciò che Amit Singhal, qui sotto parafrasato da Danny Sullivan, ha detto a proposito di Hummingbird:
[Hummingbird] Gave us an opportunity […] to take synonyms and knowledge graph and other things Google has been doing to understand meaning to rethink how we can use the power of all these things to combine meaning and predict how to match your query to the document in terms of what the query is really wanting and are the connections available in the documents. and not just random coincidence that could be the case in early search engines.
Come funziona Hummingbird?
“To take synonyms and knowledge graph and other things…”
Google lavora con i sinonimi da molto tempo. Se guardiamo la timeline che Google stesso ha condiviso nel post del suo 15º anniversario, i sinonimi sono utilizzati sin dal 2002, anche se possiamo dire che la disambiguazione (intesa come analisi ortografica delle queries) si applica sin dal 2001.
L’anno passato Vanessa Fox pubblicò “Is Google’s Synonym Matching Increasing?…” su Search Engine Land.
Leggendo quel post e vedendo gli esempi presentati, è chiaro che i sinonimi erano già utilizzati da Google, in connessione con l’intento dell’utente e sottostante alla query, con lo scopo di allargare lo spettro della query, riscriverla e, così, offrire i migliori risultati agli utenti.
Quello stesso post, però, mostra che usando solo un dizionario dei sinonimi o affidandosi al conoscimento delle queries più utilizzate non era possibile assicurare risultati di ricerca rilevanti (osservate come Vanessa mette in evidenza come Google non considera i cani animali da compagnia nel caso della query “pet adoption”, mentre sì così considera i gatti).
Lo stesso Amit Singhal, in questa vecchia patente, era conscio che fare affidamento solo sui sinonimi non era la soluzione perfetta, perché due parole possono essere sinonimi e possono non esserlo dipendendo dal contesto in cui sono utilizzate (per esempio “coche” e “automóvil” entrambe significano “automobile” in Spagnolo, ma “carro” significa automobile solo nello Spagnolo parlato in America Latina, significando “carro” in Spagna).
Quindi, per poter offrire i migliori risultati possibili utilizzando la semantica, quello di cui aveva bisogno Google era capire meglio, più facilmente il contesto delle queries.
Hummingbird è come Google ha risolto quel bisogno.
I sinonimi rimangono essenziali; Amit Singhal lo ha confermato nella chiacchierata post evento con Danny Sullivan. Come sono utilizzati è stato descritto da Bill Slawski in questo post, in cui descrive la patente Synonym identification based on co-occurring terms, che si basa in parte anche sul concetto di “search entities”, che ho descritto in questo mio post su Moz, in cui parlavo di SEO e Personalizzazione della ricerca)
A voler essere precisi, le parole non sono “cose” in se stesse, ma la rappresentazione verbale di cose, e le search entities sono ciò con cui Google oggettivizza concetti astratti. Un oggetto, poi, può avere relazione con altri oggetti, relazione che cambia dipendendo dal contesto in cui sono usati insieme. In questo senso, le parole sono trattate come le persone, le città, i libri e tutte le altre “named entities” solitamente associate a Knowledge Graph.
I meccanismi che Google utilizza per identificare le search entities sono particolarmente importanti per disambiguare i significati potenziali di una parola, e quindi raffinare l’information retrieval in accordo con un “probability score”.
Questa tecnica non è così differente da ciò che Knowledge Graph fa per disambiguare, per esempio, Saint Peter l’apostolo da Saint Peter la basilica o Saint Peter la città nello stato del Minnesota.
Infine, esiste un terzo concetto che gioca un ruolo esplicito in quella che potremmo definire come la patente di Hummingbird: le co-occorrenze.
Integrando questi tre elementi, Google è teoricamente in grado di:
- Comprendere meglio l’intento di una ricerca;
- Ampliare il pool di documenti che possono rispondere a quella ricerca;
- Semplificare come presenta le informazioni, perché se la query A, la query B e la query C in sostanza significano la stessa cosa, Google non avrà più bisogno di proporre tre SERPs differenti, ma solo una;
- Offrire una migliore esperienza di ricerca, perché espandendo la query e capendo meglio le relazioni tra search entities (anche sulla base di elementi di personalizzazione diretti/indiretti), Google può offrire dei risultati che hanno una maggiore probabilità di soddisfare le esigenze dell’utente, che ha fatto un ricerca;
- Presentare SERPs migliori anche dal punto di vista degli annunci, perché nel 99% dei casi, le queries verbose non presentano Adwords.
Maybe Hummingbird could have solved Fred Astaire and Ginger Rogers speaking issues…
Il 90% delle queries sono influenzate da Hummingbird, davvero?
Molti SEOs hanno messo in dubbio che Hummingbird abbia influenzato il 90% delle queries per il semplice fatto che non hanno notato alcun cambio nel traffico e nei rankings dei loro siti.
A parte il fatto che le SERPs furono in costante fluttuazione tra la fine di Agosto e la prima metà di Settembre, periodo durante il quale Hummingbird fu lanciato (sebbene questa potrebbe essere solo una coincidenza, assai opportuna però), la query che normalmente targetizza Hummingbird è quella conversazionale (per esempio: “Qual’è la migliore pizzeria tra Piazza del Popolo e via del Corso?”), un tipo di ricerca che normalmente i SEO non tracciano.
Inoltre, Hummingbird è un update che riguarda le queries, non le keywords (men che meno le parole chiave di coda lunga o ultralunga), come ha spiegato ottimamente Ammon Honhs nel post Hummingbird – The opposite of long-tail search. Per quella ragione, tracciare i ranking delle long tail non è il metodo corretto per misurare l’impatto di Hummingbird.
Infine, Hummingbird non ha significato l’estinzione dei fattori classici di posizionamento, ma è piuttosto un nuovo framework in cui essi operano. Se un sito web era autorevole e rilevante per una query, esso continuerà ad essere ben posizionato come lo era prima di Hummingbird.
Quindi, quali siti possono essere stati colpiti? Forse solo quei siti che fanno affidamento solo su pagine fortemente ottimizzate per keyword di coda lunga, ma che posseggono poca o nulla autorità. Quindi, come Rand ha detto nel suo ultimo Whiteboard Friday, adesso è molto meglio creare migliori pagine con contenuti potenzialmente linkabili e condivisibili, che creare migliaia di pagine centrate sul long tail ma di qualità povera o nulla.
Se Hummingbird rappresenta un virata decisa verso la SEO Semantica, questo significa che se uso Schema.org il mio sito rankerà meglio?
Uno dei miti che con più velocità si sono diffusi dopo l’annuncio di Hummingbird fu che i dati strutturati sono uno dei suoi fattori più importanti.
Sebbene sia vero che da alcuni mesi a questa parte Google insiste sull’importanza dei dati strutturati (per esempio, dedicando loro un’intera sezione di Google Webmaster Tools), considerare Schema.org la soluzione magica non è corretto. Anzi, è un esempio di come noi SEO a volte confondiamo il mezzo con il fine.
Quello che noi dobbiamo offrire a Google è un contesto facilmente capibile dei temi intorno ai quali abbiamo creato un documento, e i dati strutturati sono utili in questo senso. Ma da soli, però, non sono sufficienti. Come detto in precedenza, se una pagina non è considerata autorevole (grazie anche a links e menzioni esterne), è molto probabile che non avrà la forza sufficiente per posizionarsi bene, specialmente adesso che le queries di long tail sono state semplificate da Hummingbird.
È Hummingbird relazionato con l’aumento della presenza di Knowledge Graph e Answer Cards?
Molte persone sono convinte che Hummingbird altro non sia che la traduzione di Knwoledge Graph nella più classica Google Search, e che questo è direttamente collegato con la proliferazione delle Answer Cards. Questa teoria ha dato origine a posts veramente arrabbiati contro la natura di “scraper” di Google.
Questo si deve al fatto che Hummingbird fu annunciato insieme a nuove funzioni di Knowledge Graph, ma in realtà non esiste alcuna evidente relazione tra Hummingbird e Knowledge Graph.
Ciò che molti hanno pensato essere una causa (Hummingbird è la causa della maggiore presenza di KG e e Answer Cards, quindi è la stessa cosa), è molto probabilmente una semplice correlazione.
Hummingbird ha sostanzialmente semplificato le queries verbose in queries più semplici, e queste ultime a volte sono complementate con Knowledge Graph, che a sua volta è in sempre maggior espansione. Per questo motivo adesso vediamo un maggior numero di SERPs con elementi di KG e con Answer Cards.
Detto questo, è vero che la filosofia che sottostà ad Hummingbird e Kwonledge Graph è la stessa: spostare il centro dalle stringhe di codice alle cose reali.
Hummingbird è basato sul Knowledge Base?
Il Knowledge Base di Google è potente e pervasivo, ma ridurre Hummingbird solo al Knowledge Base sarebbe semplicista.
Come abbiamo detto, Hummingbird fa riferimento a molti elementi, è il Knowledge Base è uno di essi, soprattutto in tutte quelle queries in cui l’elemento della personalizzazione (che a sua volta è uno strato che influenza pervasivamente l’algoritmo) è presente.
Ma se Knowledge Base influenzasse pesantemente il funzionamento di Hummingbird, senza essere complementato da altri fattori, allora potrebbe cadere in quei problemi che Amit Singhal aveva denunciato riguardo all’uso solo dei sinonimi.
Hummingbird significa che la morte del Link Graph?
No. PageRank e gli altri elementi dell’algoritmo legati ai links sono vivi e vegeti. Anzi, oserei dire che i links adesso sono ancora più importanti come segnale.
Infatti, senza l’autorità che un buon link profile offre a un sito, una pagina web avrà ancor più difficoltà a posizionarsi adesso (rileggete quanto ho scritto sopra riguardo la sorte delle pagine con poca autorità).
Quello che però assume un valore ancor maggiore è il contesto in cui si presentano i links. Questo è qualcosa che avevamo già appreso con Penguin, ma Hummingbird lo riafferma. Links da contesti irrilevanti sono cattivi links.
Comunque, e non sono solo io a dirlo, Google deve ancora migliorare sul fronte dell’analisi della qualità dei links:
Links are the fossil fuel of search relevancy signals. Polluted. Not getting better. And yet, that’s what Google Hummingbird drinks most.
— Danny Sullivan (@dannysullivan) October 18, 2013
Nello stesso tempo, e di nuovo a causa dell’importanza del contesto e dell’entity recognition, le co-occorrenze e le co-citazioni del Brand assumono un importanza ancor maggiore dopo Hummingbird.
Esiste una relazione tra Hummingbird è 100% (not provided)?
Il fatto che Hummingbird e 100% (not provided) siano stati lanciati pressappoco allo stesso tempo sembra essere più che una semplice coincidenza.
Se Hummingbird è tutto attorno le search entities, un migliore information retrieval ed espansione delle queries, se è un update in cui le keywords in (gran) parte hanno perso il loro onnipresente valore, allora centrare tutto il nostro lavoro come SEO sull’analisi delle keywords non è più sufficiente.
Dovremmo smettere di considerare la SEO keyword-centrica, e incominciare a considerarla topic-centric.
Questo cambio ci obbliga a pensare in contenuti di valore e rilevanti, e non solo in “contenuti”. La “SEO copywriting” finalmente termineranno di esistere e sarà semplicimente “copywriting eccellente.
Come SEO, poi, dovremmo incominciare a capire come funzionano le search entities, e non diventare dei dizionari dei sinonimi viventi.
Se Hummingbird è un salto da gigante verso la SEO Semantica, allora il nostro lavoro come SEO “non è ottimizzare pensando solo al codice (strings), o pensando solo alle cose (things), ma alle connessioni tra codice e cose”, come ha brillantemente detto Aaron Bradley in questo post e in questa presentazione per SMX East.
from Search Marketing Expo – SMX
Che cosa dobbiamo fare per essere Hummingbird-friendly?
Permettetemi di rispondere rivolgendovi delle domande, alle quali dovrete rispondere onestamente:
- Quando create/ottimizzate un sito, lo fate avendo un’audience chiara in mente?
- Quando state ottimizzando on-page un sito, state seguendo almeno queste buone pratiche SEO?
- Usare un’architettura dell’informazione chiara e non esageratamente complessa;
- Evitare problemi di canonicalizzazione;
- Evitare problemi di thin-content;
- Creare un modello semantico per i contenuti del sito;
- Ottimizzare topicamente i contenuti del sito pagina per pagina, usando un linguaggio naturale e ricco semanticamente, e avendo impostato una strategia landing-centrica;
- Creare contenuti utili per gli utenti, servendosi di una gran varietà di formati, e che che voi stessi amereste linkare nei vostri siti e condividere con i vostri amici;
- Implementare Schema.org, Open Graph e i mark-up semantici in generale.
- Gli obiettivi della vostra link building sono?
- Una migliore visibilità di Marca;
- Ottenere traffico da referrals;
- Potenziare il senso che la vostra audience ha del vostro Brand come “thoughtful leader” nella vostra nicchia?
- Ottenere links da siti topicamente relazionati o da sezioni topicamente relazionate nel caso di siti generalisti (esempio: news sites).
- Come SEO, il Social Media vi offre questi vantaggi?
- Maggiore visibilità di Marca;
- Social Echo;
- Un incremento delle menzioni e dei links, e delle co-occorrenze e co-citazioni;
- Crescita di traffico organico e di brand ambassadors
Se avete risposto sì a queste domande, allora non dovete fare nulla se non continuare il buon lavoro che state già facendo, migliorarlo ed essere marketers creativi. Probabilmente il vostro sito era già posizionato bene e ottenendo traffico grazie a questa visione olistica della SEO.
Se avete risposto no ad alcune domande, quello che dovete fare è correggere le cose che state facendo male e seguire quelle che si considerano come le best practices della SEO adesso (è i Ranking Factors di Moz sono un’ottima lista di buone pratiche).
Se onestamente avete risposto no a molte delle domande, allora avevate problemi sin da prima che Hummingbird fosse stato lanciato, e le cose non miglioreranno per voi grazie a Hummingbird. È arrivato il momento per voi di cambiare radicalmente il vostro modo di pensare e fare SEO.
Hummingbird non ci sta chiedendo di ripensare la SEO o di reinventare – per l’ennesima volta – la ruota. Semplicemente ci chiede di non fare SEO di m…da.
Ma questo è qualcosa che dovremmo già sapere, no?
N.B. Moz non è in alcun modo associato a Webinfermento
Sono andata a ripescare questo articolo, davvero ottimo… avrei solo tradotto “patent” con “brevetto” anziché “patente” 🙂
Sono andata a ripescare questo articolo, davvero ottimo… unico appunto se permetti, avrei tradotto “patent” con “brevetto” anziché “patente” 🙂
Chiaro, preciso, misurato. Non trovo una parola di troppo nell’analisi di Gianluca Fiorelli. Incredibile. Grazie di cuore per la condivisione
[…] L’ARTICOLO ORIGINALE E’ REPERIBILE SU WEBINFERMENTO! […]
[…] Ecco tutto quello che devi sapere su Google Hummingbird, il nuovo algoritmo strutturale di Google che riscrive il modo in cui vengono forniti i risultati di ricerca. […]
Letto tutto d’un fiato! Grazie per la tua esposizione. Avrò il piacere di conoscerti al convegno Gt? Ciao
William
Ottimo post, quando l’ho letto in treno mi pare ci fosse una contraddizione sulle long-tail, le verbose query, lo rileggo con più calma.
Gianluca,
complimenti per l’articolo. Ho letto quello su Moz. Impressionante il lavoro di ricerca. Quando si dice “contenuti di qualità” basta far riferimento ai tuoi articoli.
Grazie
Molto interessante e completo, davvero
Gianluca Fiorelli ottimo articolo, complimenti!