come funziona l'indicizzazione su google

96
Enrico Altavilla Come funziona l'indicizzazione su Google Convegno GT, 13 dicembre 2013

Upload: enrico-altavilla

Post on 15-Apr-2017

45 views

Category:

Marketing


1 download

TRANSCRIPT

Page 1: Come funziona l'indicizzazione su Google

Enrico Altavilla

Come funziona l'indicizzazione su Google

Convegno GT, 13 dicembre 2013

Page 2: Come funziona l'indicizzazione su Google

Enrico Altavilla

Orrori SEO

"Google mi ha indicizzato

in prima pagina"

Page 3: Come funziona l'indicizzazione su Google
Page 4: Come funziona l'indicizzazione su Google

Enrico Altavilla

Chi sono?

Consulente di search marketing

Ho iniziato nel 2000

Esperienza in agenzia e da freelance

Page 5: Come funziona l'indicizzazione su Google

Enrico Altavilla

Come è nato questo seminario

Informazioni frammentate

Page 6: Come funziona l'indicizzazione su Google

Enrico Altavilla

Come è nato questo seminario

Collegare le nozioni con un filo logico

Page 7: Come funziona l'indicizzazione su Google

© Brad Montgomery

Page 8: Come funziona l'indicizzazione su Google

© S. Krupp

Page 9: Come funziona l'indicizzazione su Google

© Keizers

Page 10: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Crawling Parsing Indexing Search

Page 11: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Attribuzione di priorità

Acquisizione delle risorse Crawling

Page 12: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Analisi dei contenuti

Smistamento dei dati Parsing

Page 13: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Trasformazione dei dati

Creazione di un indice

Indexing

Page 14: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Comprensione della query

Selezione dei documenti

Attribuzione di un ordine

Composizione della SERP

Search

Page 15: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Crawling Parsing Indexing Search

Interconnesse e dipendenti

Page 16: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Crawling Parsing Indexing Search

Interconnesse e dipendenti

Page 17: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Crawling Parsing Indexing Search

Interconnesse e dipendenti

Page 18: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Crawling Parsing Indexing Search

Interconnesse e dipendenti

Page 19: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Crawling Parsing Indexing Search

Interconnesse e dipendenti

Page 20: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Indexing

Page 21: Come funziona l'indicizzazione su Google

Enrico Altavilla

Le quattro fasi

Crawling Parsing Indexing Search

Page 22: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Page 23: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Obiettivo

Individuare in archivio le risorse associate ad una parola o frase

Page 24: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Problema

È una pazzia leggere l'intero archivio di risorse ogni volta che devo cercare una parola o frase

Page 25: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Soluzione

Creo a monte un indice che, per ogni parola o frase conosciuta, elenca le risorse associate

Page 26: Come funziona l'indicizzazione su Google
Page 27: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Indicizzare significa aggiungere all'indice un'associazione tra una parola/frase ed una

risorsa

convegnogt doc_1 doc_2 doc_3

Page 28: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

È un'attività svolta dal motore, non dal SEO

Page 29: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Significato moderno di "indicizzare"

Poter far parte dei risultati di ricerca

Page 30: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

"Google mi ha indicizzato

in prima pagina"

Page 31: Come funziona l'indicizzazione su Google
Page 32: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

L'indice serve a determinare quali risorse suggerire (indicizzazione), non in che ordine

suggerirle (ranking)

Page 33: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling Parsing Indexing Search

Page 34: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling

Page 35: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling

Crawler

Parser

Database

URL

Scheduler

Page 36: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling

Crawler Server Richiesta HTTP

Risposta HTTP

Page 37: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling

Crawler

Server

Robots.txt

Disallow: /

Richiesta

Risposta

Page 38: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling

Crawler Server Richiesta

Risposta

Header

(Status)

Contenuto

Page 39: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling: raccomandazioni

Header

(Status)

Contenuto

Occhio all'istruzione Disallow!

Page 40: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling: raccomandazioni

Occhio all'istruzione Disallow!

(in linea teorica non è mai necessaria)

Page 41: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling: raccomandazioni

Occhio all'istruzione Disallow!

(può essere ignorata da Google se la pagina

contiene un pulsante )

Page 42: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling: raccomandazioni

Date una bella letta ai codici di status HTTP!

(gli status 410 danno di tacco ai 404)

Page 43: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling: raccomandazioni

I crawler non "arrivano" da specifiche pagine

(le regole basate sul Referrer non hanno effetto)

Page 44: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling: raccomandazioni

I crawler di Google hanno un IP associato agli USA

(non gestite le lingue dei testi sulla base degli IP)

Page 45: Come funziona l'indicizzazione su Google

Enrico Altavilla

Crawling: raccomandazioni

Frequenza e profondità di crawling variano da sito a sito.

(in base a velocità del server, PageRank, ecc.)

Page 46: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing

Page 47: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing

L'obiettivo del parser è identificare il tipo di informazione e smistarla verso il destinatario più

adatto

Page 48: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing

Il parser analizza i contenuti di ciascuna risorsa in base al proprio formato

Page 49: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing

I contenuti delle risorse HTML vengono separati per tipologia

Page 50: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing

Parole

Meta-informazioni

Link

Page 51: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing

Parole e meta-informazioni vengono inviate all'indexer

Page 52: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing

I link vengono inviati al link graph

Page 53: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing: raccomandazioni

Controllate sempre la validità delle meta-informazioni

(GWT evidenzia errori dei dati strutturati)

Page 54: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing: raccomandazioni

Quando create link, fateli puntare a URL assoluti

(non lasciate al parser il compito di completare da sé eventuali URL parziali)

Page 55: Come funziona l'indicizzazione su Google

Enrico Altavilla

Parsing: raccomandazioni

Invece di link a URL assoluti si può usare il tag HTML <base> ?

(meglio di no)

Page 56: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexing

Page 57: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

Per evitare che Google valuti, l'unica è non fargli percepire il dato

Far percepire i duplicati a Google

Non mischiare rel=canonical con direttive robots

Evitare di usare GWT per de-indicizzare risorse

Page 58: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

Il compito primario dell'indexer è quello di creare l'indice

In questa fase avviene anche parte della canonicalizzazione delle risorse

Page 59: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

convegnogt doc_1

74,123,191

doc_2

9,84

doc_3

11,65

Page 60: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

Nell'indice vengono anche memorizzate informazioni sull'ubicazione della parola (titoli,

corpo, ancora di backlink, ecc.) e la grandezza dei testi

Page 61: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Indicizzazione di testi

convegnogt doc_1 doc_2 doc_3

Page 62: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Indicizzazione di immagini

doc_4 doc_5 doc_6

Page 63: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Indicizzazione di concetti

doc_7 doc_8 doc_9

Page 64: Come funziona l'indicizzazione su Google

Enrico Altavilla

Che cosa significa indicizzare

Page 65: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

Grattacapo SEO: i contenuti da non far indicizzare

Page 66: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

L'istruzione NOINDEX ha perso il significato originario

Page 67: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

Google sostanzialmente indicizza qualsiasi informazione riesce ad acquisire

Page 68: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

Google ha cambiato alla chetichella il significato di NOINDEX

Page 69: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

NOINDEX non significa più "non indicizzare" ma solo "non mostrare per nessuna ragione in SERP"

(fonte: John Mueller)

Page 70: Come funziona l'indicizzazione su Google
Page 71: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

E insomma, che devo fare per indurre il Grande Fratello ad ignorare del tutto una risorsa?

Page 72: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer

Mica semplice…

Page 73: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer: raccomandazioni

Se usate un Disallow in robots.txt eviterete che la risorsa venga indicizzata per le parole che essa

contiene

(ma esistono sempre i testi dei backlink)

Page 74: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer: raccomandazioni

Trucco sconsigliato: Istruzioni Noindex + Disallow in robots.txt

(per ora funziona ma il Noindex nel robots.txt è un'istruzione ufficiosa)

Page 75: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer: raccomandazioni

Soluzione drastica: status HTTP 404/410

(solo se ne accettate le conseguenze)

Page 76: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer: raccomandazioni

La richiesta di rimozione via GWT non è un reale NOINDEX.

(è una brutta pezza)

Page 77: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer: raccomandazioni

Canonicalizzazione: fate percepire i duplicati a Google

(gestiteli con rel=canonical e pannello GWT per i parametri degli URL)

Page 78: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer: raccomandazioni

Canonicalizzazione: occhio al rel=canonical

(non usatelo assieme a direttive meta robots NOINDEX, NOARCHIVE!)

Page 79: Come funziona l'indicizzazione su Google

Enrico Altavilla

Indexer: raccomandazioni

La prima volta in 13 anni che sento che una pagina può dare direttive di indicizzazione che

hanno effetto su altre pagine!

Page 80: Come funziona l'indicizzazione su Google
Page 81: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Page 82: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Page 83: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Un elemento chiave: il contesto

In fase di Search, quasi tutti gli step tengono conto di caratteristiche dell'utente e del

dispositivo usato

Page 84: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Comprensione della query

La query viene spesso modificata/estesa prima di essere usata per estrarre i documenti

Page 85: Come funziona l'indicizzazione su Google
Page 86: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Selezione dei documenti

È il momento in cui gli indici vengono sfruttati

Page 87: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Selezione dei documenti

Le risorse con direttiva NOINDEX non vengono incluse nelle SERP

Page 88: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Filtri e clustering

Da Safe-Search ai filtri anti-spam al clustering di risorse simili

Page 89: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Attribuzione di un ordine (ranking)

È il momento in cui Google sfrutta i famigerati "200 e oltre segnali"

Page 90: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Composizione della SERP

I risultati dei vari indici vengono uniti: questo è Google Universal Search

Page 91: Come funziona l'indicizzazione su Google

Enrico Altavilla

Search

Composizione della SERP

Layout e contenuti variano a seconda del dispositivo e degli obiettivi di leggibilità/usabilità.

Page 92: Come funziona l'indicizzazione su Google

Enrico Altavilla

Riepilogo

Page 93: Come funziona l'indicizzazione su Google
Page 94: Come funziona l'indicizzazione su Google

Enrico Altavilla

Riepilogo

• Studiate e sfruttate il protocollo HTTP

• Controllate che il Disallow non faccia danni

• Aiuta avere server veloci e PageRank

• Grattacapi per i NOINDEX

• Non mischiate rel=canonical e NOINDEX

• Evitate di rimuovere risorse con GWT

Page 95: Come funziona l'indicizzazione su Google

Enrico Altavilla

Domande e approfondimenti

Page 96: Come funziona l'indicizzazione su Google

Proud Member of

Grazie!

Enrico Altavilla

www.searchbrain.it/altavilla