In chat con GoogleBot

Lunedì 3 Aprile 2006 - 12:20

di Simone Carletti

Motori di ricerca

A metà marzo Chris Boggs, moderatore di SearchEngineWatch, ha aperto sul forum un curioso thread chiamato Googlebot called me on my Timpani Live Help, ovvero Google mi ha chiamato nel mio Timpani Live Help.

Timpani Live è una delle applicazioni che compongono il sistema di assistenza remota di LivePerson, una piattaforma di chat normalmente usata come servizio di assistenza diretto.

L’applicazione è basata su JavaScript e questo rende l’evento ancora più curioso poiché è opinione comune che i motori di ricerca non interpretino i contenuti JavaScript.

Proseguendo nel thread, è possibile visualizzare i dettagli della hits estrapolati dai log del server e postati da Chris.


Browser Googlebot/2.1 (+http://www.google.com/bot.html)
Host address crawl-66-249-64-44.googlebot.com
Host IP 66.249.64.44
Country United States
City Mountain View
Organization GOOGLE
World Region California
Postal Code 94043
Time Zone America/Los_Angeles
ISP GOOGLE
Connection Type Unknown

Le informazioni escludono di fatto che l’azione sia stata compiuta da un utente che abbia volontariamente modificato la propria user agent.

Ma i misteri non si fermano qui.
Proseguendo ancora nel thread è possibile consultare un post di GoogleGuy. Una sola frase che più che chiarire la posizione dello spider di Google mischia ancora una volta le carte in tavola.

I’d slap a nofollow on any link that you don’t want Googlebot to follow, just to be safe.

Ovvero, per evitare che Googlebot segua i vostri link è sufficiente inserire la direttiva nofollow. Insomma, nessuna conferma e nessuna smentita sul comportamento dello spider che tuttavia sembrerebbe chiaro a sufficienza.

Alcuni ipotizzano che, nell’epoca del web2.0, Google si sta attrezzando per interpretare JavaScript e le applicazioni AJAX based. I dati, anzi i log, sembrano parlare da soli.

A proposito di parlare… chissà cosa mai avrà detto in chat Googlebot a Chris!

Tags:

Categoria: Motori di ricerca | Permalink

Commenti

1

Mi sembra davvero assurda sta cosa :)

# - postato da Stefano - 03 Aprile 2006 - 13:13

2

Le informazioni escludono di fatto che l’azione sia stata compiuta da un utente che abbia volontariamente modificato la propria user agent.

Io non vedo nessuna esclusione di fatto.
Facendola semplice, quindi senza tirare in mezzo lo spoofing, qualsiasi dipendente di google può uscire facilmente in rete con quelle informazioni.

# - postato da Skid X - 03 Aprile 2006 - 13:32

3

@ Skid
Io infatti ho sottolineato che è da escludere che si tratti di un utente, non di un dipendente/umano by Google.

Ad ogni modo resta da considerare che in base ai log il fattore umano era scarsamente considerabile.

# - postato da Simone Carletti - 03 Aprile 2006 - 14:16

4

Non è difficile prendere un ip di google

Basta che vai su www.google.com/gwt/n ed apri un sito lasci l’ip di google . Poi ti cambi user agent ed il gioco è fatto. Una volta ho fatto uno scherzo ad uno dicendo che ero Matt Cutts e ci ha creduto alla stragrande :)

# - postato da Stefano - 03 Aprile 2006 - 14:24

5

Stefano, un conto è lasciare l’IP, un conto è comportarsi e procedere come Google e nello specifico come un Googlebot.

Chris Boggs non è di certo l’ultimo utente sulla terra, credo che prima di postare una comunicazione del genere abbia fatto i suoi conti. ;o)

Nulla ovviamente certifica che la sua deduzione sia reale.

# - postato da Simone Carletti - 03 Aprile 2006 - 14:34

6

Ma certo non lo metto in dubbio che sia che in gamba ma intanto non ha neppure detto cosa gli è stato detto.

Anche io una volta avevo pensato di dire che il bot di Yahoo collaborava con il Governo Americano per combattare il terrorismo solo per far prendere dei link al post ….

Con questo non sto dicendo assolutissimamente che sia una bugia o che Chris Boggs sia un idiota o che liveperson o sew non siano siti autorevoli ma ……

Cmq potrebbe più che essere che l’abbia fatto

# - postato da Stefano - 03 Aprile 2006 - 14:39

7

LivePerson è basata su JS ma ha funzioni base ( i button ) formati da html puro.
Il bot interpreta il form come elemento da “bucare” per accedere a nuove risorse, come capita per le newsletter.

P.S. che google non legga i JS è solo un luogo comune, bisogna adottare la mentalità del browser nello stato di finder e di algoritmo in stato di parsing per i calcoli del ranking.

saluti

# - postato da Stealth - 03 Aprile 2006 - 22:25

8

Volevo solo dire che qualcuno si è divertito a far postare Matt Cutts nel mio blog…

# - postato da Giorgio Taverniti - 06 Aprile 2006 - 07:52

9

bell’articolo

# - postato da Chat gratis - 03 Febbraio 2011 - 12:06

Inserisci il tuo commento:





(puoi usare i seguenti tag HTML per formattare il testo -
a href, b, i, br/, p, strong, em, ul, ol, li, blockquote, pre):

 

Anteprima del commento