Ottimizzare l’indicizzazione su Google di un documento PDF

Mercoledì 8 Febbraio 2006 - 13:15

di Marco Casario

Adobe World

Presentazioni presso aziende, corsi di formazione e conferenze rappresentano ottimi momenti per scambiare idee e spingersi sempre un po’ oltre rispetto alla routine giornaliera. Personalmente alla fine di ognuno di questi eventi mi sento arricchito e cresciuto, ed imparo sempre qualcosa di nuovo. Oggi, una domanda posta durante una presentazione della suite Acrobat Professional 7, mi ha fatto venire in mente un post per questo blog . La domanda era la seguente:

Come poter rendere i documente PDF più facilmente indicizzabili dai motori di ricerca ?

Con il rischio di ripetere cose che già sapete, devo partire dicendo che da svariato tempo Google è in grado di indicizzare documenti in formato PDF. Ma in che modo il motore di ricerca interpreta questo formato e cosa va a indicizzare, e di conseguenza come noi creatori di PDF possiamo ottimizzare al meglio i nostri risultati ?

Google cerca prima di tutto all’interno del titolo, dell’oggetto e delle keywords del documento (per farla breve tra le proprietà semantiche del documento). Per accedere e visualizzare queste informazioni in Acrobat Professional 7, andate sulla voce di menu File > Document Properties e cliccate sul Tab Description della Document Properties.

Ma queste non sono le uniche accortezze che dovete usare. Ecco allora alcuni consigli pratici per cercare di rendere i nostri documenti PDF facilmente indicizzabili dal motore di ricerca più famoso al mondo:

  • Ordine di lettura (Content Reading Order): rappresenta l’ordine in cui Google sarà in grado di estrarre il testo dal documento per l’indicizzazione
  • Rendere il PDF “tagged” : opzione utilizzata anche per l’accessibilità di un documento PDF, vi si accede da Advanced > Accessibility > Add Tags to Document
  • Mantenere la dimensione del file ridotta: Google non andrà a leggere le centinaia di pagine del vostro pdf, cercate perciò di mantenere il file più leggero possibile e di concentrare le parole chiavi tra le prime decine di pagine
  • Versione del PDF : Google non indicizza la versione 1.6 di PDF, perciò ottimizzate il documento almeno alla versione 1.5

Vista la fusione tra Adobe e Macromedia, già da tempo abbiamo iniziato la fase di studio degli applicativi Adobe e con sorpresa da un paio di mesi a questa parte mi sono reso conto della potenza del formato PDF. Ci sarà da divertirsi!

Tags:

Categoria: Adobe World | Permalink

Commenti

1

Aggiungerei, inoltre, di non scordarsi di mettere nel PDF i link al sito! Capita spesso di arrivare direttamente da un motore ad un PDF e non sapere come passare da lì al sito. Non diamo per scontato, infatti, che tutti si mettano a guardare la URL.

# - postato da Fradefra - 08 Febbraio 2006 - 13:48

2

diciamo che questo non influisce sul ranking sui motori di ricerca, ma migliora l’usabilità e la rintracciabilità del sito :)
Ottimo consiglio !

# - postato da Marco Casario - 08 Febbraio 2006 - 14:05

3

Per quanto riguarda l’accessibilità dei PDF segnalo questa collezione di relazioni:

- www.webaim.org/techniques/acro.....bat/

Sono contenute sia indicazioni sui tag sia suggerimenti generali sulla corretta strutturazione (anche semantica) dei documenti.

# - postato da Piero Fissore - 08 Febbraio 2006 - 14:11

4

ciao Piero,
grzie per il link, ma questo era un post non sull’accesibilità ma sull’ottimizzazione dei documenti PDF per i motori di ricerca.
Di accessibilità parlerò più in la.

# - postato da Marco Casario - 08 Febbraio 2006 - 14:35

5

questo era un post non sull’accesibilità ma sull’ottimizzazione dei documenti PDF per i motori di ricerca

Se per ‘accessibilità’ intendiamo accesso più semplice alle informazioni, allora stiamo parlando della stessa cosa, visto che anche i motori di ricerca sono ‘utenti’, no? :)

E’ ovvio che un documento che segue le regole dell’accessibilità è anche più facilmente indicizzabile. Su questo verteva il mio intervento.

# - postato da Piero Fissore - 08 Febbraio 2006 - 14:40

6

Si, anche se non è vero che un documento ben indicizzato è un documento altamente accessibile.

Infatti ci sono molte altre “accortezze” che uno svilupaptore devi gestire nella creazione di un documento PDF affinchè sia universalmente accessibile.

Per questo avevo intenzione di dedicare un post apposito sull’argomento :)

# - postato da Marco Casario - 08 Febbraio 2006 - 14:54

7

Ciao Marco,
post interessante, specialmente se si tiene conto del fatto che Google ha un occhio di riguardo per i PDF.
Nella mia esperienza a parità di contenuti, un PDF trova un posizionamento migliore.
La cosa è comprensibile se si pensa che solitamente un documento PDF presenta contenuti più approfonditi e utili rispetto alle tipiche pagine HTML.

# - postato da Fabio Sutto - 11 Febbraio 2006 - 12:20

8

ciao mi chiamo Mauro
ho trovato l’articolo molto interessante ma non ho capito una cosa quando parli di indicizzare un documento PDF, in particolare come faccio a dargli un ordine di lettura???

# - postato da mauro - 28 Aprile 2006 - 14:34

9

scusa non so come ma sono apparsi 3 commenti

# - postato da mauro - 28 Aprile 2006 - 14:43

10

scusate, ma se io proteggo il mio file pdf con delle restrizioni per la sicurezza, sapete se il contenutodello stessofile (a patto che sia indicizzato chiaramente) sia letto dai motori di ricerca?

daniel

# - postato da daniel - 24 Settembre 2006 - 10:42

11

Ho visto che per Acrobat 7 hai dato indicazioni. Nel caso realizzassi PDF con Open Office hai qualche suggerimento?

Grazie

# - postato da Maucalbi - 16 Ottobre 2006 - 11:19

12

Vorrei inserire nel mio sito che tratta delle terme di viterbo dei file pdf linkandoli da ogni pagina. Devo creare un menu dei pdf dentro ogni file pdf o questo non è necessario?
grazie da Gianluca.

# - postato da Terme di Viterbo - 14 Giugno 2007 - 17:59

13

salve ragazzi
ho appena constatato una cosa interessante e spero possa esservi utile o comunque chiarire le idee…anche a me!
Ho creato (volutamente) un pdf duplicato di una pagina del mio sito: uale75.googlepages.com/ottimizzazione-pdf.
Per un po’ di tempo è stata in prima pagina con la key “ottimizzazione pdf”, da qualche giorno è sparita (oserei dire penalizzata???) e al suo posto, nella stessa identica posizione, si trova, adesso, il pdf.
Mi viene da pensare che a fronte di una duplicazione di contentui forse il pdf viene preferito ad una pagina htm?
che ne pensate?
ciao!

# - postato da uale75 - 07 Gennaio 2008 - 19:54

14

Per questo un’ottima prassi è quella di valutare l’uso di keywords anche nei documenti stampati che ormai quasi sempre vengono convertiti in pdf e resi disponibili per il download, citati o copiati come ho suggerito in un post del mio blog.

# - postato da Carlo - 17 Ottobre 2011 - 20:16

Inserisci il tuo commento:





(puoi usare i seguenti tag HTML per formattare il testo -
a href, b, i, br/, p, strong, em, ul, ol, li, blockquote, pre):

 

Anteprima del commento