Le pagine gateway
sono normali pagine web, scritte in linguaggio HTML come tutte
le altre, che però vengono ottimizzate traguardando una specifica
parola chiave ("keyword") ed uno specifico motore
di ricerca al fine di risultare in cima ai risultati forniti
dal motore per quella particolare parola.
I motori di ricerca ricevono dai webmaster e dagli utenti segnalazioni
di siti da indicizzare. Il processo è, di solito, totalmente automatizzato
e viene svolto interamente attraverso il web. Altrettanto automatico
è il processo di catalogazione e indicizzazione del sito, che
avviene tramite un apposito software di cui ogni motore dispone,
chiamato "spider", che visita i siti ed inserisce le
caratteristiche delle pagine nella banca dati del motore. Ancora
automatica è la risposta del motore alle interrogazioni degli
utenti, le quali scatenano una ricerca sulla banca dati in base
alle parole chiave fornite in maniera molto simile ad una query
su di un database relazionale.
L'ordine con cui vengono
presentati i link segue un criterio di maggiore o minore pertinenza
delle pagine o del sito alla richiesta, calcolata tramite regole
proprietarie e non di pubblico dominio, differenti per ciascun
motore.
Tramite un attento studio delle pagine migliori classificate,
è possibile definire con buona approssimazione quali parametri
sono utilizzati da ogni motore per definire la classifica. Variabili
come la lunghezza complessiva della pagina, i contenuti del titolo
e delle intestazioni, i link presenti sulla pagina, la frequenza
e la distribuzione delle parole chiave nel testo e così via possono
venire adattate per uno specifico motore e per una specifica keyword.
Una pagina gateway normalmente si presenta come una breve pagina
introduttiva che riassume i contenuti del sito e presenta
dei link alle vere e proprie pagine del sito stesso. In questo
modo al visitatore viene offerta la possibilità di valutare in
maniera rapida se i contenuti del sito sono di suo interesse o
meno, in maniera analoga a quando accede alla home page.
E' da rilevare che
molte home pages sono geneticamente inadatte ad un buon posizionamento
perché, benché di aspetto accattivante, contengono poco testo
e molte immagini, che non forniscono al motore la "materia
prima" in base a cui indicizzare la pagina.
I motori di ricerca sono spesso bersaglio di tentativi eticamente
non condivisibili di posizionamento. Sfruttando l'indicizzazione
automatizzata e non sorvegliata, molti sottopongono centinaia
di pagine a ripetizione, registrano pagine con keyword non attinenti
ai contenuti ma molto diffuse (sex, mp3, free etc.), intercettano
lo spider quando visita il sito e gli servono pagine ottimizzate
per il posizionamento che l'utente normale non vedrà mai perché
vengono immediatamente sostituite da altre, graficamente migliori
ma senza nessuna ottimizzazione e così via.
Queste tecniche possono
avere un successo solo momentaneo perché chi gestisce i motori
non gradisce l'indicizzazione di cianfrusaglie con poca o nessuna
utilità per l'utente. I siti che mettono in atto queste strategie
vengono spesso completamente banditi dai database dei motori.
L'unica metodologia universalmente accettata e, talvolta,
incoraggiata è quella delle pagine gateway che, in maniera completamente
pubblica e trasparente, forniscono un servizio a chi le
visita. Per questo motivo, è anche consigliabile che chi ne fa
uso, non combatta strenuamente per ottenere la prima posizione
in assoluto, che non da vantaggi molto superiori alla quindicesima,
ma lasci che gli algoritmi del motore decidano la pertinenza delle
pagine alla ricerca impostata dall'utente.
Torna all'indice Generale del corso di Corso sui Motori di Ricerca di Software Planet