Logo Laterza Fabio Metitieri _blank Riccardo Ridi
Logo Laterza Biblioteche in rete Biblioteche in rete Biblioteche in rete
Logo Laterza IndiceVai all'indice completo AcquistoAcquista il volume su www.laterza.it Torna all'homepage
Editori Laterza

Aggiornamento
giugno 2008

Introduzione

1. Le ricerche bibliografiche

2. Information retrieval:
strumenti e strategie

3. Opac e biblioteca virtuale

4. Biblioteche e Opac
nel mondo

5. Biblioteche e Opac
in Italia

6. Biblioteche
e Opac europei

7. Le biblioteche
e gli Opac statunitensi

8. Opac specializzati,
archivi e musei

9. Oltre i cataloghi: i testi

10. Banche dati: archivi
e host computer in Internet

11. Metarisorse generali
e informazioni per bibliotecari

Principali acronimi utilizzati

Bibliografia

Parte terza – Oltre i cataloghi: testi e banche dati

11. Metarisorse generali e informazioni per bibliotecari

Indici generali del World Wide Web
La ricerca di informazioni in Rete
L'invisible Web e i motori per la ricerca multimediale
I limiti: la crescita della Rete e il «pay for placement»
La nuova rotta di Altavista e le grandi acquisizioni
L’evoluzione dei motori, da A9 a Mooter
Aib-Web e altre risorse per bibliotecari
Liste, periodici e reference desk per bibliotecari


 

Negli ultimi mesi del 2002 sembra essersi avviata un'inversione di tendenza, il cui merito va in gran parte attribuito al crescente successo del «puro» Google, che continua a togliere spazio ai concorrenti meno «obiettivi», preoccupandoli. Di recente, Google ha «rubato» America on line a Inktomi e anche Yahoo! è alla fine approdato a Google, dopo avere usato come partner per le ricerche per parola prima Altavista e successivamente Inktomi (ma in seguito Yahoo! ha cambiato ancora scelta, dato che, come si dirà in seguito, ha acquistato alcuni dei più grandi motori esistenti, compreso Inktomi). Alle sconfitte sul campo si è aggiunta la Ftc, che a giugno del 2002 ha inviato una raccomandazione a diversi motori di ricerca - per ora senza emettere sanzioni - invitandoli a essere più corretti e a distinguere con chiarezza i risultati sponsorizzati da quelli ottenuti dagli algoritmi di ranking.

In questo scenario, il primo a cambiare radicalmente è stato Altavista. Considerato sull'orlo della chiusura da alcuni analisti nel 2001, questo search engine ha rivisto la sua strategia e ristrutturato in modo radicale il suo sito a novembre del 2002, secondo una strategia che vale ancora la pena di riportare, per vedere quali possono essere le scelte e il funzionamento di un grande motore di ricerca.

Secondo gli studi di Altavista, gli utenti dei motori risultano molto infastiditi dalla pubblicità e un po' pigri, poco inclini a eseguire ricerche complesse e a guardare i risultati successivi ai primi dieci o venti. Come prima cosa, quindi, sono stati eliminati i banner in home page, i pop up, i pop under e tutti gli «ads» non mirati o invadenti. Questo non significa rinunciare alle entrate pubblicitarie; Altavista propone infatti agli inserzionisti messaggi più mirati, differenziati per paese e strettamente legati alle parole chiave digitate dall'utente. Il suo secondo obiettivo è diventare il motore più preciso; per questo sono stati attivati filtri più efficaci nel ridurre le duplicazioni e lo spam, in modo da concentrare i risultati migliori nei primi venti posti, ed è stato migliorato il ranking.

È interessante notare anche che l'uso dei booleani da parte dei navigatori risulta molto basso, pari a circa l'1,5% delle ricerche. Dato che un sistema amichevole per favorire l'uso delle ricerche in AND, chiamato Prisma e lanciato con grande enfasi nel 2002, è ora stato eliminato, si può supporre che la maggior parte dei navigatori - probabilmente non solo su Altavista - continui ad avere comportamenti molto rudimentali, spesso con l'uso di un solo termine di ricerca.

Altavista poi ha ripreso a inseguire una buona completezza, portando il suo archivio da 750 milioni a 1,5 miliardi di pagine, con una crescita prevista di 7 milioni di Url al giorno e con nuove funzioni per la ricerca dei file Pdf. Anche il contenuto multimediale è diventato più cospicuo. Il refresh completo degli indici, secondo quanto dichiarato da Altavista, richiede ancora da 45 a 60 giorni, ma la «freshness» prevede aggiornamenti settimanali per i siti ritenuti più importanti e quotidiani per il 50% dei siti più popolari. Per alcune pagine non profit, editoriali o istituzionali, gli spider girano quattro volte al giorno e per la ricerca delle notizie vi è un aggiornamento ogni quarto d'ora su 2.700 fonti prescelte, da tutto il mondo. Per favorire le realtà locali, infine, è stata aggiunta la possibilità di selezionare contemporaneamente più lingue di ricerca.

I «pay for», a parte le inserzioni mirate per parole chiave, indicate chiaramente come tali, dovrebbero essere scomparsi. Per i siti commerciali caratterizzati da un'elevata frequenza di aggiornamento, come il sito di aste on line Ebay <http://www.ebay.com>, resta però la possibilità di pagare per essere indicizzati quotidianamente o più volte al giorno.

Dalla primavera del 2003 alcune grandi acquisizioni hanno rivoluzionato il panorama dei motori di ricerca. L'Altavista appena rinnovato è stato acquisito dal già citato Overture, uno dei motori più orientati verso il ranking a pagamento. Poco dopo Overture ha acquisito anche Alltheweb, ma solo per essere successivamente acquistato in blocco da Yahoo!, che a sua volta aveva da poco preso il controllo anche di Inktomi. Yahoo!, quindi, un tempo una semplice directory, oggi controlla tre grandi motori e il più importante servizio di ricerca commerciale.

In questo mercato così aggressivo, il terzo grande attore, tra Yahoo! e Google, sarà senza dubbio Microsoft, che, come si è visto, dopo quasi due anni di sperimentazioni ha reso pubblico a inizio 2005 il proprio nuovo motore basato su un archivio autonomo <http://search.msn.com>. Già da luglio del 2004, però, la tecnologia di ricerca di Microsoft era stata usata per Newsbot <http://newsbot.msnbc.msn.com>, un sistema che organizza gli articoli di 4.000 fonti on line memorizzando quanto letto in precedenza dall'utente per proporgli nuove informazioni pertinenti ai suoi interessi.