Motori di ricerca
Un motore di ricerca è un sistema automatico che aiuta gli utenti a trovare i siti o le informazioni desiderate sul web. Il sistema innanzitutto analizza un insieme di dati tramite appositi programmi detti crawler, spider o robot, i quali visitano automaticamente gli URI contenuti nel database del motore, aggiornando di volta in volta il database stesso. La catalogazione del materiale ottenuto segue criteri specifici che variano da motore a motore. Un URI (Uniforme Resource Identifier) è una sequenza di caratteri che identifica univocamente una risorsa: l’indirizzo di un sito web (più comunemente detto URL), un documento, un'immagine, un file, un indirizzo di posta elettronica, eccetera. Infine il motore restituisce un indice dei contenuti disponibili classificandoli in base al grado di rilevanza rispetto alla richiesta dell’utente. Per stabilire l’importanza di un sito il sistema cerca nel database gli URI che corrispondono a pagine (oppure file, documenti…) contenenti una o più parole chiavi inserite dall’utente nella casella di ricerca. A questo punto, ogni motore utilizza un proprio algoritmo per ordinare le pagine controllando, per esempio, quante volte le parole chiave vengono ripetute, quanti link riceve quel documento, in quali punti della pagine sono poste le parole chiave, quanti siti del database contengono link verso quella pagina, o quante volte un utente ha visitato quel sito dopo una ricerca. La maggior parte dei motori di ricerca forniscono anche dei risultati sponsorizzati: link a siti internet di aziende che hanno pagato per apparire tra i primi risultati quando un utente esegue una ricerca inerente al campo in cui operano.
Con funzione affine ai motori, ma con struttura sostanzialmente diversa sono le directories, organizzate a indice, che forniscono elenchi di siti suddivisi per argomenti.
Il motore più utilizzato al mondo è Google. Dietro a questo troviamo, nella classifica mondiale, Live di Microsoft, Yahoo Search (che però è una directory divisa per argomenti, in ognuno dei quali sono evidenziate le pagine più importanti e le novità) e Ask. Quelli italiani più cliccati sono Libero e Virgilio, recentemente diventato un redirect ad Alice.it, ma in realtà entrambi utilizzano Google aggiungendo, nel caso di Virgilio, soltanto alcuni propri risultati sponsorizzati. Yahoo Search è usato invece da Altavista, Kataweb e Alltheweb, mentre Excite sfrutta Ask, e Hotbot utilizza Ask o Live a discrezione dell’utente che può scegliere il motore preferito tra i due o, eventualmente, confrontare i risultati della ricerca fatta con entrambi.
La maggior parte dei motori di ricerca che opera sul web è gestita da compagnie private che utilizzano algoritmi proprietari e “prestano” dunque, a pagamento, il proprio servizio a siti minori, come abbiamo visto nei casi sopra elencati. Esistono però anche alcuni motori di ricerca fondati sul principio del software libero, come HTdig, Nutch, Egothor e OpenFTS.
In questa sede daremo maggior enfasi ad alcuni motori poco conosciuti, ma che operano in ambiti più ristretti e settoriali o con modalità particolari, e possono pertanto risultare interessanti per le specifiche ricerche degli utenti:
Findsound (www.findsounds.com) permette di trovare suoni di ogni tipo, dai rumori della natura al rombo di un motore, dal suono di una chitarra a quello di una voce, inserendo una o più parole chiavi in inglese. È possibile scegliere il formato e la dimensione massima dei file, la risoluzione e la frequenza dei suoni.
Deyla (www.deyla.com) cerca siti accessibili, secondo le regole del W3C.
Picsearch (www.picsearch.com) è un motore dedicato alle sole immagini.
Lycos (www.lycos.it) si trova a metà strada tra un motore e un portale: comprende alcuni servizi utili come l’invio di sms e cartoline virtuali, traduzioni, giochi, annunci, possibilità di segnalare il proprio sito.
Smomoc (www.smomoc.com) offre alcune linee guida che aiutano i meno esperti a comporre le richieste ai motori di ricerca, in modo da centrare l’obiettivo più facilmente.
Mamma (www.mamma.com) e Searchbuddy (www.searchbuddy.com) sono metamotori o metacrawler, cioè sistemi di ricerca che utilizzano più motori contemporaneamente per offrire risultati più completi.
Tags: crawler - deyla - findsound - lycos - mamma.com - motore di ricerca - pichsearch - searchbuddy - smomoc - URI |