Cercare e trovare
Un search engine (= motore di ricerca) non e' altro che un sistema specializzato
nel trovare un qualcosa nell'immensità del materiale presente su Internet. Questo
qualcosa può essere un determinato file, informazioni su un argomento, un manuale, un
e-mail... e noi dovremo richiederlo con delle parole.
Ma partiamo dal principio. I motori sono database (=archivi) realizzati -ed aggiornati-
secondo due tipi di procedure.
La prima e' di tipo automatico. Degli algoritmi specializzati (=spider/agenti/robot)
analizzano ogni URL (o meglio la relativa pagina) ed estraggono i termini più idonei
(=keyword) ad identificarne i contenuti (ogni pagina sarà indicizzata con alcune
keyword,
ogni keyword punta a svariate pagine). Il metodo è semplice, veloce ma poco preciso: una
nostra interrogazione può restituire una marea di URL per la maggior parte poco
significativi.
La seconda è manuale. Le pagine vengono osservate da persone in carne ed ossa che
valutano con quali keyword indicizzarla. In questo caso l'interrogazione otterrà
URL molto
attinenti. Purtroppo, dato il costo e la lentezza del metodo, questi database contengono
relativamente pochi URL : rischiamo di non trovare le pagine che più ci avrebbero
interessato.
Per interrogare l'engine inseriamo delle keyword ed il database ci restituirà
i
corrispondenti URL. In pratica quando andiamo sull'engine otteniamo un form (=modulo) dove
indicare le parole. Queste potranno essere legate fra loro da operatori logici OR AND
NOT,
rappresentati da simboli come + ( " -. Purtroppo non esistono regole di
interrogazione assolutamente standard ed e' quindi fondamentale leggere le istruzioni/FAQ
di quel determinato engine. Possiamo però darvi un suggerimento: partiamo usando le tre
parole che descrivono meglio quello che stiamo cercando, 'leghiamole' con il simbolo + e
scriviamo per prima quella più significativa, ad esempio <"Led Zeppelin" +
official + homepage> con "Led Zeppelin" più significativa. Traducendo
abbiamo chiesto gli URL di pagine contenenti contemporaneamente "Led Zeppelin",
official ed homepage.
Alcuni motori permettono ricerche ad albero(=directory): nella prima pagina troveremo una
serie di argomenti che puntano a sottoargomenti ecc ecc. Basterà scendere in profondità
per trovare -forse- quello che cerchiamo.
TOP
I principali motori
Il motore per definizione e' YAHOO,
non per niente è il sito più visitato al mondo... E' mantenuto da umani e per quanto
detto sopra è preciso ma non vastissimo. Permette ricerche ad albero.
Se invece vogliamo la quantità ecco ALTAVISTA
con le sue centinaia di milioni di pagine indicizzate. Seguono EXCITE, INFOSEEK e LYCOS
Menzione a parte merita HOTBOT,
considerato quello con i migliori algoritmi di indicizzazione e con un potente -ma
difficile da usare- sistema di interrogazione.
Esistono anche i meta (o multi) search : con un solo form interrogano i principali motori
(non dispongono di propri database), organizzano i risultati e li presentano in una
singola schermata. Il più noto e' METACRAWLER
TOP
I motori italiani
Esistono degli ottimi search engine che operano sui soli siti italiani (si fanno
ricerche usando parole italiane e si ottengono risultati in italiano).
Il più potente e' VIRGILIO (permette
anche ricerche ad albero), seguito a ruota da ARIANNA , SUPEREVA
e KATALOGO.
Esistono anche le versioni localizzate dei principali motori come LYCOS.IT , YAHOO.IT ed EXCITE.IT
Ancora più incredibile esiste il multisearch KAMUS
TOP
Motori specializzati
Molto interessanti sono i news engine per ricerche nei newsgroup
(scansionano i
testi dei messaggi). Segnaliamo per una ricerca classica sulle parole DEJA e SIFT.
Per estrarre tutti gli URL che sono stati nominati in un certo newsgroup usiamo GER
Se vogliamo un certo software è meglio 'urlare' le varie raccolte: non permettono
ricerche sofisticate ma troveremo sicuramente l'ultimo aggiornamento di tutto il miglior
Share e Free mondiale. I migliori sono TUCOWS,
SHAREWARE e FILEZ
Ennesimo tema di ricerca è quello relativo alle informazioni sulle e-mail, o meglio sui
loro proprietari. E' possibile usare chiavi di ricerca come cognome provider città etc
etc. Alcuni nomi: FOUR11 e IAF e BIGFOOT
Per cercare un determinato host ecco un domain name search come WUSTL Ad esempio
se vi serve il sito della societa' Nec digitate -nec- ed otterrete
-www.nec.co.jp-.
Ci servono delle immagini per abbellire la nostra homepage? Ecco AV PHOTOFINDER oppure I-SURF. Sono molto validi:
presentano delle piccole anteprime delle varie immagini disponibili, scegliamo la migliore
e scarichiamo solo quella.
E di crack ? Linkate Astalavista
TOP
Registrarsi nei
motori
Tutti motori danno la possibilità di auto-indicizzare una pagina mediante la
compilazione di un semplice form. Se vogliamo segnalare ai principali engine l'esistenza
della nostra homepage dobbiamo per forza contattarli uno per uno? Sì e no. Ci sono
programmi o siti che permettono di indicizzare un sito a molti motori contemporaneamente:
riempiamo un solo form ed il gioco è fatto.
Se invece si vuole un lavoro fatto bene, allora si chiama antipodi!
Una cosa molto intelligente consiste nell'inserire degli appositi tag META in tutte le
nostre pagine html. Questi tag vengono usati per facilitare il lavoro agli agenti
software/umani dei search engine.
<HEAD>
<TITLE> Titolo della pagina </TITLE>
<META NAME="description" CONTENT="frase di descrizione meta">
<META NAME="keywords" CONTENT="parole , per , descrivere">
</HEAD>
La pagina in questione sarà indicizzata con le keywords usate per descrivere (separate da
virgole!!) e ogni volta che il motore la darà come risultato verrà descritta con Titolo
della pagina (evidenziata e linkante la pagina) seguita dalla frase di descrizione meta.
Alcuni motori esaminano anche il Titolo della pagina , assicuriamoci che il testo abbia
attinenza con il contenuto.
Se invece vogliamo che la una nostra pagina sia ignorata (= non indicizzata) dai vari
agenti usiamo questo tag:
<HEAD>
<META NAME="robots" CONTENT="noindex">
</HEAD>
TOP