Come funzionano i motori di ricerca e le differenze tra i più usati

Ogni giorno noi cybernauti che utilizziamo internet o reti siamo alla ricerca di informazioni, di diversa natura e interesse. Per risolvere questo problema ci sono i motori di ricerca che fungono da indici per districarsi nell’enormità di informazioni che ci sono nella rete. Iniziamo con un po’ di storia. Appena nacque internet, anzi appena la diffusione diventò tale che qualsiasi utente poteva avere accesso ad internet, cominciò l’esigenza di riuscire a trovare ciò che si cercava senza sapere l’indirizzo di riferimento. Uno dei primi motore di ricerca degno di nota fu Yahoo, il quale indicizzò gran parte dei siti, con un semplice funzionamento, cioè i siti comunicavano la loro presenza a Yahoo, decidendo i rami concettuali appartenenti, detto in parole povere, un sito che vendeva casa era catalogato in VENDITA CASE. Yahoo, oltre ad essere un motore di ricerca, integrava anche sistemi di PORTALE, cioè dagli annunci pubblicitari a gestione di caselle di posta elettronica, e cosa più importante sistemi di link ad aree tematiche, cioè a destra o sinistra dello schermo comparivano aree tematiche con all’interno collegamenti a siti, ovviamente questi link erano a pagamento. Questo sistema esiste ancora oggi, ma ovviamente gli algoritmi (cioè sistemi) di ricerca si sono incredibilmente evoluti. Oggi, data la crescita esponenziale dei contenuti e della velocità, e non per ultimo la sicurezza sui contenuti, il sistema di indicizzazione di Yahoo è ancora valido, ma i server controllano i contenuti dichiarati dai siti e come diretta conseguenza sono nati veri e propri server che gestiscono le indicizzazioni. Oggi il motore di ricerca più usato è ovviamente Google, ma perché. Vediamo nel dettaglio, Google è stato per primo ad inserire un controllo di pertinenza, basato sul quantitativo di clic degli utenti. Mi spiego meglio, ci sono 10 siti che vendono case, quello che in passato ha ricevuto più clic, cioè il più visitato è il primo dei 10. Questo sistema ovviamente è molto affidabile, ma ha un enorme bug, se io dico che quel sito vende case e in realtà fa altro, mi compare nei risultati di ricerca di altre categorie e se è molto cliccato compare sopra ad altri siti, che ovviamente ne ricevono danno. Da circa 2 anni Google effettua uno scrupoloso controllo di questi contenuti e se è stato dichiarato il falso oppure i siti non corrispondono, Google blocca la visione del sito, anzi dato che Google non può bloccarlo direttamente comunica al server in cui risiede che il sistema non è sicuro e che il sito deve essere oscurato. Google ha anche un’altra implementazione. Come detto prima Yahoo doveva avere la comunicazione della creazione del sito e del ramo di appartenenza, oggi questa cosa è vero, ma fino ad un certo punto, Google indicizza oltre che il ramo del sito anche i contenuti di una singola pagina (scritta in html) e quindi la ricerca anche per parola, ciò significa che in base al ragionamento di prima ogni contenuto della pagina deve essere indicizzato dall’utente che deve comunicare l’appartenenza. Ringraziando Google questa cosa non funziona così, Google ha dei ragnetti , cioè dei software che girano per la rete e registrano i contenuti delle pagine del web e dopo comunicano tutto ai server di ricerca che indicizzano. Purtroppo anche questo sistema ha un enorme bug, che per di più è stato scoperto pochi mesi fa, il sistema di indicizzazione funzionava talmente bene che venivano indicizzati anche contenuti che non dovevano essere visti,per esempio contenuti di spazi ftp di aziende o fotografie di persone, violando ovviamente la privacy. Dato che questo bug è stato scoperto oggi Google indicizza “meno elementi”, per esempio i documenti word all’interno delle pagine non vengono indicizzati, proprio perché potrebbero contenere dati sensibili. Alla luce di tutto ciò per le dure leggi di mercato e per il principio della concorrenza altri motori di ricerca si sono inseriti per spodestare Google, e prendersi la loro fetta di mercato. Il principale rivale in questi ultimi mesi è BING direttamente casa Redmond, cioè Microsoft. Quali sono le diversità? All’utente finale compaiono poche differenze, forse qualche discrepanza tra i risultato, ma le diversità a livello tecnico sono abissali. La prima è ovviamente la “giovinezza” di Bing, essendo nuovo la precisione dell’indicizzazione è molto bassa, il vantaggio è l’indicizzazione dei contenuti msn, dato che Bing nasce dalle ceneri di windows live search, dove i contenuti msn e live (come per esempio blog, e live space) già esistono. Altra differenza è il controllo di coerenza che in Google è estremamente superiore. Altra differenza è l’integrazione da parte di Bing di motori commerciali, alias le pubblicità, che in Google sono sensibilmente di meno. Altra differenza sostanziale a favore di Bing è l’integrazione del motore di ricerca nel browser EXPLORER,che ovviamente è della stessa Microsoft. Ovviamente questa considerazioni sono basate su un sistema che è ancora in fase beta, cioè non definitiva, ma lo scontro sarà veramente arduo. Altra differenza è il criterio di indicizzazzione, Bing si basa più sul fattore commerciale e il peso economico che ha il sito nella politica del web, mentre invece Google no, è molto user-friendly, indipendentemente dal mercato web, infatti in Google le pubblicità o comunque le aree pubblicitarie sono evidenziate in giallo oppure sono distaccate dai risultati di ricerca. Ultima considerazione tutti i browser, compreso Bing hanno imparato da google, che ha dettato legge da oramai quasi 10 anni, chissà il futuro cosa ci riserverà, una cosa è sicura, è che Google dovrà combattere per avere il monopolio, si stanno facendo avanti altri motori di ricerca che vogliono togliere spazio a Google

Mariano Chirichella

Donazione sostieni il Gazzettino Vesuviano
Condividi
PrecedenteKarate: Romano e la “sua” India a Boscoreale
SuccessivoIl pinguino e l’opensource.
Il giornale “il Gazzettino vesuviano”, fondato nel 1971 da Pasquale Cirillo e attualmente diretto da Gennaro Cirillo, si interessa principalmente delle tematiche legate al territorio vesuviano e campano; dalla politica locale e regionale, a quella cultura che fonda le proprie radici nelle tradizioni ed è alla base delle tante associazioni e realtà che operano sul territorio.Siamo impegnati a garantire la massima qualità e la massima integrità nel nostro lavoro giornalistico. Ci impegniamo a mantenere alti standard etici e professionali, evitando qualsiasi conflitto di interesse che possa compromettere la nostra indipendenza e la nostra imparzialità.Il nostro obiettivo è quello di fornire ai nostri lettori notizie e informazioni affidabili su una vasta gamma di argomenti, dalle notizie di attualità ai reportage approfonditi, dalle recensioni ai commenti e alle opinioni. Siamo aperti a suggerimenti e proposte dai nostri lettori, e ci impegniamo a mantenere un dialogo aperto e costruttivo con la nostra community.