martedì 11 settembre 2012

Come funziona un motore di ricerca?


Che cosa è un motore di ricerca?

Per definizione, un motore di ricerca Internet è un sistema di recupero delle informazioni, che ci aiuta a trovare informazioni sul World Wide Web. World wide web è l'universo di informazioni in cui tale informazione è accessibile sulla rete. Si facilita la condivisione globale delle informazioni. Ma WWW è visto come una base di dati non strutturati. E 'in crescita esponenziale a diventare un enorme archivio di informazioni. La ricerca di informazioni sul web è quindi un compito difficile. Vi è la necessità di avere uno strumento per gestire, filtrare e recuperare queste informazioni oceanica. Un motore di ricerca serve a questo scopo.

Come funziona un motore di ricerca?

* I motori di ricerca sono motori di ricerca web che cercare e recuperare informazioni sul web. La maggior parte di loro usano l'architettura indicizzatore crawler. Essi dipendono i loro moduli cingolati. Crawlers indicato anche come ragni sono piccoli programmi che navigano il web.

* I Crawlers sono riportati una serie iniziale di URL cui pagine si recuperare. Estraggono gli URL che appaiono sulle pagine scansionate e dare queste informazioni al modulo di controllo crawler. Il modulo crawler decide quali pagine visita successiva e dà loro URL indietro i crawler.

* Gli argomenti trattati dai motori di ricerca diversi, varia secondo gli algoritmi che usano. Alcuni motori di ricerca sono programmati per cercare siti su un argomento particolare, mentre i crawler in altri può essere la visita di pagine il più possibile.

* Il modulo di controllo crawl 'vietato utilizzare il collegamento grafico di una scansione precedente o possono utilizzare i modelli di utilizzo per aiutare nella sua strategia di crawling.

* Il modulo indicizzatore estrae le parole formano ogni pagina che visita e registra il suo URL. Essa si traduce in una tabella di ricerca di grandi dimensioni che fornisce un elenco di URL che puntano a pagine in cui ogni parola si verifica. La tabella elenca le pagine, che sono stati trattati nel processo di scansione.

* Un modulo di analisi di raccolta è un'altra parte importante dell'architettura motore di ricerca. Si crea un indice di utilità. Un indice di utilità possono fornire accesso alle pagine di una determinata lunghezza o pagine contenenti un certo numero di immagini su di essi.

* Durante il processo di scansione e indicizzazione, un motore di ricerca memorizza le pagine che recupera. Essi sono temporaneamente memorizzate in un repository pagina. I motori di ricerca mantenere una cache di pagine visitate in modo che il recupero di pagine già visitate accelera.

* Il modulo di query di un motore di ricerca riceve le richieste modulo di ricerca agli utenti sotto forma di parole chiave. Le tipologie modulo ranking dei risultati.

* L'architettura indicizzatore crawler ha molte varianti. Si è modificato in architettura distribuita di un motore di ricerca. Queste architetture motori di ricerca sono costituiti da raccoglitori e broker. Raccoglitori di raccogliere informazioni di indicizzazione dai server web, mentre i broker danno il meccanismo di indicizzazione e l'interfaccia di query. Brokers aggiornare gli indici sulla base delle informazioni ricevute dai raccoglitori e altri intermediari. Essi possono filtrare le informazioni. Molti motori di ricerca di oggi utilizzano questo tipo di architettura.

Motori di ricerca e Ranking Pagina

Quando si presenta una query a un motore di ricerca, i risultati vengono visualizzati in un ordine particolare. La maggior parte di noi tendono a visitare le pagine nell'ordine in alto e ignorare quelle oltre le prime. Questo perché riteniamo le pagine migliori poche a sopportare la maggior rilevanza per la nostra query. Quindi, tutti interessati in classifica nel loro pagine i primi dieci di un motore di ricerca.

Le parole specificate nell'interfaccia di query di un motore di ricerca sono le parole chiave, che sono ricercati dai motori di ricerca. Essi presentano un elenco di pagine relative alle parole chiave interrogati. Durante questo processo, i motori di ricerca recuperare quelle pagine, che hanno frequenti occorrenze delle parole chiave. Cercano interrelazioni tra le parole chiave. La posizione delle parole chiave è anche considerato mentre le pagine di rango che li contengono. Parole che si verificano nei titoli delle pagine o negli URL viene data maggiore peso. Una pagina con link che puntano ad esso rende più popolare. Se molti altri siti il ​​collegamento a una pagina, è considerato prezioso e più rilevanti.

Vi è in realtà un algoritmo di ranking che ogni motore di ricerca utilizza. L'algoritmo è una formula computerizzato ideato per abbinare le pagine rilevanti con una query dell'utente. Ogni motore di ricerca può avere un diverso algoritmo di ranking, che analizza le pagine nel database del motore di s per determinare le risposte pertinenti alle query di ricerca. Diversi motori di ricerca indice di informazioni in modo diverso. Questo porta al fatto che una query particolare prima di mettere due motori di ricerca distinte possono scaricare le pagine in ordine diverso o possono recuperare diverse pagine. Sia la parola chiave, nonché la popolarità sito sono i fattori che determinano pertinenza. Click-through popolarità di un sito è un altro fattore determinante del suo rango. Questa popolarità è la misura di quanto spesso il sito è visitato.

Webmasters cercare di ingannare gli algoritmi dei motori di ricerca per aumentare le fila dei loro siti. I trucchi includono home page molto popolare di un sito con parole chiave o l'uso di meta-tag per ingannare le strategie di posizionamento sui motori di ricerca. Ma i motori di ricerca sono abbastanza intelligenti! Continuano a rivedere i loro algoritmi e programmi contro i loro sistemi in modo che noi, come i ricercatori caduta preda don t a pratiche illegali.

Se sei un ricercatore serio, capire che anche le pagine oltre le prime nell'elenco possono avere un contenuto serio. Ma vi assicuro sui motori di ricerca buoni. Saranno sempre di portare le pagine di grande interesse in ordine top!

Nessun commento:

Posta un commento