Quand on cherche... on trouve ?

Publié le 27 Août 2009

Un moteur de recherche (searchbot en anglais) est une application spécifique chargée d'indexer des pages web afin de permettre une recherche à l'aide de mots-clés dans un formulaire de recherche.

Des robots (logiciels), appelés spiders ("araignées" en français) doivent parcourir la toile en suivant les liens des millions de pages Web et indexer le contenu dans de gigantesques bases de données afin de permettre leur interrogation.

Aucun moteur de recherche ne peut parcourir la totalité des pages en une journée (ce processus prend généralement plusieurs semaines), chaque moteur adopte donc sa propre stratégie, certains allant même jusqu'à calculer la fréquence de mise à jour des sites.

Lorsque l'utilisateur d'un moteur de recherche remplit le formulaire, il spécifie les mots qu'il cherche (et éventuellement ceux qu'il ne souhaite pas voir apparaître) grâce aux opérateurs booléens. Les réponses apportées sont classées dans un ordre de pertinence, correspondant à des critères propres au moteur de recherche, tels que le pourcentage de mots correspondant à la recherche, leur indice de densité (le nombre d'occurence de chacun des mots clés dans la page), etc.

On appelle "métamoteur" un outil de recherche dont le fonctionnement est basé sur l'exploitation des résultats d'autres moteurs de recherche.

 

"Après le bug de Google en février 2009 pendant près d’une heure, la nécessité de trouver des choix alternatifs à Google s’est fait davantage sentir. Utiliser un autre moteur de recherche ne doit cependant pas rimer avec moins d’efficacité dans sa recherche. Depuis quelques années, de nombreux moteurs de recherches ont émergé et ont cherché à se démarquer du modèle prépondérant en développant de nouvelles idées."

C'est une des raisons qui a encouragé Saamarande à publier sur le site du CRDP du Midi-Pyrénées un Panorama des différents moteurs de recherche existant en 2009.



Quelques liens à connaître/consulter sur la question :

 

 
"Il vaut mieux savoir tout chercher que chercher à tout savoir." [P. Mendelson]
 

 

Rédigé par Nota bene*

Publié dans #Je veille

Partager cet article

Commenter cet article

Nota bene* 29/08/2009 23:14

Sans oublier la mention du fameux principe de fonctionnement de Google qui a fait son succès : le PageRank."Lorsqu'un document est pointé par de nombreux hyperliens (poularité de liens), son PageRank augmente. Plus son PageRank est élevé, plus il aura de chance d'être affiché dans les premiers résultats d'une recherche. Ce système donne une indication de la popularité du document parmi les autres documents du web. Ce principe a immédiatement été un succès, car il a permis des résultats plus pertinents que les autres moteurs de recherche qui se contentaient de comptabiliser les mots-clés insérés dans les pages des sites. Il a également permis ce que l'on appelle le bombardement Google." [Source : Wikipédia]