Le Web invisible

Publié le 2 Novembre 2008

 

Que se cache-t-il derrière la notion de Web invisible ?

 

Plongez ici dans les profondeurs du web...

 


Web invisible = Web profond = Web caché, traduction du terme anglais deep Web.


C'est l'ensemble des pages non localisées et/ou non indexées par les moteurs de recherche classiques. Autrement dit et pour reprendre la métaphore usuelle : la partie immergée de l'
iceberg. Selon les sources, on estime que son étendue équivaut de 250 à près de 600 fois plus que le Web visible ou de surface.


Qu'elles pages ne seraient pas localisées et/ou indexées ?

 

  • Les pages à accès restreint, ou protégées par mot de passe (Intranet, Extranet, espaces réservés aux membres...)
  • Les pages dont le référencement est volontairement interdit à l'aide d'un fichier robots.txt
  • Les pages utilisant une technologie trop complexe pour les outils (Flash, Javascript…)



Ainsi, ce n'est pas parce que l'on fait une requête - aussi pertinente soit-elle - sur Google (au hasard) que nous pourrons avoir une quantité exhaustive de réponses ! Le fantasme du moteur ou métamoteur tout-puissant est donc à oublier. Les pages populaires ne sont pas forcément les plus pertinentes... D'où l'importance de forger son esprit critique, de relativiser les ressources qui semblent mises à disposition et de prendre conscience de l'étendue du Web dans son ensemble.


C'est là qu'apparaît l'idée du Web sémantique : 

Aujourd’hui, le contenu du web est fait pour des lecteurs humains, mais pas pour des ordinateurs. Comme il y a de plus en plus de pages web et que les moteurs de recherche ne comprennent pas le sens des documents, leurs recherches sont - ou du moins deviendront - de moins en moins efficaces. Le concept du Web sémantique repose sur l'idée de permettre une recherche intelligente basée sur des définitions que les ordinateurs puissent « comprendre ». Il faut mettre à disposition un langage de recherche qui rende le contenu du Web intelligible. Autrement dit, qui lui donne un sens, c'est la signification du mot « sémantique ». C'est Tim Berners-Lee qui a fait émerger ce concept en 2001. Depuis, lentement mais sûrement, le W3C s'est attelé à la définition de standarts et ontologies.


Pour aller plus loin, des références utiles :

La définition du Petit dictionnaire des concepts info-documentaires de Pascal Duplessis et Ivana Ballarini sur SavoirsCDI,
Une approche du Web invisible par Christophe Asselin sur Intelligence-center,
La Théorie du noeud papillon de Ghislain Chasme sur DocspourDocs,
Une introduction au Web sémantique sur Internenettes.
 

Rédigé par Nota bene*

Publié dans #Je veille

Partager cet article

Commenter cet article