Comprendre le deep web


Tant de choses ont déjà été écrites sur le deep web (web profond en Français), on trouve énormément de choses, beaucoup d’erreurs, d’approximations, qui amènent à de nombreuses confusions dans les esprits des internautes, parfois même les plus compétents. Alors qu’est-ce véritablement que le deep web ? Et comment accéder au deep web ?

Nous allons vous proposer dans cet article un petit tour d’horizon du deep web, en essayant de démêler le vrai du faux pour enfin nous projeter sur l’avenir.

Nous ne prétendons pas révolutionner la recherche de sites ou d’informations dans le deep web mais souhaitons vous donner une vision un peu plus claire de toutes ces choses profondes ou sombres afin de tenter de déceler les enjeux de demain.

Le deep web : qu’est-ce que c’est ?

Le deep web est à mettre en opposition avec le web surfacique. La première comparaison qui vient à l’esprit des gens est celle de l’iceberg. Seule une infime partie de la masse flottante est visible, le reste est immergé. Il en serait de même pour le web. Le web surfacique regrouperait l’ensemble des sites et pages internet, référencés, indexés par les moteurs de recherche (Google, Bing et autres). Cette partie représenterait en tout est pour tout 15% des pages web hébergées sur l’ensemble des serveurs.

Le reste, 85%, représenterait, vous l’aurez deviné, le deep web.

Pour résumer de façon très simple, si une page dont vous avez connaissance n’est pas sur Google, alors elle fait partie très probablement du deep web.

Mais cette vision de l’iceberg est erronée et nous lui préférons celle introduite dans l’article Secrets of the Dark Web écrit par Heidi R. pour une société américaine sensiblement équivalente à la notre. Cet article nous propose une infographie donnant une vision plus claire du deep web dans le monde d’internet et introduisant le fameux dark net (nous en reparlerons par la suite).

deep web info

Nous avons planté le décor, dit comme cela, le deep web ressemble beaucoup moins à un repère de mafieux ou trafiquants en tout genre comme on le décrit souvent.

Alors pourquoi ces millions de pages ne sont-elles pas indexées ?

La première raison est évidemment parce que l’auteur de ces pages ne souhaite pas les indexer, pour une raison ou pour une autre.

Ensuite, de nombreux sites possèdent des parties privées, accessibles par mot de passe (intranet, blog privé), sont bloqués par des captchas empêchant les robots de Google (et autres moteurs bien sûr) de scruter leur page.

Enfin, certain format de fichiers restent non répertoriables par les différents moteurs de recherche. Ce fut le cas longtemps des fichiers pdf ou issus de la suite Microsoft Office.

Comment accéder au Deep Web ?

C’est ici que l’audience de ce post se divise en deux parties : ceux qui ont lu le début, et ce, à la recherche de recette magique, qui ont scrollé directement jusque ici ! Et oui, vous êtes démasqués !

Evidemment, la réponse à comment accéder au deep web est simple : avec votre navigateur habituel ! Le deep web regroupe certes l’ensemble des pages non indexées, mais si vous avez l’adresse url de la page non indéxée, alors allez-y… Beaucoup confondent, mais le deep web est :

  1. Pas moins sûr que le web surfacique,
  2. Accessible sans aucun autre logiciel supplémentaire que votre navigateur habituel.

Un exemple pour démystifier tout cela. Sur le site Reputation Hunter, nous avons plusieurs pages non indexées, volontairement… Donc certaines pages de Reputation Hunter sont dans le deep web… Pour y accéder, il faut connaître l’adresse exacte, sans quoi vous allez tomber sur la page 404.

Prenons l’exemple de notre page quiz que nous n’avons pas, sciemment, indexé. Vous pouvez y accéder par ce lien. Mais elle n’est pas indexée dans Google ou autre. Voilà, vous avez accéder au deep web!

Une question complémentaire qui pourrait vous venir, est : existe-t-il justement des moteurs de recherche ciblant le deep web, soit un moteur de recherche indexant les pages non indexées par Google, pour faire simple. La réponse, comme les résultats de ces moteurs, sera incomplète. Il existe bien des moteurs complétant Google, mais ne vous attendez pas à quelque chose de révolutionnaire.

Il s’agit de Gallica, BASE ou d’autres sites institutionnels comme celui du CNRS par exemple.

Et le dark net alors, c’est quoi ce truc ?

Certains vont rester sur leur faim… Pensant trouver certainement ici leur porte d’entrée pour le dark net. Alors qu’est-ce donc que ce dark net ?

Le dark net est un sous ensemble du deep web, car non indexé par les moteurs traditionnels d’internet. Néanmoins (c’est son côté dark), il n’est pas accessible directement via votre navigateur habituel. Le dark net est un réseau privé virtuel, anonyme. Pour ces raisons, les dark nets sont souvent associés avec la communication de type dissidence politique ou autres activités illégales.

Pour y accéder, il faut utiliser des logiciels particuliers, comme FreeNet ou GNUnet. Le logiciel TOR est actuellement le plus utilisé pour accéder, de façon anonyme, au réseau sombre, se caractérisant par des adresses se finissant en .onion.

Nous vous avions expliqué à l’époque pourquoi et comment utiliser TOR, vous pouvez continuer de vous y référer, les conseils sont toujours valables. Encore une fois, couplez l’utilisation de TOR avec un VPN!

Le moteur de recherche Grams est utilisé pour faire vos recherches sur le dark net. A vos risques et périls.

Aussi pour compléter le tableau, nous souhaitions relever l’existence d’un MOOC sur l’utilisation de TOR pour surfer anonymement tout prochainement sur OpenClassRoom.

Le dark net : the place to be ?

Alors que trouve t-on sur ce fameux dark net? Tout ce que l’on ne veut pas y voir sur le web surfacique (y compris activités illégales) et également des plateformes officielles qui souhaitent proposer leur service à des personnes ne pouvant pas y accéder dans leur pays. Dernièrement, Facebook s’est mêm installé sur le dark net avec une adresse en .onion !

Aussi, certains bien-pensants et visionnaires du futur verraient même dans le Dark Net la prochaine tendance Mainstream ! A voir l’intervention de Jamie Barlett à une conférence TED, c’est assez amusant. N’hésitez pas à mettre les sous-titres en anglais, c’est plus facile à suivre… (les sous titres français ne sont, à l’heure actuelle, pas disponibles).

Enfin, petites digression : à quand la première agence SEO sur le Dark net ?? A quand les articles « obtenir la première position sur Grams ».

2 Responses so far.

  1. Myriam06 dit :

    Merci à vous, cet article m’a permis de comprendre la distinction que l’on doit faire entre le deep web et le dark net. Pas toujours facile de suivre de nos jours…

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.