You are on page 1of 4

Internet profunda

Ilustracin de la Internet profunda.


Se conoce como Internet profunda o Internet invisible (en ingls: Deepweb, Invisible
Web, Deep Web, Dark Web oHidden Web) a todo el contenido de Internet que no forma parte
del Internet superficial, es decir, de las pginas indexadas por las redes de los motores de
bsqueda de la red. Esto se debe a las limitaciones que tienen las redes para acceder a todos
los sitios web por distintos motivos.
1

ndice
[ocultar]
1 Causas
2 Tamao
3 Denominacin
4 Ingresando a la internet profunda
5 Vase tambin
6 Referencias
7 Enlaces externos
Causas[editar]
La principal causa de la existencia de la Internet profunda es la imposibilidad de los motores
de bsqueda de encontrar o indexar gran parte de la informacin existente en Internet. Se
estima que la Internet Profunda es 500 veces mayor
2
que la Internet Superficial, siendo el 95%
de esta informacin pblicamente accesible. Si los buscadores tuvieran la capacidad para
acceder a toda la informacin entonces la magnitud de la "Internet profunda" se reducira casi
en su totalidad; sin embargo, no desaparecera totalmente porque siempre existirn pginas
privadas.
Los siguientes son algunos de los motivos por los que los buscadores son incapaces de
indexar la Internet profunda:
Pginas y sitios web protegidos con contrasea.
Documentos en formatos no indexables.
Enciclopedias, diccionarios, revistas en las que para acceder a la informacin hay que
interrogar a la base de datos, como por ejemplo la base de datos de la RAE.
3

Tamao[editar]
En el ao 2000 se estimaba
4
que el tamao de la Internet profunda era de 7500 Terabytes de
datos en unos 550 000 millones de documentos.
5
Para comparar se estima que en aquella
poca la Internet superficial ocupaba 167 Terabytes y el contenido de la Biblioteca del
Congreso de Estados Unidos tena unos 3000 Terabytes que no eran accesibles por los
motores de bsqueda.
La Internet profunda tiene el mayor crecimiento de nueva informacin en Internet, ms de la
mitad del contenido de este reside en bases de datos, la calidad del contenido de la Internet
profunda es considerada por lo menos 1000 o 2000 veces mayor que la del Web superficial y
el 95% de la informacin de la web profunda es informacin totalmente pblica, libre de
suscripciones y tarifas.
6

Estimaciones basadas en la extrapolacin de un estudio de la Universidad de California en
Berkeley especula que actualmente la Internet profunda debe tener unos 91 000 Terabytes.
7

Mike Bergman ha dicho que la bsqueda en el Internet hoy en da se puede comparar con una
red de arrastre a travs de la superficie del ocano: una gran cantidad puede ser atrapada en
la red, pero hay una gran cantidad de informacin que est en lo profundo y por lo tanto, se
pierde. La mayor parte de la informacin de la Web est enterrada muy abajo en sitios
generados dinmicamente, y los motores de bsqueda estndar no la encuentran. Los
buscadores tradicionales no pueden "ver" o recuperar el contenido de la Web profunda, esas
pginas no existen hasta que se crea de forma dinmica, como resultado de una bsqueda
especfica. La Web profunda es varios rdenes de magnitud ms grande que la web de la
superficie profunda.
5

Denominacin[editar]


Logo de Freenet.
Bergman, en un artculo semanal sobre la Web profunda publicado en el Journal of Electronic
Publishing, mencion que Jill Ellsworth utiliz el trmino "la Web invisible" en 1994 para
referirse a los sitios web que no estn registrados por algn motor de bsqueda.
5

Bergman cit un artculo de 1996 de Frank Garca:
8

Sera un sitio que, posiblemente est diseado razonablemente, pero no se molestaron en
registrarlo en alguno de los motores de bsqueda. Por lo tanto, nadie puede encontrarlos! Ests
oculto. Yo llamo a esto la Web invisible.
Otro uso temprano del trmino Web Invisible o web profunda fue por Bruce Monte y Mateo B.
Koll de Personal Library Software, en una descripcin de la herramienta @ 1 de web profunda,
en un comunicado de prensa de diciembre de 1996.
9

El primer uso del trmino especfico de web profunda, ahora generalmente aceptada, ocurri
en el estudio de Bergman de 2001 mencionado anteriormente.
5

Por otra parte, el trmino web invisible se dice que es inexacto porque:
Muchos usuarios asumen que la nica forma de acceder a la web es consultando un
buscador.
Alguna informacin puede ser encontrada ms fcilmente que otra, pero sto no quiere
decir que est invisible.
La web contiene informacin de diversos tipos que es almacenada y recuperada en
diferentes formas.
El contenido indizado por los buscadores de la web es almacenado tambin en bases de
datos y disponible solamente a travs de las interrogaciones del usuario, por tanto no es
correcto decir que la informacin almacenada en bases de datos es invisible.
6

Ingresando a la internet profunda[editar]


Logo de Tor.
A pesar de que son muchos los servicios y programas para acceder a la web profunda, el
software ms popular es Tor (The Onion Router), pero existen otras alternativas
como I2P y Freenet.
10

En 2008, con el fin de facilitar el acceso de los usuarios y motores de bsqueda de indexacin
de la Web profunda, Aaron Swartz diseTor2web un software de proxy capaz de
proporcionar el acceso a los servicios ocultos de Tor a travs de un navegador web comn.
11

Para descubrir el contenido en la Web, los motores de bsqueda utilizan rastreadores web que
siguen hipervnculos a travs de nmeros de puertos virtuales de protocolos conocidos. Esta
tcnica es ideal para descubrir los recursos en la red de superficie, pero a menudo es ineficaz
en la bsqueda de recursos web profundas. Estos rastreadores no tratan de encontrar las
pginas dinmicas que son el resultado de las consultas de base de datos debido al nmero
indeterminado de consultas que son posibles.
12
Se ha observado que esto puede ser
(parcialmente ) a superar proporcionando enlaces para consultar como resultado, pero esto
podra involuntariamente inflar la popularidad de un miembro de la Web profunda.
Vase tambin[editar]

You might also like