Professional Documents
Culture Documents
Ir a la navegaci�nIr a la b�squeda
�Deep web� redirige aqu�. Para el documental, v�ase Deep Web (documental).
�ndice
1 Origen
2 Tama�o
3 Motivos
4 Denominaci�n
5 Internet acad�mica invisible
5.1 Tama�o de la Internet acad�mica invisible.
6 Rastreando la internet profunda
7 M�todos de profundizaci�n
7.1 Las ara�as (web crawlers)
7.2 Tor
7.3 Criptomoneda
8 Recursos de la internet profunda
9 V�ase tambi�n
10 Referencias
11 Enlaces externos
Origen
La principal causa de la existencia de la internet profunda es la imposibilidad de
los motores de b�squeda (Google, Yahoo, Bing, etc.) de encontrar o indexar gran
parte de la informaci�n existente en Internet. Si los buscadores tuvieran la
capacidad para acceder a toda la informaci�n entonces la magnitud de la �internet
profunda� se reducir�a casi en su totalidad. No obstante, aunque los motores de
b�squeda pudieran indexar la informaci�n de la internet profunda esto no
significar�a que esta dejara de existir, ya que siempre existir�n las p�ginas
privadas. Los motores de b�squeda no pueden acceder a la informaci�n de estas
p�ginas y s�lo determinados usuarios, aquellos con contrase�as o c�digos
especiales, pueden hacerlo.
En la Deep Web pueden establecerse contactos que no son monitoreados, nadie est�
all� observando. Adem�s las transferencias tanto de mercanc�a como de pagos son
pr�cticamente imposible de rastrear. La web est� dividida en dos partes, la web
superficial y la web profunda. Esta �ltima es la que se conoce como Deep Web, donde
se ubica todo contenido que no es indexable por los buscadores, o al que los
usuarios no pueden acceder mediante un buscador web como DuckDuckGo, Startpage,
Yandex, Ecosia, Yahoo!, Google o Bing.
Tama�o
La internet profunda es un conjunto de sitios web y bases de datos que buscadores
comunes no pueden encontrar ya que no est�n indexadas. El contenido que se puede
hallar dentro de la internet profunda es muy amplio.7?
Mientras que las p�ginas normales son identificadas mediante el protocolo UDP/IP,
las p�ginas .onion son repetidas por el ramal al que se ha conectado el navegador
especializado para tal sistema de navegaci�n segura. El sistema de b�squeda es el
mismo que usa BitTorrent. El contenido se coloca en una base de datos y se
proporciona s�lo cuando lo solicite el usuario.8?
Tambi�n en 2010 se estim� que exist�an m�s de 200 000 sitios en la internet
profunda.9?
La Association for Computing Machinery (ACM) public� en 2007 que Google y Yahoo
indexaban el 32 % de los objetos de la internet profunda, y MSN ten�a la cobertura
m�s peque�a con el 11 %. Sin embargo, la cobertura de los tres motores era de 37 %,
lo que indicaba que estaban indexando casi los mismos objetos.11?
Motivos
Motivos por los que los motores de b�squeda no pueden indexar algunas p�ginas:
Otro uso temprano del t�rmino Web Invisible o web profunda fue por Bruce Monte y
Mateo B. Koll de Personal Library Software, en una descripci�n de la herramienta @
1 de web profunda, en un comunicado de prensa de diciembre de 1996.15?
El primer uso del t�rmino espec�fico de web profunda, ahora generalmente aceptada,
ocurri� en el estudio de Bergman de 2001 mencionado anteriormente.
Por otra parte, el t�rmino web invisible se dice que es inexacto porque:
[...] datos que se generan en tiempo real, como pueden ser valores de Bolsa,
informaci�n del tiempo, horarios de trenes.
Tor
Art�culo principal: Tor (red de anonimato)
Logo de Tor
The Onion Router (abreviado como TOR) es un proyecto dise�ado e implementado por la
marina de los Estados Unidos lanzado el 20 de septiembre de 2002. Posteriormente
fue patrocinado por la EFF (Electronic Frontier Foundation, una organizaci�n en
defensa de los derechos digitales). Al presente (2019), subsiste como TOR Project,
una organizaci�n sin �nimo de lucro galardonada en 2011 por la Free Software
Foundation por permitir que millones de personas en el mundo tengan libertad de
acceso y expresi�n en internet manteniendo su privacidad y anonimato.21?
A diferencia de los navegadores de internet convencionales, Tor le permite a los
usuarios navegar por la Web de forma an�nima. Tor es descargado de 30 millones a 50
millones de veces al a�o, hay 0,8 millones de usuarios diarios de Tor y un
incremento del 20 % solamente en 2013. Tor puede acceder a unos 6 500 sitios web
ocultos.22?
El contenido que puede ser encontrado dentro de la internet profunda es muy vasto,
se encuentran por ejemplo, datos que se generan en tiempo real, como pueden ser
valores de Bolsa, informaci�n del tiempo, horarios de trenes, bases de datos sobre
agencias de inteligencia, disidentes pol�ticos y contenidos criminales.19?
Criptomoneda
Art�culo principal: Criptomoneda
Vale la pena acotar que salvo por excepciones de algunos mercados como Silk Roads,
The Trade Route, o Wall Street Market, la mayor parte del comercio en la deep web
se constituye a base de ofertas enga�osas y fraudes en general, existe una gran
tendencia a satanizar a comunidades que buscan la libertad de expresi�n y el
anonimato, en el mundo hispano-hablante esta tendencia fue originada por blogueros
y youtubers que lejos de informar a las comunidades buscan crear esc�ndalos
amarillistas para obtener ingresos por conceptos de publicidad de sistemas como
Adsense. En los �ltimos a�os se ha demostrado que el Bitcoin no es una criptomoneda
segura cuando se trata de la confidencialidad de los datos de sus usuarios, motivo
por el cual tendr�a poco sentido utilizarla en redes de anonimato como Tor,
Freenet, o I2P, cuyos usuarios intentan alcanzar el cl�max del anonimato, por lo
cual no se puede descartar tampoco la intervenci�n de empresas propagandistas que
intentan aumentar el valor de mercado del bitcoin.
Contenido de acceso limitado: los sitios que limitan el acceso a sus p�ginas de una
manera t�cnica (Por ejemplo, utilizando el est�ndar de exclusi�n de robots o
captcha, que proh�ben los motores de b�squeda de la navegaci�n por y la creaci�n de
copias en cach�.24?
Contenido din�mico: las p�ginas din�micas que devuelven respuesta a una pregunta
presentada o acceder a trav�s de un formulario, especialmente si se utilizan
elementos de entrada en el dominio abierto como campos de texto.
Contenido no enlazado: p�ginas que no est�n conectadas con otras p�ginas, que
pueden impedir que los programas de rastreo web tengan acceso al contenido. Este
material se conoce como p�ginas sin enlaces entrantes.
Contenido programado: p�ginas que solo son accesibles a trav�s de enlaces
producidos por JavaScript, as� como el contenido descargado de manera din�mica a
partir de los servidores web a trav�s de soluciones de Flash o Ajax.
Sin contenido HTML: contenido textual codificado en multimedia (imagen o video)
archivos o formatos de archivo espec�ficos no tratados por los motores de b�squeda.
Web privada: los sitios que requieren de registro y de una contrase�a para iniciar
sesi�n
Web contextual: p�ginas con contenidos diferentes para diferentes contextos de
acceso (por ejemplo, los rangos de direcciones IP de clientes o secuencia de
navegaci�n anterior).