Según los investigadores, existen tres tipos distintos de Internet: internet global: Red de información libre y gratuita que es accesible mediante la interconexión de computadores. La forma de acceso se realiza mediante programas navegadores, Chats, mensajería instantánea o intercambio de protocolos (FTP, P2P).
Internet oscur Los servidores o host que son totalmente inaccesibles desde nuestro computador. La causa principal se debe a zonas restringidas con fines de seguridad nacional y militar, otros motivos son la configuración incorrecta de routers , servicios de cortafuegos y protección, servidores inactivos y finalmente "secuestro" de servidores para utilización ilegal.
Y por último el Internet invisible: Información que está disponible en Internet pero que únicamente es accesible a través de páginas generadas dinámicamente tras realizar una consulta en una base de datos. Es inaccesible mediante los procesos habituales de recuperación de la información que realizan buscadores, directorios y motores de búsqueda.
El término de "Web Invisible" (Internet Invisible), fue utilizado por primera vez en 1994 por la Dra. Ellsworth , para referirse a la información que los motores de búsqueda tradicionales no pueden encontrar. Otra forma de denominar a esta información es "depp Web” (Internet profunda), ya que en realidad no es invisible, sólo hay que saber llegar a ella a través de navegadores convencionales o con plugin . Por ello, el término más correcto para denominar a la Web invisible sería "no indexable".
Se estima que su tamaño es infravalorado, superando desde 500 a 600 veces el total del Internet global. A pesar de que los buscadores cada vez son más hábiles a la hora de recuperar todo tipo de documentos, lo más interesante para los investigadores, es que una gran parte de la Web sigue siendo invisible a primera vista.
Sabiendo entonces el tamaño de la la Web invisible (no indexable) sería ¿Cómo, entonces, se generó tan ingente cantidad de información? Y más importante aún ¿Cómo ha podido permanecer, relativamente oculta, hasta ahora? Existen dos razones básicas que contribuyen al crecimiento de la Web Invisible, y su relativa opacidad:
Bases de Datos en Línea: Buena parte de la información contenida en la Web Invisible, está almacenada en grandes bases de datos que se pueden consultar vía Web. Los resultados de las búsquedas en muchas de estas bases de datos, son dispensados a los usuarios por medio de una página Web creada en el preciso instante de la consulta. Dichas páginas, no se almacenan en ningún servidor dado que resulta más fácil y barato, generarlas dinámicamente como respuesta a cada consulta puntual. Por esta razón, los motores de búsqueda no pueden localizar, y mucho menos crear dichas páginas.
Páginas Excluidas Intencionalmente. Hay algunas páginas Web que los motores de búsqueda excluyen de sus índices, por razones de política interna de los administradores del sitio Web. No existen razones técnicas de peso para que ellos lleven a cabo dicha exclusión. Se trata de una solución de compromiso, hay que decidir qué recursos incluir, y cuáles no, en bases de datos de por sí sobrecargadas, de costosa operación y con tasas de retorno a la inversión muy bajas.
Para poder encontrar un recurso que nos interese en esta Web Invisible, es preciso, en principio, visitar directamente la página que contiene el formulario de búsqueda, de cada base de datos en particular, y especificar la consulta correspondiente. Empresas como BrightPlanet en estudios realizados han clasificado en diversas categorías, las cuales se reseñan a continuación:
• Bases de Datos sobre tópicos específicos, com bases de datos médicas, registros de patentes, etc.
• Sitios Internos (bases de datos explorables mediante páginas internas de un gran sitio Web, generadas dinámicamente; algunos ejemplos podrían ser la base de conocimientos del sitio de Cisco, Sun Microsystems o Microsoft.
• Publicaciones (bases de datos en las que se pueden encontrar artículos digitalizados).
• Compras y subastas. (Ebay, e-market, supercarros)
• Anuncios Clasificados. (Clasificados.com.do)
• Catálogos de Bibliotecas, en la mayoría de los casos pertenecientes a universidades.
• Páginas Amarillas y Páginas Blancas (localización de personas y empresas).
• Calculadoras (aunque no son estrictamente una base de datos, en muchos casos incluyen un componente interno, que realiza algún tipo de cálculo; amortizaciones de préstamos hipotecarios, tesauros, traductores, podrían ser algunos ejemplos.
• Sitios Web específicos para la busque de empleos (Infoempleos, aldaba)
• Mensajes y Chat.
• Bases de Datos Generales
En la actualidad se ha estado investigando sobre la creación de herramientas que faciliten a los usuarios de Internet la búsqueda de información en la web profunda, pero todavía no ha sido posible lograr avances significativos. Les invitamos a escudriñar más sobre este tan interesante tema.