WEB SUPERFICIAL Y PROFUNDA
Los buscadores tradicionales sólo ofrecen acceso a
una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la
Web superficial o visible. Lo que resta, la Web profunda o invisible, es un
amplio banco de información ubicado en catálogos, revistas digitales, blogs,
entradas a diccionarios y contenido de sitios que demandan un login (aunque sea
gratuito) y otros tipos de contenido que no aparecen entre los resultados de
una búsqueda convencional.
La Web Superficial o visible:
Comprende
todos aquellos sitios cuya información puede ser indexada por los robots de los
buscadores convencionales y recuperada casi en su totalidad mediante una
consulta en sus formularios de búsqueda.
Las características principales de los sitios
de la Web visible son:
- su información no está contenida en bases de datos
- es de libre acceso
- no se requiere la realización de un proceso de registro para acceder a la información.
- mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.
La Web Profunda o invisible
es el término utilizado para describir toda la
información disponible en Internet que no se recupera interrogando a los
buscadores convencionales. Generalmente es información almacenada y accesible
mediante bases de datos. Parte de la información es "invisible" a los
robots de los buscadores convencionales, ya que los resultados se generan en la
contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.)
es decir páginas que no tienen una URL fija y que se construyen en el mismo
instante (temporales) desapareciendo una vez cerrada la consulta.
La Web
opaca: esta compuesta por archivos que, si bien podrian
estar incluidos en los indices de los buscadores.
La Web privada: consiste en las paginas web que
podrian estar indizadas en los buscadores pero son excluidas deliberadamente po
que las paginas estan protegidas por contraseñas o contienen un archivo
"robots.txt"
La Web propietaria: incluyente aquellas paginas en las que es necesario registrarse para
tener acceso al contenido, ya sea de forma gratuita o arancelada.
La Web realmente invisible: invisible se compone de páginas que no pueden ser indizadas por
limitaciones técnicas de los buscadores, programas ejecutables y archivos
comprimidos, páginas generadas dinámicamente.
No hay comentarios:
Publicar un comentario