WEB SUPERFICIAL Y WEB PROFUNDA
La web superficial o visible nos da acceso a una pequeña parte de la información que existe online a través de los buscadores tradicionales; todo el resto de información está en la web profunda o invisible que no aparece en dichos buscadores convencionales y que suponen la mayor parte de la información existente.
WEB SUPERFICIAL
Está compuesta por información que puede ser indexada por los motores de búsqueda
- Su información no está en bases de datos
- Es de libre acceso
- No hay que registrarse para acceder a ella
- Mayoritariamente son páginas web estáticas
WEB PROFUNDA
Chris Sherman y Gary Price identifican 4 tipos de contenidos en la web
Web Opaca
Información que por alguna de estas razones no aparecen en los buscadores habituales
- Extensión de indización porque no todas las páginas de un sitio web son indizadas
- Frecuencia de la indicación ya que a diario se genera muchísima información y no da tiempo de indizarla toda
- Número máximo de resultados visibles
- URL desconectadas, si un documento no tiene un link a él desde otro documento será imposible entontrarlo por no estar indizado
Web Privada
Excluidas deliberadamente por los dueños no aparecen por alguno de estos motivos
- Páginas protegidas por contraseñas
- Contienen un archivo "robots.txt" para evitar ser indizadas
- Contienen un campo "noindex" para evitar que la parte correspondiente al cuerpo de la página sea indizada
Web Propietaria
Páginas en las que es necesario registrarse para tener acceso al contenido
Gratuitas o de pago
Web Realmente Invisible
Páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente (que se generan según el usuario introduce datos), información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se haga una petición específica
Algunos de estos recursos son:
The WWW Virtual Library, considerado el catálogo más antiguo y creado por el creador de la web Tim Berners- Lee
Infoplease, web de consulta con artículos de la prestigiosa enciclopedia Columbia que facilita la consulta por términos o áreas de conocimiento
DeepWebTech, ofrece 5 motores de búsqueda para temas específicos como medicina, ciencia...
TechXtra, revistas gratuitas especializadas en ingeniería, matemática, informática
No hay comentarios:
Publicar un comentario