martes, 20 de octubre de 2015


WEB SUPERFICIAL Y WEB PROFUNDA 


La web superficial o visible nos da acceso a una pequeña parte de la información que existe online a través de los buscadores tradicionales; todo el resto de información está en la web profunda o invisible que no aparece en dichos buscadores convencionales y que suponen la mayor parte de la información existente.


WEB SUPERFICIAL

Está compuesta por información que puede ser indexada por los motores de búsqueda

  • Su información no está en bases de datos
  • Es de libre acceso
  • No hay que registrarse para acceder a ella
  • Mayoritariamente son páginas web estáticas



WEB PROFUNDA

Chris ShermanGary Price



Chris Sherman y Gary Price identifican 4 tipos de contenidos en la web

Web Opaca
Información que por alguna de estas razones no aparecen en los buscadores habituales

- Extensión de indización porque no todas las páginas de un sitio web son indizadas 
- Frecuencia de la indicación ya que a diario se genera muchísima información y no da tiempo de indizarla toda
- Número máximo de resultados visibles
- URL desconectadas, si un documento no tiene un link a él desde otro documento será imposible entontrarlo por no estar indizado

Web Privada
Excluidas deliberadamente por los dueños no aparecen por alguno de estos motivos

- Páginas protegidas por contraseñas
- Contienen un archivo "robots.txt" para evitar ser indizadas
- Contienen un campo "noindex" para evitar que la parte correspondiente al cuerpo de la página sea indizada

Web Propietaria
Páginas en las que es necesario registrarse para tener acceso al contenido

Gratuitas o de pago

Web Realmente Invisible
Páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente (que se generan según el usuario introduce datos), información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se haga una petición específica

Algunos de estos recursos son:

The WWW Virtual Library, considerado el catálogo más antiguo y creado por el creador de la web Tim Berners- Lee

Infoplease, web de consulta con artículos de la prestigiosa enciclopedia Columbia que facilita la consulta por términos o áreas de conocimiento

DeepWebTech, ofrece 5 motores de búsqueda para temas específicos como medicina, ciencia...

TechXtra, revistas gratuitas especializadas en ingeniería, matemática, informática

















No hay comentarios:

Publicar un comentario