¿Qué es una araña del motor de búsqueda?

La construcción de una herramientas de la comunidad
Mira Google Videos

¿Qué es una araña del motor de búsqueda?

Arañas de los motores de búsqueda, a veces llamados rastreadores, son utilizados por los motores de búsqueda de Internet para recopilar información sobre los sitios Web y las páginas Web individuales. Los motores de búsqueda necesitan información de todos los sitios y páginas-de lo contrario, no sabrían qué páginas para mostrar en respuesta a una consulta de búsqueda o con qué prioridad.

Arañas de los motores de búsqueda rastrean a través de Internet y crear colas de los sitios Web a investigar más a fondo. Como un sitio Web específico se cubre por una araña, la araña lee a través de todo el texto, hipervínculos, meta tags (etiquetas meta están formateados específicamente palabras clave insertadas en la página Web de una manera diseñada para la araña de encontrar y usar) y el código . Con esta información, la araña ofrece un perfil para el motor de búsqueda. La araña entonces recoge información adicional siguiendo los hipervínculos en la página Web, lo que le da una mejor recopilación de datos sobre esas páginas. Esta es la razón de que tener enlaces en su página web - y, mejor aún, otras páginas web que enlazan con la suya - es tan útil para lograr que su sitio web encontrado por los motores de búsqueda.

Las arañas tienen cuatro modos básicos de recopilación de información. Un tipo de araña sólo se utiliza para crear las colas de páginas Web para ser buscadas por otras arañas. Esta araña, trabajando en el modo de "selección", está dando prioridad a las páginas para ir a través y comprobar para ver si una versión anterior de una página ya ha sido descargado. El segundo modo es una araña diseñada especialmente para repasar las páginas que ya han sido rastreadas por una araña. Este modo se llama "re-visitación." Algunos motores de búsqueda están preocupados de que una página se ha arrastrado también a fondo por otras arañas, por lo que utiliza un modo de araña llamada "la cortesía", que limita el rastreo páginas con exceso de trabajo. Por último, "paralelización" permite una araña para coordinar sus esfuerzos de recolección de datos con otros motores de búsqueda que se arrastra sobre la misma página.


» » ¿Qué es una araña del motor de búsqueda?