Cómo funciona un buscador
11 de mayo, 2004 por Catuxa
Héctor García Puigcerver (ToReK) está publicando interesantes post´s por capítulos en su bitácora, acerca de cómo funciona un buscador, tema que le toca de cerca pues está programando un buscador en su proyecto fin de carrera.
Su objetivo es divulgar lo que vaya aprendiendo, es importante saber como funciona un buscador para hacer que sea más fácil para ellos encontrar información en nuestros blogs y páginas webs. Y por lo que he leído hasta ahora, lo está consiguiendo.
El tema se presenta interesante y Héctor nos lo explica de manera sencilla partiendo de la cada vez más acuciante necesidad de encontrar información de manera automática. En el primer capítulo parte de tres enfoques que suelen confundirse:
Recuperación de información (Information Retrieval) consiste en indicar al usuario en qué documentos puede haber información relevante.
Extracción de información (Information Extraction) consiste en hacer lo mismo que la Recuperación de información pero en vez de mostrar los resultados al usuario se generan una serie de archivos con los datos más importantes que se han encontrado.
Búsqueda de respuestas (Question answering) consiste en responder a una pregunta concreta del usuario.
En el segundo capítulo se centra en las características básicas de un buscador y su funcionamiento interno partiendo de lo que él llama la pregunta de oro (y que seguro, SEGURO, todos os hemos hechos alguna vez) ¿Cómo puede un buscador encontrar una palabra buscando en todas las páginas webs del mundo en menos de un segundo? Para ilustrarnos la explicación se basa en el ejemplo de la cache de Google y nos introduce el concepto de búsqueda secuencial e indexación.
No dejeis de leer los artículos completos. Estaremos atentos, porque parece que habrá próximo capítulo.