Recuperación de información en Internet ( III ) : Herramientas de primera generación
20 de julio, 2003 por Catuxa
Las llamadas herramientas de 1ª generación, sistemas basados en el acceso a ordenadores remotos, se estructuran en dos tipos:
- Buscadores: programas que rastrean y recopilan la información contenida en la red y generan con ella bases de datos. También llamados spiders.
- Índices o directorios: formados por grandes bases de datos donde la información está clasificada temáticamente.
Los primeros buscadores nacen en 1993 JumpStation, World Wide Web Worm y Repository-Based Software Engineering pueden ser considerados los primeros spiders en rastrear la red. JumpStation buscaba en una base de datos lineal y emparejaba palabras clave, era un sistema muy lento que terminó por desaparecer. World Wide Web, creado por Oliver McBryan en 1994, se componía de 4 bases de datos, sus resultados eran presentados sin ningún orden. RBSE
fue el primero que ofreció los resultados de la búsqueda basándose en un ranking ordenando los resultados por relevancia de las cadenas de palabras clave.
ElNet Galaxy es el primer directorio conocido, que en 1994 incorporaba ya búsquedas por medio de Gopher, Telnet y Web y ofrecia al usuario los enlaces clasificados en categorías. Infoseek Guide inicialmente de pago, pronto pasa a ser un servicio público en que el 2001 ya contaba con un millon quinientas mil páginas indizadas.
Pero si por algo son conocidos los directorios, es indudablemente por el famoso Yahoo, nacido en Abril de 1994 a partir de una colección de páginas Web de David Filo y Jerry Yang, el origen está en la preparación de suu tesis doctoral en ingeniería eléctrica en la Universidad de Stanford, California, y aprovechando que su asesor académico estaba de vacaciones, Yang en una entrevista con la revista Time dice, “el trabajo era tedioso y laborioso, por decirlo de alguna forma, y a comienzos de 1994 comenzamos a vaguear y a pasar cada vez más tiempo en la recién nacida Web; empezamos a juntar una lista de los sitios favoritos de ambos, que llamamos ´La guía de Jerry para la World Wide Web´. Antes de que nos diéramos cuenta, gente de todo el mundo estaba utilizando la base de datos que habíamos creado.” Podeis leer algo más del origen de Yahoo y de los dos creadores en un interesante artículo de Ignacio Goméz en Baquia
Pero la primera máquina que buscaba a texto completo en la red es Webcrawler de Brian Pinkerton, fruto de un seminario sobre la popularidad de Internet, celebrado en 1994 en la Universidad de Washington, pronto se convirtió en uno de los favoritos, ya que hasta entonces los buscadores sólo indizaban las URLs y descripciones creadas por las máquinas o por la indización manual.
Otro de los conocidos, Lycos de Michael Mauldin fue presentado en Julio de 1994 con 54.000 documentos indizados y en Enero de 1995 presentaba ya 500.000. Lauldin uso el programa LongLegs de John Leavitt como punto de partida posteriormente añadió el programa de recuperación Pursuit para posibilitar la búsqueda de las páginas recopiladas. Pursuit estaba basado en la experiencia del Tipster Text Program de ARPA, que trataba de la recuperación en bases de datos textuales muy grandes.
Y en Agosto de 1995 aparece Magellan perteneciente a una filial de Excite Inc, practicamente poseía el mismo funcionamiento que Excite.
A partir de 1995, llegan a nosotros los grandes buscadores, Altavista, Hotbot Google… pero de eso hablaremos en una siguiente entrega!