¿Volviendo a los orígenes?: gentonomías
18 de abril, 2005 por Catuxa
En el último número de Bits de Infonomía, Alfons Cornella habla del fenómeno que está revolucionando el mundo de las clasificaciones el tagging o clasificación social: Con el título ¿Hacía la gentonomía? (tagging o folksonomy),Cornella nos recuerda que en los orígenes de la web Yahoo aspiraba a indizar todo el contenido de la red en categorías de la mano de “clasificadores humanos”, una idea que fue secundada por otros muchos hasta que llegó Google y su famoso algorítmo, marcando un hito en el mundo de los motores de búsqueda y la recuperación de información:
[...] la indización de base humana fue superada por la potencia de navegación sistemática de Google, que con su algoritmo de determinación de relevancia PageRank (en la que los resultados de una búsqueda aparecen ordenados de acuerdo con la popularidad de una página en términos de cuántas veces otras páginas enlazan hacia ella) hizo un paso histórico en la carrera humana por encontrar información cuando se necesita.
Y si hasta el momento Google sigue siendo el rey de las búsquedas ¿quién no visita la página principal o la barra de Google a lo largo del día?) Cornella se pregunta por cuanto tiempo ostentará su supremacía ante el reciente y creciente fenómeno de la folksonomía que supone una vuelta a los orígenes: que serán las personas las que clasifiquen los recursos de información (imágenes, páginas web, videos…) y ayuden con su propias etiquetas (tags) al resto de navegantes.
Es en efecto una vuelta a la idea primigenia de Yahoo, pero con la diferencia de que ya no se trata de “catalogadores y clasificadores profesionales” que organizan el caos informacional como parte de su trabajo, sino que cualquier persona sin ningún tipo de conocimiento sobre ontologías, taxonomías o descriptores, otorga una relevancia y palabras clave a los documentos que va visitando.
Existen ya buscadores basados en el tagging y son muchos los que estan empezando a utilizarlo Tagbert o Technorati son dos buenos ejemplos, y flickr fue uno de los “culpables” de su extensión por toda la red, pero sí se trata d eponer un nombre a los orígenes de la clasificación social, no podemos olvidarnos de Del.icio.us (uno de los pioneros en 2004):
Once you’ve registered for the service, you add a simple bookmarklet to your browser. When you find a web page you’d like to add to your list, you simply select the del.icio.us bookmarklet, and you’ll be asked for information about the page. You can add descriptive terms to group similar links together and add notes for yourself or for others.
La categorización colaborativa (social bookmarking) parte de la idea de que cuanta más gente describa los contenidos, tanto mejor será su clasificación.
Algo que plantea muchas dudas… porque la opinión de la mayoría no siempre tiene que ser la más idónea. Cornella señala algunos de los inconvenientes de este sistema colaborativo:
- El no acuerdo que varias personas pueden tener sobre qué es una cosa: le damos distintos nombres a lo mismo.
- En este sistema no hay enlaces sinonímicos entre las palabras (términos) usados.
- Este tipo de sistemas colaborativos llega un punto en el que no crecen, quizás porque las personas voluntariamente colaborativas constituyen un número finito, mientras las páginas en Internet parecen reproducirse más allá de lo humano.
Nos encontramos de nuevo ante dos de los mayores problemas de la recuperación de información: exhaustividad versus relevancia.
Google ha googlelizado en un mundo de la exhaustividad. Pero el mundo de los humanos, al menos mientras no consigamos reemplazar nuestro cerebro por algo mejor, es un mundo de proceso limitado de información (no podemos aumentar nuestras horas de vigilia), y para sobrevivir informacionalmente, la relevancia es crítica.
El tagging nos puede proporcionar infinidad de recursos sobre un tema, muchos de los cuales (o la mayoría) no tienen el menos valor o importancia para nuestra búsqueda, por estar mal clasificados o apenas tratar el tema del que precisamos información.
Por otra parte, los motores de búsqueda como Google, no recuperan toda la información que existe sobre ese tema, tan sólo podemos recuperar aquellos recursos que ha indexado gracias al trabajo del Googlebot o nos devuelven resultados que poco relevantes al no existir una correlación entre los vocablos de nuestra cosulta y lo que la máquina ha indexado.
¿Qué debe primar?, la folksonomía ha supuesto un cambio en el acceso a la información “hecha por personas y para personas”, es otra forma de buscar y encontrar, pero no tiene que ser excluyente de la clasificación social, ¿es mejor un directorio que un motor de búsqueda? depende, se trata de dos formas de recuperar información, cuya pertinencia depende del tipo de información buscada.
Post recientes sobre el tema:
- El fin de los directorios y las nuevas clasificaciones
- Más sobre folksonomías
- Tagging en D-Lib
- Categorias en bookmarks sociales y Bundle
El principal problema del tagging es su facilidad de manipulación. Al igual que fracasaron los meta tags, el “tagging” tampoco podrá sobrevivir al spam.
Es tan fácil como poner un tag a este post con “pokker” y meterlo en 100 cuentas de del.icio.us como favorito bajo pokker.
Altavista fracasó al basar su algoritmo en la catalogación que hacian los propios webmasters.
Podrá aprovecharse de alguna manera el tagging, pero es demasiado frágil y manipulable.
Saludos.
Suscribo lo afirmado por Michel y os mando dos artículillos sobre el tema para aquel que quiera más.
http://www.francispisani.net/2005/03/tagging_una_del.html#more
http://www.francispisani.net/2005/03/tagging_y_clasi.html#more
Buena relación, Michel, se me pasó citar el caso de las metaetiquetas, tu ejemplo es un estupendo modo de preveer lo que puede pasar con la expansión indsicriminada y aleatoria del tagging.
El spam sigue siendo un problema sin resolver que aumenta el desorden y caos informativo, mientras no logremos frenar su expansión y su política viral, la relevancia de las búsquedas estará condicionada.
La clasificación colaborativa como bien dices, es frágil y poco fiable, sí, pero seguro que algo nos aporta y aportará.
Marcos, muchas gracias por los enlaces, el blog de pisani es un referente a no perder de vista, también hay una estupenda colección de enlaces sobre el tema en Ecuaderno: Tags & folksonomies: etiquetas semánticas y taxonomías sociales
Muy interesante y muy bien explicado, Catuxa.
A corto y a medio plazo supongo, no puede haber un punto único de búsqueda si se quiere encontrar información útil. Tags, alertas, rss, buscadores y directorios bien confeccionados son herramientas complementarias y necesarias (más que nos pese).
Estas herramientas me parecen muy útiles para volumenes pequeños de información como las intranets corporativas. Y los responsables de éstas no suelen estar abiertos a la inclusión de herramientas que no les venda Microsoft.
Saludos,
Pues serían de gran utilidad para intranets como tu apuntas, Miss, puesto que en teoría, el público que maneja y a quien está destinada la información de la empresa, posee (en general) un conomimiento similar del entorno informacional y de la colección documental albergada en la intranet, unido al hecho de que las palabras claves utilizadas por los empleados en la supuesta clasificación social, estarían dentro de un campo temático con un vocabulario medianamente controlado al tratarse de temáticas cerradas, muy diferente del basto mundo de la información que circula por internet (de todo tipo y tema).
Sin embargo, concienciar a las empresas de ésto es una ardua tarea.
p.d. Pedimos una actualización de Fall in blog!!!
PING:
TITLE: Deakialli DocuMental
BLOG NAME: Deakialli DocuMental
[...] gentonomia…
Por: Catuxa | Recuperación de la información | Comentarios (0) | Referencias (0)
Comentarios
Comentar
Nombre
[...]
PING:
TITLE: El Documentalista Enredado » El valor de la información que aportan los usuarios
BLOG NAME: El Documentalista Enredado » El valor de la información que aportan los usuarios
[...] folksonomías“, de las que también se habló. Pero lo que no se pudo ver fue ninguna aplicación de este tipo de experiencias en un sistema de información documental o bibliotecario. Esto me reafirma en mi idea de que el mundo de la Docu [...]