Automatización de tags
03 de agosto, 2006 por vanesa
Con motivo de la desconferencia- florecieron distintas opiniones sobre el tema tag. Un resumen muy resumido, es que Ana abogaba por la asistencia al usuario en la facetación, orientando la descripción por medio de facetas. Las tags, entonces, quedarían clasificadas. (En la desconferencia, lo acotó a un sistema cerrado como en un site de ecommerce donde funcionaría mejor)
La visión de Yusef se enfocaba más en la recuperación. Se mejoraría la visualización, se eliminarían palabras vacías que provocan el ruido y se aplicarían sistemas de recuperación clásicas de la RI “modelo espacio-vectorial, indización semántica latente, modelo probabilístico, etc etc” para mejorar la eficacia en las búsquedas
Por supuesto, no tengo nada que objetar a ninguna de las dos¡ Por aportar algo, mis comentarios a sus posts se basaban en la automatización de tags a partir de texto, muy útil yo creo en entornos cerrados. (Y también me encanta la facetación, en lo que coincido con Ana, que serían un excelente complemento a la automatización que no afectaría ni al momento de la descripción ni al usuario). y en que todavía no he asimilado que las tags se acerquen a las categorías (No lo veo Yusef) Y como siempre me cuesta explicarme, he intentado reunirlo en un sólo post.
LAS TAGS
- Las tags no son clasificación. Se pueden clasificar y el método más utilizado es la clasificación facetada: colores, temas, tipos de documento, motivo o uso del recurso son algunas facetas que se pueden utilizar. (siderean tagged facets)
– Los tags no tienen que ser añadidos por los usuarios. Ni siquiera hace falta que sea un entorno folksonomico¡ Las tags son sólo otro método de recuperación de información en internet.
- No todo se basa en tags de una única palabra. Las tags pueden ser de dos o tres palabras, el problema es cómo introducirlo en el sistema y como visualizarlas luego. No se debe perder legibilidad y compresión. Es fundamental en un entorno donde le das importancia a la recuperación por parte de los NO productores.
En resumen, sí asimilo las tags a las palabras clave, keywords.
CLASIFICACIONES
Clasificaciones clásicas como las jerárquicas son demasiado complejas, los clusters no funcionan demasiado bien, por lo que las facetas es la más utilizada y la más de moda, por ser útil y sencilla. ¿Para que quieres aplicar facetas? Al separarse el contenido, se alivia el ruido de las nubes de tags (los “artículos”, faceta formato, no aparecen entre “calamar” y “dinosaurio”, faceta tema) y se mejora la visualización y la recuperación.
En lo que estoy con Ana es que me parece que las facetas son de lo mejor que le pueden pasar a las tags, aunque tiene el problema de que necesitan de control y edición, con lo que resulta muy costoso. Pero ya hay ejemplos de navegación por browsing que funciona bastante bien (por ejemplo, )
AUTOMATIZACIÓN Y DESCRIPCIONES
No es un invento, ya hay bastantes posts (autofolksonomy for the blogosphere) y estudios , Browsing System for Weblog Articles based on Automated
Folksonomy sobre la automatización en las folksonomias.
Cómo se puede describir un objeto? Se puede describir con texto, por ejemplo: “Este objeto es verde, además que es muy ligero, pesa solo 15 kilos. Tiene conexión wifi y patas de acero”. Tiene descripción objetiva: es verde, y pesa 15 kilos, tiene wifi, tiene patas. No tiene descripción subjetiva, porque normalmente los objetos suelen ser neutros. El autor no añade valoraciones, las descripciones subjetivas suele estar presentes en los sistemas de marcado por parte de usuarios: me gusta, quiero comprarlo, que buen complemento a ese falda, es bonito, cool…
Los contenidos objetivos (no los subjetivos que sólo vendrían por parte de los usaurios se podrían automatizar de varias maneras. A lo bruto se podría decir que hay estas vertientes:
- Se podrían buscar caracteres dentro de un texto. Y definirlos como futuros tags. Muchas veces las tags son ejemplos incluidos en el propio cuerpo del documento: “con terraza”, indica que un piso tiene terraza en un 99,9 de los pisos con ofertas que contengan esa cadena de caracteres. En la descripción de un cuadro que diga “pop art” o “arte pop”, el 99% de las veces el estilo será pop, si en un post comentas un nuevo servicio con ajax, quizás no lo etiquetes con ajax, pero cuando busques ejemplos de ajax quizás t gustaría saber que está ahí. . Podrían definir un listado de colores, en una faceta llamada colores. Y cada vez que un usuario añadiera que es verde o cada vez que el sistema leyera verde en la descripción del objeto, se taguearia automáticamente como verde en la faceta color. En esencia, automáticamente una vez que hayas encontrado esos caracteres dentro de un texto y tengas una lista de tags, equivalente a las cadenas de caracteres de texto que quieras, un sistema automático podría localizarlos de nuevo en otras descripciones.
- comparaciones con otros items, para sugerir tags. Creo que así lo hacen en Tagyou . Se suelen incorprar sistemas que aprenden, con reglas y excepciones basados. El sistema se entrena
- análisis de contenido. Más complicado, pero sitios como tagthe ya utilizan mecanismos para la indización automática.
Los tags nos tienen porque ser definitivos, lo usuarios podrían modificar a modo de wiki o añadir nuevos tags para completar la descripción sobre todo si se basa en un sistema de perfiles personales. Que taggearan porque de otro modo ellos no lo encontrarían luego en su ficha o archivo o wishlist personal.
Respecto a las descripciones de texto, una oferta de un piso o de un producto de ebay, la descripción objetiva también se podría completar dejando al usuario la subjetiva en la que se pueden barajar mezclar tags y de sistemas de ratios porque, como se comentaba en la desconferencia física y bloguera, sigue existiendo un problema para forzar al usuario a hacer una acción en los sistemas sociales y ratear supone menos esfuerzo y una visualización más directa.
La recuperación y los sistemas dependen del contexto, de los componentes, de los objetivos, de los usuarios y de la calidad de sus descripciones (de lo que habla estupendamente terremoto en Tipologías y estilos en el etiquetado social, que tambien comenta la parte negativa de la automatización a partir de una comentario de Yusef “Cualquier comercial te dirá que su producto es eficaz al 95% en el taggeado. Y eso, en un entorno de sólo 1000 productos ya es un fracaso gordísimo. Si lo puedes hacer artesanalmente, mejor.”). El mundo tag, todavía está por aprovechar. A ver si estos debates blogueros ayudan.
diego, a comentar, q lo he posteado hoy por lo q dijiste
pd: perdon por la extension, pero es q ya q lo tenia escrito…sorry
Super-valiosa síntesis y aportaciones. Muchas gracias.
No creéis que nos merecemos un workshop/congresillo/ncuentro/desconferencia/loquesea sobre tagging?
Yo tengo muchas dudas y ganas de compartir cosas con senseis de la documentación, me apetece mucho.
Y si apañamos algo para después del verano?
Hola Javier,
lo de “sintesis” es una broma, verdad?
Lo de juntarnos me encantaría, esto es un poco como una madeja supongo, cuanto más se habla más se hilo se saca. Lo malo es la gente de fuera, vosotros y Ana estais por aqui, pero falta important people de fuera¡
A ver a ver
saludines
pd: perdona por tardar en contestarte, no funcionó el sistema de aviso de comentarios¡
vuelvo a votar por el workshop. Así vane y yo podremos tirarnos de los pelos discutiendo sobre el sexo de los tags
Pues la siguiente pregunta despues de estar tanta gente de acuerdo, es cuando y donde, no? a ver si nos ponemos de acuerdo
Yusef, la verdad es q si alguien m iba a decir q me iba a poner tan cabezota con esto tan “teoriconebuloso”… por cierto, si llegaste a leerlo todo, espero que ya quedara más claro lo q queria decir en mis comments de tu blog.
saludines
pd: otra vez q el sistema de comentarios no avisa. q desastre de sistema.
Si os apetece, podemos probar en septiembre. En 11870 ponemos sitio, comida y bebida. Hace?
Por mi parte, “hace”, pero si todo lo permite en septiembre iré de viajecillo unos dias.