Clasificación de los post según nuestro estado de ánimo
25 de agosto, 2005 por Catuxa
Gilad Mishne de la Universidad de Amsterdam ha estado investigando sobre la clasificación de los post basada en el estado de ánimo y humor del autor del blog, y todo ello usando una máquina que irá aprendiendo con la retroalimentación: Experiments with Mood Classification in Blog Posts (PDF)
We present preliminary work on classifying blog text according to the mood reported by its author during the writing. Our data consists of a large collection of blog posts online diary entries which include an indication of the writers mood. We obtain modest, but consistent improvements over a baseline; our results show that further increasing the amount of available training data will lead to an additional increase in accuracy. Additionally, we show that the classification accuracy, although low, is not substantially worse than human performance on the same task. Our main finding is that mood classification is a challenging task using current text analysis methods.
Aburrimiento, alegría, entusiasmo, tristeza, somnolencia… serán detectados por un robot para clasificar las entradas de neustras bitácoras…
Me parece muy complicado (y muy pretencioso) pretender clasificar textos en categorías como aburrimiento, alegría, tristeza…
Cada uno expresamos esos estados de una forma muy personal que no tiene porque entrar dentro de una categoría rígida.
Para poder hacerlo con cierto rigor, primero tendría que conocer bien la personalidad del blogger.
Sino, más que clasificar los post, este robot acabaría clasificando a los bloggers (perfil psicológico incluído): bloggers aburridos, optimistas, pesimistas, plastas…
Pero eso no hace falta que nos lo diga ninguna máquina. Ya nos damos cuenta.
El tema es demasiado complicado como tu dices Maria Elena, pero podría ser interesante para lo que llaman Voice Tagging: Capturar las emociones que nos sugieren las primeras impresiones de los documentos (fotos, musica,…) lo que denomina “emotitags”, que hemos comentado en Exprimiendo el tagging