Indización automática de imágenes
14 de enero, 2004 por Catuxa
El tema viene a raíz del post anterior en donde pedíamos ayuda para conocer cómo funcionan los sitemas de indización y descripción de imágenes. En los comentarios, Ana e Iñigo nos dejaron alguna información que puede sernos de ayuda para un primer acercamiento al tema.
Ana Núñez nos decía: Bueno… por lo que yo se (que no es mucho), se que se estan promoviendo formas de indizar las fotografías desde sus características no textuales: Esto es, no introduciendo metadatos, ni describiendolas. De las características intrínsecas de las imágenes -color, textura, tamaño- se extraen los “términos” por lo que se recuperaran imágenes que se asemejen a lo que buscamos. Por ejemplo, en vez de comenzar señalando términos, señalaremos imágenes, que vayan conteniendo las características de la imagen que buscamos…
Iñigo Arbildi aportaba: Creo que de lo que habláis es de los sistemas DAM (Digital Asset Management o Gestión de Activos Digitales). Yoconozco el de IBM, basado en IBM DB2 Content Manager, que es el sistema que usa, pej. Coca-Cola a nivel internacional. Ellos tenían un verdadero lío de imágenes, spots, etc, que hacía que duplicaran trabajo entre diferentes países. De manera que optaron por un DAM, que les permitiera buscar por pej. Santa Claus, y recuperara todos los vídeos, canciones, logos o arte gráfica relacionada con el tema, y así no gastar un dineral haciéndolo de nuevo. Este software originalmente permitía búsquedas por color y demás, pero esas características se han quitado, pues lo que de verdad funciona es la indización. Por ello tiene un buen sistema de profiling (ficha de metadatos). Últimamente trabajo mucho implantando Sharepoint Portal Server (e. ECM de Microsoft) que tiene un sistema de indización automática, que tiene que aprender de unas cuantas catalogaciones que hagas. El problema es que no he probado la autocategorización con imágenes, que son más difíciles de indizar que un documento textual (ya que el sistema tiene todo el texto completo (no sólo los metadatos) para extraer conclusiones y comparar entre la categoría que tu le das a la imagen y su contenido).
Yo no tengo ni idea del tema, pero por las propias características de los documentos audiovisuales, sería interesante conocer métodos diferentes al que se sigue en el textual para su análisis documental y su indización. Existe un proyecto de norma MPEG7 que establece un conjunto de descriptores multimedia para el acceso a las imágenes en movimiento La familia de estándares MPEG se creó a principios de 1988 en los laboratorios de CSELT de Turín con el propósito de obtener un estándar mundial para las imágenes en movimiento, audio, y las imágenes combinadas con audio. ?Sabeis si se ha establecido algo así para las fotografías, dibujos e ilustraciones?