La importancia del Metadata
- 8th Febrero 2010
- PorCarlos Alonso
- Escribir comentario
Encontrando Contenido
El metadata es el centro neurálgico para la gestión de contenido dentro de la estructura fundamental de TebasCMS, existen otras formas de organizar nuestro material, como disponerlo en una estructura de carpetas o categorías, tal y como haríamos en un sistema de ficheros en nuestro PC. Otra posibilidad es organizar el contenido teniendo en cuanta el tipo de contenido que es, pero estas dos formas de organización son solo válidas hasta cierto punto, ya que permiten organizar nuestro contenido en un solo sentido; por ejemplo: organizar todos los vídeos en una categoría, las fotografías en otra, los documentos en otra y el audio en otra, o bien hacer categorías en base a proyectos y incluir dentro de ellas todos los vídeos, fotografías y documentos que pertenecen a cada proyecto. En cualquiera de estas dos formas, nos encontraremos en una situación de “rigidez organizativa” con respecto a nuestro contenido, rigidez que sufriremos a la hora de buscar, cuando se nos plantee la necesidad de obtener del sistema los vídeos relativos a un proyecto, ciertas fotografías del mismo, más algunas fotografías pertenecientes a otro proyecto y realizar una nueva agrupación con este material.
Usando la documentación (metadata) como primer nivel de organización, podemos clasificar nuestro contenido de varias formas simultáneamente, de manera que puedo disponer de contenido, por ejemplo de vídeo, que pertenezca por un lado a la categoría de “economía” y por otro lado tener ese mismo vídeo organizado en una colección de todas aquellas noticias que tengan relación con el Fondo Monetario Internacional (FMI) y conseguir que ese vídeo aparezca en los resultados de mis búsquedas cuando busco por cualquiera de los dos criterios.
La diferencia fundamental entre estas dos estructuras organizativas, radica en buscar contenido o tratar de encontrarlo. Hay muchos sistemas de gestión donde el usuario dispone su contenido, organizado por sus criterios y para encontrarlo recorre un árbol de categorías que la mayoría de las veces se hace excesivamente extenso y complejo, o tiene que plantearse la pregunta de si el material que está buscando estaba disponible como vídeo, fotografía o documento. De esta manera el gestor de contenido tiene que tener una idea muy clara de como esta organizado y qué contenido tiene, con lo que muchas de las veces se convierte en el “amo del calabozo” y resulta casi imposible encontrar algo en el sistema si no es él quien lo busca.
Un sistema de gestión de contenido debe atender las peticiones de todos los usuarios, sin la necesidad de que sepan que hay en el sistema y como encontrarlo, una búsqueda simple donde poder especificar las claves del contenido que está buscando. Si necesitamos una fotografía de un paisaje campestre, introducimos “campo” en la caja de búsqueda del sistema y debe aparecernos todo el contenido etiquetado como tal. Además podremos buscar por “campo río árbol casa” y deberemos obtener un contenido en el que aparezca un bucólico paisaje de la campiña en el que aparece una casa a la sombra de un árbol al lado de un río, por ejemplo.
Listas de Valores
Lo ideal para la definición de un esquema de documentación, es la definición de listas de valores, expresados en listas desplegables o selectores de etiquetas donde reflejemos información sobre origen, idioma, personajes, categorías, acciones, tipos de plano, emociones. Este método es mucho más eficiente que un campo de texto libre, donde el usuario que inserta la información puede cometer errores tipográficos, o lo que es más complicado, poner a todos los usuarios de acuerdo en el criterio de documentación libre; con términos fijos, no hay opción a cometer errores y esta mucho mas nítido el concepto de anotación.
Lo antes posible
Otro aspecto importante es añadir metadata al sistema “lo antes posible” incluso antes de disponer del material en sí, de manera que generamos contenido sin la necesidad de tener un media asociado. Debemos añadir el metadata en el proceso de ingesta y aprovecharnos de los métodos automáticos de extracción de esa información disponibles en TebasCMS. Podemos aprovechar el propio nombre del fichero de media para extraer información sobre que tipo de media es, simplemente por el tipo de archivo, pero además podemos codificar el nombre del mismo y usar una convención de datos que permita a TebasCMS catalogar el contenido desde su entrada en el sistema, incluso relacionarlo con otros contenidos.
Los métodos de extracción de información digital como etiquetas Exif y similares, permiten a TebasCMS saber muchas cosas sobre el contenido y volcar esa información sobre campos de documentación del esquema de datos. Podemos obtener información, también, de la estructura de directorios desde la cual importamos en media en el sistema, asociando los nombres de las carpetas a categorías u otros campos de documentación.