Módulo 3: Gestión de colecciones digitales

6. La importancia de los estándares

Para un sistema informático el significado de un objeto digital es totalmente indiferente. La máquina no puede entender por sí misma la diferencia entre un manuscrito medieval y una película documental de la Segunda Guerra Mundial. Si le decimos a la máquina que el libro es de otra época o la película es de otro tema, la podremos “engañar” fácilmente, porque no distingue significados. Entonces, ¿cómo hace más tarde el usuario para consultar en un sistema informático materiales sobre la segunda guerra, si la máquina no sabe cuáles son?

La forma de hacer que la máquina “reconozca” las obras que posiblemente está buscando el usuario, es describiendo correctamente los objetos digitales de forma estructurada, siguiendo siempre un mismo estándar. Esto implica que cuando subimos un archivo digital al repositorio, vamos a cargar también una serie de datos sobre el mismo. Como mínimo, un título, pero esto no es suficiente. Podemos agregar autor, tema, fecha, estado de derechos de autor, formato y otros aspectos que describen al objeto. Esto permitirá a la máquina encontrar y recuperar los objetos, y facilitará que el público, al hallarlos, conozca más sobre lo que ha encontrado y sobre su contexto. Con algunos de estos datos los repositorios generan links automáticos que hacen que los objetos se enlacen unos con otros, para que el usuario pueda navegar por la colección.

Hemos dicho que la catalogación debe seguir “un mismo estándar”. Esto significa plegarse a ciertos acuerdos en cuanto al vocabulario utilizado para describir los objetos digitales. Si bien es posible crear una forma sui generis de designar y describir nuestros archivos, es un trabajo laborioso y en definitiva poco útil, ya que los sistemas informáticos tienen incorporados ciertos estándares. Si los ignoramos, hacemos que nuestro archivo resulte incompatible con otros.

Por ejemplo: si ponemos a disposición en nuestro repositorio un archivo musical en MP3 sin descripción, o con una descripción que no sigue los estándares, cuando el usuario lo descarga y lo reproduce en su computadora, su software de reproducción multimedia no va a mostrar correctamente los datos del archivo. El reproductor de MP3 va a leer automáticamente los datos y metadatos e intentará mostrar al usuario el nombre de la canción y del artista en los campos correspondientes. Pero si las propiedades de este archivo no están bien descriptas, quizás donde debería figurar el dato del autor, aparecerá el nombre de la institución que digitalizó el audio, o peor aún, el nombre de usuario correspondiente a la computadora en la cual se editó el archivo (este es un error muy común).

Para prevenir este tipo de errores y mantener una colección coherente recomendamos:

  • Al editar el objeto digital, y antes de subirlo al repositorio, editar sus propiedades. Los principales programas para trabajar con texto, imagen, audio y video, tienen la opción de crear y editar las propiedades de los archivos. Por lo general, se trata de una ficha con algunos campos básicos que podemos completar, como título, autor, palabras clave, etc. Otras propiedades se generan automáticamente, como la fecha de la última modificación, tipo de archivo, tamaño, etc. Todos estos datos “viajan” con el archivo y pueden ser leídos por personas y por máquinas.

  • Incorporar un modelo de metadatos en el repositorio, con una serie de campos estandarizados que sean ampliamente reconocidos. Un modelo muy utilizado es Dublin Core, que viene incluido en sistemas de gestión como los que vimos (Omeka, DSpace y otros). Al cargar el archivo en el repositorio, veremos una ficha cuyos campos siguen el estándar Dublin Core. Algunos campos se completarán automáticamente con los metadatos que ya tiene el archivo (el título, por ejemplo) y otros los podemos completar en el momento, o corregir los errores que encontremos.

En síntesis, un estándar como Dublin Core, no es ni más ni menos que una convención. Sirve para que cualquier persona y cualquier máquina que tenga incorporado el estándar, sepa identificar datos referentes al autor, palabras clave, tipo de recurso, etc. En total, hay 15 campos o descripciones semánticas en este estándar, cuyas definiciones son acordadas por consenso entre los miembros de la Dublin Core Metadata Initiative. El objetivo de la iniciativa Dublin Core es la interoperabilidad: cuando un mismo modelo de metadatos se mantiene a través de distintos repositorios, las búsquedas serán más fáciles para los usuarios, la migración de un sistema de repositorio a otro será menos compleja para la institución y la incorporación de una obra existente en un repositorio externo será un paso muy simple. Esencialmente, esto sirve para que el trabajo de generación de información a partir de un objeto se lleve a cabo una sola vez. Por ejemplo: Internet Archive utiliza Dublin Core para estructurar los metadatos. El portal autores.uy, que tiene por objetivo generar un acervo digital de obras uruguayas en dominio público, utiliza el mismo estándar. Cada vez que se encuentra en Internet Archive una obra que puede ser incorporada a la colección, catalogarla resulta mucho más fácil, ya que campos como “Autor o creador” para Internet Archive y para autores.uy significan lo mismo y tienen la misma estructura. La ficha prácticamente se genera sola, por lo que hay que tipear menos, ahorrando tiempo y esfuerzo.

>> Descargar PDF <<