Módulo 2: Panorama general de herramientas y técnicas de digitalización según los distintos formatos

3. Digitalización de documentos de texto e imagen

El tipo de documentos que encontramos en instituciones culturales como museos, archivos y bibliotecas, es claramente distinto del que se guarda en una empresa, un organismo burocrático o incluso en una casa. Estos documentos no interesan solamente por la información que contienen, sino que se los quiere preservar por el significado que tienen para la memoria colectiva. Así que no serán digitalizados únicamente para “hacer lugar” y poder deshacerse de una gran cantidad de papel, reduciendo el espacio de almacenamiento. Al digitalizar este material, casi siempre va a ser muy importante la preservación del original, por lo que se usarán procedimientos que conserven entero y en buenas condiciones cada ejemplar.

Las herramientas más usadas en este caso son los escáneres especiales para libros, que cuentan con cuna en forma de V en la que se coloca el libro y se lo abre en su ángulo de lectura natural, sin forzarlo. Pensemos que en un escáner común de “cama plana” hay que abrir el libro completamente y además apretarlo bajo la tapa del escáner, afectando la encuadernación. O pensemos en los escáneres de alimentación automática, similares a las fotocopiadoras, que requieren que las hojas estén sueltas y por lo tanto obligan a desencuadernar el libro.


Escáner Canon PIXMA MP830 con alimentación automática

Escáner Plustek 4800 de cama plana


Escáner de libros industrial

Escáner de libros artesanal http://diybookscanner.org


Los escáneres de libros pueden capturar digitalmente las hojas de los libros a gran velocidad utilizando cámaras de fotos. Por lo general producen archivos de imagen que se guardan en formato .TIFF, que son adecuados para hacer copias de preservación y que pueden a su vez ser transformados para generar libros digitales amigables para el usuario. Con el trabajo de post-procesamiento que sigue a la captura se puede llegar a un .PDF o a un .EPUB, más adecuados para un lector que quiere consultar el archivo. El procedimiento que se usa para los libros también es aplicable a revistas, prensa y otro tipo de documentación, aunque estos pueden tener requerimientos especiales según el tamaño de los ejemplares, el tipo de encuadernación y la proporción entre texto e imagen.

En todos los casos, estos aparatos suelen ser bastante caros, pero también existen alternativas de bajo costo. El proyecto DIY Book Scanner facilita instrucciones para montar escáneres de libros económicos con materiales y tecnologías accesibles para cualquier institución cultural. En este video se puede ver una demostración de su funcionamiento.


Algunos recursos recomendados:

Comunidad de escáneres de libros Do It Yourself: http://www.diybookscanner.org/es/index.html

Videotutorial de ScanTailor para el post-procesamiento de páginas escaneadas o fotografiadas:

Videotutorial de gImageReader (software libre para Linux) para el reconocimiento óptico de caracteres (OCR) de imágenes escaneadas o fotografiadas:

Videotutorial de ABBY FineReader 14 (software no libre para Windows) para el reconocimiento óptico de caracteres (OCR) de imágenes escaneadas o fotografiadas:

Una guía clásica para la digitalización de materiales de bibliotecas es el manual de IFLA “Directrices para proyectos de digitalización de colecciones y fondos de dominio público, en particular para aquellos custodiados en bibliotecas y archivos”. Si bien es de 2002, muchas de las recomendaciones siguen vigentes http://www.ifla.org/files/assets/preservation-and-conservation/publications/digitization-projects-guidelines-es.pdf

Una guía más nueva pero mucho menos completa de IFLA: “Directrices para planificar la digitalización de colecciones de libros impresos antiguos y manuscritos” http://www.ifla.org/files/assets/rare-books-and-manuscripts/rbms-guidelines/guidelines-for-planning-digitization-es.pdf

Proceso de digitalización en la Biblioteca Nacional de España. Es la guía de digitalización de dicha institución para su proyecto de Biblioteca Digital Hispánica: http://www.bne.es/webdocs/Catalogos/ProcesoDigitalizacionBNE.pdf

>> Continuar: 4. Obras plásticas