2. ¿Qué es digitalizar?

Nos parece importante comenzar explicando aunque sea rápidamente qué es “lo digital”, para recalcar que la digitalización es mucho más que convertir archivos físicos en algo incorpóreo para tenerlos en discos y acceder mediante computadoras.

En términos técnicos, la digitalización es un proceso por el cual el material de origen analógico se transforma al lenguaje binario de los bits: una combinación de ceros y unos que representan impulsos eléctricos. Al digitalizar, transformamos información de variado tipo y origen en una señal eléctrica que puede ser procesada por diversos dispositivos electrónicos y transmitida por redes, como una red de fibra óptica. ¿Pero qué implica todo esto?

En primer lugar: podemos guardar cada vez más cantidad de información en volúmenes físicos cada vez más reducidos; podemos transmitir esa información de manera prácticamente instantánea y llevarla a casi cualquier lugar del planeta. Esto significa que un archivo digitalizado puede ser consultado simultáneamente por muchas personas desde distintos lugares y que cada nueva consulta no implica el desgaste del objeto físico original.

Otra implicancia importante de la digitalización es que se produce una convergencia, ya que los distintos tipos de códigos y señales característicos de cada soporte -desde la cinta de un cassette hasta las letras impresas- se traducen en última instancia a un mismo tipo de codificación: el lenguaje digital. En consecuencia, los medios de almacenamiento y transmisión pueden ser los mismos para todos los tipos de archivos que se nos ocurra crear.

Esto significa que, a su vez, los archivos digitales pueden ser transformados fácilmente a distintos formatos: con las herramientas adecuadas es posible desde el reconocimiento óptico de caracteres (OCR) que transforma la representación gráfica de cada letra a caracteres de texto digital, hasta la conversión automatizada de ese texto a voz para la lectura por parte de personas ciegas o de baja visión.

Pero hay más ventajas aún: el archivo digital puede guardar información acerca de sí mismo (metadatos), lo que facilita la búsqueda de información y hace más simple su incorporación a otras colecciones manteniendo los datos de origen. Por ejemplo: podemos guardar en la colección digital de una biblioteca local una imagen obtenida de la biblioteca nacional junto con sus respectivos datos, tales como autor, año de edición, temas, etc.

Sin embargo, hay que tener en cuenta algunas limitaciones. En el proceso de digitalización la información analógica es traducida a bits, dando como resultado una representación imperfecta en la que siempre habrá ciertas pérdidas de información. Esta pérdida puede ser relevante o no, según para qué fines se digitaliza. Por ejemplo: una fotografía digital de resolución media a baja, puede ser una excelente representación de un texto escrito para el ojo humano, pero podría no servir para el reconocimiento óptico de caracteres, que requiere de una imagen de alta resolución.

Otra limitación de los archivos digitales está dada por la obsolescencia de los formatos y de los programas que abren y modifican estos archivos. Por ejemplo, si almacenamos un libro en formato .DOCX de Microsoft Word, es posible que en algún momento del futuro, si el fabricante de ese programa deja de desarrollarlo y cae en desuso, ese archivo ya no pueda ser abierto ni editado y prácticamente lo perderíamos. Por eso es importante trabajar siempre con los denominados formatos abiertos, cuyas especificaciones son públicamente conocidas y responden a estándares que se van manteniendo con el consenso de organismos internacionales y participación de los desarrolladores de software. Para el caso citado, un formato abierto y estándar para documentos de texto sería .PDF o .ODF, por ejemplo.

>> Continuar: 3. Digitalización de documentos de texto e imagen