Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura
¿Cómo preservar la información digital?

París - Hoy en día, una parte cada vez más considerable de la información generada en casi todos los ámbitos de la actividad humana se compila con medios digitales y está preparada para que sea accesible en ordenadores. Sin embargo, el inmenso tesoro de datos digitales acumulados se puede perder, a no ser que se adopten políticas concretas y se elaboren técnicas específicas para conservarlo.

A estas alturas ya se han sufrido pérdidas, que pueden ser aún mayores si no se hace nada por remediar la situación. El 27 de julio de 2001, la Agencia Reuters dio la noticia de que Joseph Miller, un neurobiólogo de la Universidad de Carolina del Sur, había pedido a la NASA que comprobase unos datos, ya antiguos, que las sondas espaciales Viking había transmitido desde Marte a mediados de los años setenta. La Agencia Espacial norteamericana descubrió que los datos estaban grabados en cintas informáticas que tenían más de 25 años y no se podían leer a causa de su formato. La NASA hacía mucho tiempo que había olvidado ese programa informático o, como dijo Miller, “ ya se habían muerto los programadores que lo conocían”.

Miller estaba buscando pruebas de la existencia de una vida microbiana en Marte en esos datos, que en un principio se habían desechado por contener “indicios de actividad química sin interés”. Al final, tuvo que conformarse con documentos impresos que habían sido conservados por el equipo de la NASA de aquel entonces, aunque sólo contenían una tercera parte de los datos digitales primigenios.

La preservación de informaciones científicas, datos de investigaciones, productos de los medios de comunicación y obras de arte digitales – por no mencionar mas que estos pocos ámbitos – plantea evidentemente nuevos problemas. Si se quiere tener acceso a esos materiales en su estado original, al mismo tiempo que se conservan los archivos digitales que constituyen los datos interesados se debe conservar también el equipamiento técnico, es decir el material y programas informáticos primigenios u otros que sean compatibles. En muchos casos, los componentes multimedia de los sitios Internet, comprendidos los enlaces con otros sitios, plantean dificultades suplementarias por lo que respecta al derecho de autor y a la ubicación geográfica, haciendo que no sea nada fácil determinar a qué país pertenece un sitio Internet.

La UNESCO ha examinado estas cuestiones con vistas a definir una norma que, en esta era digital en que vivimos, sirva de guía para los esfuerzos que los gobiernos están realizando en materia de conservación. En la reunión del Consejo Ejecutivo de la Organización celebrada el pasado mes de mayo, algunos Estados Miembros convinieron en que era necesario actuar rápidamente para salvaguardar el patrimonio digital. La discusión mantenida en el Consejo sobre este particular se basó en gran parte en un documento de trabajo1 que exponía a grandes rasgos la problemática de la conservación del material digital. Este documento fue elaborado por la European Commission on Preservation and Access (ECPA), una fundación sin fines lucrativos con sede en Ámsterdam.

La ECPA dice que los métodos tradicionales de conservación, por ejemplo el del “depósito legal” practicado por las Bibliotecas Nacionales para asegurarse de que se conservan copias de cualquier material impreso, se pueden difícilmente aplicar al material digital por múltiples razones, sobre todo porque las “publicaciones” Internet suelen estar constituidas por datos almacenados en servidores dispersos por todo el mundo. Además, tan sólo el volumen de esos datos plantea ya un problema. En efecto, se estima que en Internet hay mil millones de páginas, cuyo promedio de vida es sumamente corto: entre 44 días y dos años.

La conservación de los sitios Internet plantea problemas descomunales. En efecto, los sitios cambian y se actualizan constantemente y el material reemplazado se esfuma sin dejar ni rastro. Muchas veces son sitios Internet enteros los que se pierden de vista para siempre, cuando las entidades que los crearon cesan sus actividades comerciales o dejan de suscitar interés. Esto no sólo ocurre con páginas personales o sitios extraoficiales, sino también con sitios importantes o de carácter oficial. Por ejemplo, cuando George Bush asumió la presidencia de los Estados Unidos, con el sitio de la Casa Blanca (www.whitehouse.gov) se hizo borrón y cuenta nueva.

De esta manera, la colección de discursos y comunicaciones oficiales de la Administración Clinton desapareció de la noche a la mañana. Aunque una gran parte del material de la época de Clinton ha sido conservado por la Administración Nacional de Archivos y Registros (NARA), que se había preocupado de archivar varias versiones del sitio Internet a lo largo de los años de su presidencia, eso no ha impedido la destrucción de una cantidad colosal de enlaces Internet con ese material albergado en otros sitios de la Red.

Asimismo, se han perdido por completo las primeras ediciones electrónicas del diario sueco Aftonbladet, que cubrían dos años y medio (desde el 25 de agosto de 1994 hasta el 26 de marzo de 1997) de la actividad de este órgano destacado de la prensa diaria de Suecia y que, además, no tenían un contenido exactamente igual que el de las ediciones en papel.

Con respecto a Internet, que es sin discusión el medio de publicación más democrático de todo los tiempos, algunos opinan que merece ser conservado como un todo, en la medida en que sus páginas y foros de discusión se pueden considerar como un valioso espejo de nuestra sociedad.

Se plantean problemas técnicos para garantizar que el material digital conservado en archivos sea accesible en su forma primigenia. El porcentaje de la información y de las obras artísticas producidas con soportes tradicionales como páginas impresas, cintas magnéticas o filmes, va disminuyendo de año en año con respecto al que representa el material destinado a ser consultado en los ordenadores. Los aparatos y programas informáticos se reemplazan sin cesar por nuevas versiones, que a la larga son incompatibles con las anteriores. Esto significa que dentro de muy pocos años será inaccesible ese material, que no sólo comprende grabaciones sonoras, diseños gráficos animados y fotografías, sino también enlaces con sitios Internet y bases de datos.

Es asombroso el volumen de los datos que es menester cribar para seleccionar aquellos que merecen conservarse. Según un estudio recientemente realizado por la School of Information Management and Systems de la Universidad de California (Berkeley)2, “la totalidad de la producción anual mundial de material impreso, filmado, óptico y magnético exigiría aproximadamente una capacidad de almacenamiento equivalente a 1.500 millones de gigaoctetos, es decir 250 megaoctetos por habitante del planeta, ya sea hombre, mujer o niño”.

Para hacerse una idea de la cantidad de datos que eso representa, hay que tener bien presente que el clásico disco duro de un ordenador personal en venta actualmente posee una capacidad de 20 a 30 gigaoctetos, o sea entre 20.000 y 30.000 megaoctetos. Según ese estudio de la Universidad de California, el material impreso de todo tipo representa menos del 0,003% de la cantidad total de información almacenada, que comprende fotografías y películas, digitales o analógicas, así como páginas de Internet, grabaciones sonoras, etc.

La mayor parte de los demás datos, es decir los que son interactivos, no se pueden conservar limitándose a imprimirlos y archivarlos, sino que han de almacenarse con medios digitales, por ejemplo CD-ROM, que son mucho menos duraderos que el papel sin ácido o el microfilme.

Otra cuestión compleja que se plantea es la de los derechos de autor, comprendidos los inherentes a los programas informáticos que se necesitan para acceder a archivos digitales. La ECPA señala que se puede asociar un sinnúmero de derechos a los sitios Internet, combinando los materiales mixtos procedentes de fuentes diversas. Además, recuerda que todavía se está pendiente de llegar a un acuerdo sobre el principio del “derecho de copia para archivo”.

Se han adoptado iniciativas muy apreciables - la mayoría de las veces en los países industrializados - para proteger el patrimonio digital, incluidos los sitios Internet. Un ejemplo notable de protección en un país del Sur es el de la Bibliotheca Alexandrina de Egipto, que recientemente se ha dotado con el llamado "Archivo Internet" (IA). El IA es una biblioteca digital de sitios Internet y de otro tipo de obras culturales digitales, a la que tienen libre acceso investigadores, historiadores, universitarios y el público en general. Un “instrumento de anterioridad” permite a los investigadores recorrer los sitios Internet tal como eran antes, aun cuando su material ya no esté disponible en la Red.

El IA también posee obras televisivas y cinematográficas y el cúmulo total de la información que contiene asciende a más de 100 teraoctetos (100.000.000.000.000 de caracteres). Basándose en el IA de la Bibliotheca Alexandrina, la Oficina de la UNESCO en El Cairo está elaborando un proyecto piloto cuyo contenido digital, en lengua árabe, será protegido, clasificado y registrado en un índice.

La complejidad de los problemas suscitados implica que los archivistas y bibliotecarios deben movilizar en favor de la conservación a los productores de información digital, en la que se han de incluir los programas informáticos. La ECPA estima que los productores deben tomar en cuenta la conservación a la hora de diseñar sus productos, porque ya no estamos en una época en que esa tarea incumba exclusivamente a las instituciones de archivos y bibliotecas. Por su parte, la UNESCO ha iniciado una serie de consultas con vistas a elaborar directrices y mostrar las prácticas más idóneas en la materia, no sólo para que no se pierda el fruto de la inestimable labor realizada por científicos y artistas, sino también para que los historiadores del mañana no carezcan de información esencial sobre el mundo de hoy.

1 http://unesdoc.unesco.org/images/0012/001255/125523e.pdf
2 http://www.sims.berkeley.edu/how-much-info



Contactos:
Roni Amelan,
Oficina de Información Pública,
Sección editorial
Tel: (+33) (0)1 45 68 16 50

Sue Williams,
Oficina de Información Pública,
Sección editorial
Tel. 01 45 68 17 06
e-mail: s.williams@UNESCO.org



 
Autor(es) UNESCOPRESS
Fuente Artículo No.10-2002
Sitio Web (URL) Sitio Web: Universidad de California - Berkeley
Website 2 (URL) Sitio Web : reporte sobre la preservación del Patrimonio Digital
Fecha de publicación 31 May 2002
© UNESCO 1995-2007 - ID: 4805