El 1 de septiembre de 2017, Tuenti, la red social española lanzada en 2006 y que durante un tiempo fue la plataforma por excelencia de los adolescentes, cerró definitivamente. Con ella, desparecieron los más de 6000 millones de fotos que los usuarios habían subido. La red había avisado y puesto a disposición de sus usuarios una herramienta para descargarse sus álbumes, pero hubo muchas personas que por olvido, dejadez o por no haberse enterado perdieron esas imágenes.
Cualquiera que lleve algo más de una década de experiencia en internet podrá contar anécdotas de datos que una vez creyó eternos desapareciendo en el éter de la red. Correos electrónicos evaporados al dejar de usar un servicio de email (aunque no se cierre la cuenta); mensajes y publicaciones en foros que dejan de existir; blogs eliminados cuando cierra la plataforma que los alojaba; fotografías que se borran cuando la empresa impone un nuevo límite; fallos en migraciones que hacen que se pierdan 50 millones de canciones.
El último ejemplo es de MySpace, que en 2019 anunció que ups, algo había salido mal y había sido imposible recuperar esas canciones perdidas, subidas al servicio entre 2009 y 2015. Unos días después, sin embargo, la organización para la preservación de la web Internet Archive publicó un catálogo con casi 500.000 de esos archivos de audio. Es decir, los usuarios habían perdido el acceso y MySpace no había hecho copias de seguridad, pero muchos de los datos estaban alojados en otros lugares. En este caso, un grupo académico se había descargado unos años antes toda esa música y se la había enviado a Internet Archive. Pero si quien ha perdido sus fotos o emails no sabe que están en otros servidores o no tiene acceso a ellos, sentirá que, efectivamente, han desaparecido. Lo que, por otra parte, no es nada raro.
“Todo nuestro contenido online desaparecerá por completo tarde o temprano”, señala Daniel Gayo Avello, profesor titular del Área de Lenguajes y Sistemas Informáticos de la Universidad de Oviedo. Cuánto tarde en desaparecer, explica, dependerá de cuán activamente trabajemos para preservarlo. “Si todas mis fotografías, vídeos, mensajes y correos están en alguna plataforma su permanencia depende, obviamente, de los términos de uso y de la propia supervivencia de la plataforma. Por ejemplo, dependiendo de los términos de uso es posible que mi contenido desaparezca después de un tiempo sin acceder a mi cuenta (es decir, no confiaría en que mis correos de Hotmail aún sigan ahí). Por otro lado, si la empresa dueña de la plataforma lo decide, esos contenidos pueden desaparecer de un día para otro”, elabora.
Creer que esa historia personal que hemos ido subiendo o publicando en distintos rincones de internet estará siempre ahí es una actitud algo ingenua. Gayo Avello compara la web con un bosque. “Puede llevar siglos en un lugar y, aunque algunos de sus árboles pueden ser centenarios, la mayor parte no lo son. Los árboles crecen, cambian, mueren, y el bosque en ocasiones también crece, pero en otras mengua, bien por eventos fortuitos o bien por acciones intencionadas. Lo mismo pasa con la Web, unos sitios web llegan y otros desaparecen”, explica.
Hay cifras sobre todo esto: un informe reciente de Pew Research indica que el 25% de las páginas webs que existieron en algún momento entre 2013 y 2023 ya no existen. Si nos fijamos en las más antiguas, las de 2013, el porcentaje de desaparición aumenta hasta el 38%. Gayo Avello, que en 2022 dio una charla sobre este tema en el TechFest de la Universidad de Oviedo, pone como ejemplo la web Million Dollar Page, una reliquia de hace casi veinte años que buscaba “una forma de monetización que a día de hoy parece bastante infantil: vender por 1$ cada uno de los píxeles de un banner de 1000×1000 píxeles. Cada anunciante podía comprar la porción que estimase y tener un enlace a su sitio. En 2014, menos de diez años después de su lanzamiento, más del 20% de los sitios apuntados ya no existían”, explica.
Volviendo a nuestros archivos personales alojados en distintos servicios, ¿deberíamos empezar a temer su desaparición? ¿corren peligro las imágenes que tenemos, por ejemplo, en Google Fotos? Lorena González Manzano, especialista en ciberseguridad y miembro del grupo de trabajo Computer Security Las (COSEC) en la Universidad Carlos III, explica que “no hay nada 100% seguro y siempre pueden atacarlo”. Sin embargo, “si el proveedor de servicios es de confianza o una gran empresa (por ejemplo, Google), asumimos una seguridad razonable”.
Un ciberataque podría acabar con datos borrados, pero lo habitual es que las empresas que los alojan tengan “sistemas para evitar que, tanto ante un ciberataque como ante la caída de un servicio, los datos de los usuarios se pierdan”. Además, continúa la experta, el objetivo de los atacantes no suele ser borrar los datos, sino simplemente acceder a ellos. “No obstante, podrían ocurrir ataques tipo ransomware que lo que hacen es acceder al servicio donde se alojan nuestros datos, los cifran y solicitan dinero, bien a nosotros o a la empresa, para poder recuperarlos o para no desvelarlos o dejarlos públicos”, señala.
Estudiar la historia con datos que desaparecen
La desaparición de páginas webs y de publicaciones personales supone también la pérdida de fuentes de documentación muy valiosas a la hora de escribir la historia de estas décadas. Con el objetivo de preservar al menos parte de la riqueza de la web, organizaciones como Archive Team llevan años archivando contenido web para que no se pierda: blogs de Blogger (si están asociados a cuentas de Google inactivas, posiblemente desaparezcan), mensajes públicos y de relevancia en Telegram, vídeos de YouTube…
“El principal problema de trabajar en entornos digitales es la efimeridad de los datos”, coincide Elisa García Mingo, doctora en Antropología Social y profesora en la Facultad de Ciencias Políticas y Sociología en la Universidad Complutense de Madrid. “Nos damos cuenta porque los vemos desaparecer en nuestras investigaciones: una cuenta que sigues una página web…”, señala.
También está en riesgo una gran parte del conocimiento científico. Según un estudio publicado a principios de este año que investigó cómo están archivadas las copias digitales de artículos académicos (en muchas ocasiones ya no existe copia física), una tercera parte de las editoriales no parecía tener en marcha ningún tipo de actividad archivística destinada a preservarlos. (Y bien, bien, con copias en al menos tres archivos, lo hacía menos del 1% de las editoriales de revistas académicas).
Por otro lado, hablar de efimeridad digital no significa que no exista el problema contrario, aquello que queremos que desaparezca y no desaparece, lo que ha llevado a todas las reivindicaciones sobre el derecho al olvido. García Mingo, que estudia las prácticas de violencia sexual digital entre jóvenes, señala que sí hay algo paradójico en todo esto. “A veces tratamos los datos como si fueran a ser permanentes y en realidad son efímeros. Pero, por otro lado, la gente que tiene prácticas sociales digitales como si no se fuera a archivar, como si fuera a ser volátil, luego tiene mucho más rastro digital”, asegura. “La traza digital es mucho más permanente de cómo lo experimentan, por ejemplo, los adolescentes. Además, incluso al guardar o publicar siendo consciente de su permanencia, creas un archivo sobre el que no tienes control. Es como tener un archivo, pero no tener control del edificio en el que se aloja, ni siquiera atienes acceso al personal que está manejándolo”.
Cómo preservar lo que sí queremos guardar
En esto de la archivística digital hay casi tantos estilos como personas. Elisa García Mingo explica que es un poco como lo que se hacía en la práctica analógica. “Había quien al revelar las fotos las seleccionaba, organizaba y hacía un álbum muy trabajado, y quien simplemente las metía en una caja de galletas”, indica. En el mundo digital ocurre lo mismo. “Hay gente que va haciendo un archivo sin conciencia de archivo, y hay personas que tienen un nivel de archivística digital muy elevado. Son los dos polos: desde un rastro gigante que vas dejando en una especie de caos consciente hasta las prácticas más elaboradas, toda la gente que todos los años hace un álbum o un calendario o videorresumen”, explica.
Si lo que queremos es asegurarnos de que nunca nos encontraremos con la sorpresa desagradable de que hemos perdido fotos, correos o documentos que sí queríamos, el nivel de archivística debe elevarse algo más. “La Biblioteca del Congreso de Estados Unidos acuñó un acrónimo, IDOM, en ocasiones IDEOM, que significa ‘identificar, decidir, exportar, organizar y hacer copias (make copies)’”, indica Daniel Gayo Avello. Aunque la idea es sencilla, requiere “esfuerzo y constancia”.
El experto desgrana los pasos:
- “Debemos identificar todos los contenidos digitales que tenemos y dónde (por ejemplo, fotografías, vídeos, audio, mensajes, sitios web, otro tipo de archivos digitales, etc.)”.
- Decidir “qué contenidos son los más importante (por ejemplo, ¿de verdad necesitamos las 200 fotos que hicimos en ese viaje? ¿Necesito una copia de todos mis correos electrónicos?)”.
- Dependiendo del contenido, quizá necesitemos exportarlo: “los correos electrónicos, los mensajes de WhatsApp, nuestro archivo de tuits…”.
- Organizar el material, lo que implica “dar nombres significativos a los archivos y organizarlos en estructuras de directorios”. Esta parte es clave para luego encontrar lo que buscamos (Gayo Avello admite que él se la salta, pero que luego le lleva muchísimo tiempo localizar lo que quiere).
- Hacer copias. “Aquí puede aplicarse la regla del 3-2-1: al menos tres copias de los datos, usando al menos dos sistemas de almacenamiento diferentes y con al menos una copia en otra localización física”.
Todo esto, además, debe ser actualizado y mantenido para no encontrarse con un archivo organizadísimo de documentos en formatos obsoletos que ya no tenemos donde leer.
Desde el punto de vista de la ciberseguridad, Lorena González Manzano recomienda, si almacenamos en servicios externos datos muy sensibles, “cifrarlos de alguna manera”. Por otra parte, si no queremos confiar en ningún servicio, “podemos comprarnos un disco duro para almacenar los datos nosotros mismos o, mejor aún, un NAS, que es un disco duro de gran capacidad que recupera los datos aunque algunos de ellos lleguen a dañarse, por ejemplo, por una pérdida de corriente/luz”.
Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.