June 17, 2025: 10:00 am -12:00 pm EDT (New York):  La IFLA News Media y el Consorcio Internacional para la Preservación de Internet (IIPC) se unen nuevamente para organizar una serie de talleres enfocados en el archivo de medios de comunicación. Dado que hoy en día la mayoría de las noticias se publican en línea, existe un interés creciente por comprender mejor las prácticas actuales y más eficaces para el archivado web. El objetivo principal de estos talleres es analizar y comparar cómo distintas organizaciones, de diversos tamaños y contextos,  abordan esta labor y aprender de sus experiencias. A través de presentaciones y conversaciones informales, se presentarán diferentes aproximaciones institucionales para archivar contenidos de medios de comunicación, incluidos los audiovisuales y los provenientes de redes sociales. También se destacarán los principales desafíos del campo y se explorarán soluciones innovadoras.

En ediciones anteriores, hemos abordado temas como: 1) asos prácticos de tres bibliotecas nacionales sobre el archivo de noticias digitalizadas y nacidas digitales, 2) enfoques para rastrear noticias detrás de muros de pago mediante herramientas basadas en navegadores, con ejemplos de cuatro bibliotecas nacionales, e 3) estrategias para archivar contenidos audiovisuales de noticias.

Este taller estará dedicado al archivado web en español e incluirá una presentación sobre el uso de colecciones de archivos web como datos. La moderación estará a cargo de Natalia Márquez-Bustos (Pontificia Universidad Javeriana, Colombia). Todas las presentaciones se realizarán en español, con traducción automática disponible a través de Zoom. Además, los panelistas utilizarán diapositivas en formato bilingüe para facilitar la comprensión del público internacional.

AGENDA
10:00-10:10: Presentación de la sección de Medios de Comunicación de IFLA e IIPC
10:10-10:25: Preservar la memoria digital en español: El papel del Archivo de la Web Española
10:25-10:40: El archivado web como un método de acopio y creación de colecciones de datos para la investigación científica
10:40-10:55: Estrategias y avances de la Preservación web en México a través del Grupo de Preservación Digital (GDP)
10:55-11:00: Breve pausa
11:00-11:15: Iniciativa de recolección de la memoria web colombiana: la experiencia de la Biblioteca Nacional de Colombia
11:15-11:30: Archivo web basado en navegadores
11:30-11:35: Colecciones de archivos web como datos
11:35-11:58: Preguntas y respuestas con todos los ponentes
11:58-12:00: Cierre

PRESENTACTIONES

Perla Olivia Rodríguez Reséndiz | Universidad Nacional Autónoma de México (UNAM): El Archivado Web como un método de acopio y creación de colecciones de datos para la investigación científica

Se presentará una introducción a las directrices para la planificación y puesta en marcha de iniciativas de archivado web, como un método de recopilación y creación de colecciones de datos para la investigación científica. Esta presentación se basa en la experiencia de preservación digital de contenidos Web sobre Covid 19 en México realizada en la Información de la Universidad Nacional Autónoma de México.

José Carlos Cerdán Medina | Biblioteca Nacional de España: Preservar la memoria digital en español: El papel del Archivo de la Web Española

El español constituye una lengua con más de 600 millones de hablantes y se posiciona como la tercera más hablada a nivel mundial. En este contexto, el Archivo de la Web Española es una iniciativa de la Biblioteca Nacional de España, puesta en marcha en 2009 con el propósito de preservar los contenidos digitales presentes en Internet, así como las publicaciones que allí se albergan, con el fin de conservarlas para las generaciones futuras. En esta sesión se abordarán los principales hitos de este proyecto, así como el papel estratégico que el español y América Latina están llamados a desempeñar en el ámbito del archivado web, en el marco de la cooperación internacional.

Carolina Silva Bretón | Estrategias y avances de la Preservación web en México a través del Grupo de Preservación Digital (GPD)

Esta charla aborda los esfuerzos recientes en México para preservar la web, destacando las estrategias implementadas por el Grupo de Preservación Digital (GPD), liderado por la Biblioteca Nacional de México. Se presentarán los principales avances, así como los desafíos enfrentados en el contexto nacional. La sesión ofrecerá una visión integral del papel del GPD en la protección de la memoria digital mexicana.

Lorena Ramírez-López | Webrecorder: Anatomía de una página web: Mejores prácticas de archivado web

Aunque la web existe desde hace más de treinta años, las tecnologías y métodos utilizados para construirla y preservarla siguen evolucionando constantemente, lo que representa nuevos desafíos para archivistas. Esta presentación destacará los retos actuales de  archivado web comenzando con la anatomía de una página web; presentará las mejores prácticas y los estándares reconocidos por la comunidad de archivado web; y finalmente ofrecerá consejos prácticos y técnicas para archivar la web utilizando herramientas accesibles y de código abierto como ArchiveWeb.page.

Johanna Gallego Gutierrez | Biblioteca Nacional de Colombia: Iniciativa de recolección de la memoria web colombiana: la experiencia de la Biblioteca Nacional de Colombia

En esta charla se presentará el trabajo que la Biblioteca Nacional de Colombia ha desarrollado en el ámbito de la curaduría y recolección de la web colombiana. Se abordarán casos de éxito y aprendizajes obtenidos a partir de intentos fallidos de recuperación de contenidos digitales, así como las herramientas utilizadas para la recolección de sitios web relevantes para la historia reciente del país. También se compartirán los avances logrados en la legislación nacional, en relación con el depósito legal digital y el Decreto 0149 de 2024.

Gustavo Candela | Universidad de Alicante: Colecciones de Archivos Web como Datos

“Web Archive Collections as Data” (WACAD) es una iniciativa que tiene como objetivo promover un método estandarizado para crear colecciones de archivos web como datos siguiendo buenas prácticas promovidas por instituciones y la lista de verificación para publicar colecciones como datos. Esta charla incluirá 1) el contexto actual (los principios de Collections as Data y la International GLAM Labs Community), 2) varios casos de uso, y 3) un resumen de los objetivos y resultados de varios talleres basados en WACAD presentados en 2025 como IIPC Web Archiving Conference en Oslo y Digital Humanities of the Nordic Countries en Tartu.

Moderadora: Natalia Márquez-Bustos, Pontificia Universidad Javeriana (Colombia)

 


June 17, 2025: 10:00 am -12:00 pm EDT (New York): The IFLA News Media and International Internet Preservation Consortium (IIPC) are teaming up again to host a series of workshops focusing on archiving news media. As most news is now published online, there is a growing interest to better understand the current best practices in web archiving. The main goal of our workshops is to examine and compare how organizations of varying sizes tackle this topic and to learn from their collective experiences. Through presentations and informal discussions, we will showcase diverse organizational approaches to archiving news media, including audiovisual content and social media, highlight key challenges, and explore innovative solutions.

Our previous events featured: 1) use cases from three national libraries on archiving digitised and born-digital news, 2) approaches to browser-based crawling of news behind paywalls with examples from four national libraries, and 3) archiving audiovisual news media content.

This edition will feature presentations about web archiving in Spanish-speaking countries and include a talk on web archive collections as data. The workshop will be moderated by Natalia Márquez-Bustos, Pontificia Universidad Javeriana (Colombia). All presentations will be in Spanish, but it will be possible to use automated translation in Zoom and the presenters will have bilingual slides.

AGENDA
10:00-10:10: Introduction to IFLA News Media section + IIPC
10:10-10:25: Legal Deposit of the National Library of Spain. Preserving Digital Memory in Spanish: The Role of the Spanish Web Archive
10:25-10:40: Web Archiving as a method of collecting and creating data sets for scientific research purposes
10:40-10:55: Strategies and Advances in Web Preservation in Mexico through the Digital Preservation Group (GPD)
10:55-11:00: short break
11:00-11:15: Colombian Web Memory Collection Initiative: The Experience of the National Library of Colombia
11:15-11:30: Browser-based web archiving
11:30-11:35: Web archive collections as data
11:35-11:58: Q&A with all speakers
11:58-12:00: Wrap-up

PRESENTATIONS

Perla Olivia Rodríguez Reséndiz | UNAM (México): Web Archiving as a method of collecting and creating data sets for scientific research purposes

This presentation will introduce the guidelines for planning and implementing web archiving initiatives as a method of collecting and creating data collections for use in scientific research. This presentation is based on the experience of digital preservation of web content on the topic of the Coronavirus (Covid-19) in Mexico, a project carried out at the Information of the National Autonomous University of Mexico.

José Carlos Cerdán Medina | National Library of Spain: Preserving Digital Memory in Spanish: The Role of the Spanish Web Archive

Spanish is a language spoken by over 600 million people and ranks as the third most widely spoken language in the world. In this context, the Spanish Web Archive is an initiative of the National Library of Spain, launched in 2009 with the aim of preserving digital content available on the Internet, as well as the publications hosted there, in order to safeguard them for future generations. This session will explore the key milestones of the project, as well as the strategic role that Spanish and Latin America are expected to play in the field of web archiving, within the framework of international cooperation.

Carolina Silva Bretón | Strategies and Advances in Web Preservation in Mexico through the Digital Preservation Group (GPD)

This talk addresses recent web preservation efforts in Mexico, highlighting the strategies implemented by the Digital Preservation Group (GPD), led by the National Library of Mexico. The main advances and challenges faced in the national context will be presented. The session will offer a comprehensive overview of the role of the Digital Preservation Group (GPD) in protecting Mexico’s digital memory.

Lorena Ramírez-López | Webrecorder: Anatomy of a webpage: Best Practices of web archiving

Although the web has been around for more than thirty years, the technologies and methods used to build and preserve it are constantly evolving, bringing new challenges for archivists. This presentation will call attention to the challenges of web archiving beginning with the anatomy of a web page; highlight established best practices and widely accepted standards in the web archiving community; and finally offer quick tips, tricks, and to dos with web archiving using accessible open-source tools like Archiveweb.page.

Johanna Gallego Gutierrez | National Library of Colombia: The Colombian Web Memory Collection Initiative: The Experience of the National Library of Colombia

This talk will present the work carried out by the National Library of Colombia in the curation and collection of the Colombian web. It will cover success stories and lessons learned from failed attempts to recover digital content, as well as the tools used to collect websites relevant to the country’s recent history. The presentation will also highlight the progress made in national legislation regarding digital legal deposit, including Decree 0149 of 2024. The talk offers a practical perspective on the history, challenges, achievements, and future directions of web archiving in Colombia, aimed at ensuring access to the nation’s digital memory for present and future generations.

Gustavo Candela | University of Alicante: Web Archive Collections as Data

Web Archive Collections as Data (WACAD) is an initiative that aims to propose a standardised method for making web archive collections as data available based on current practices at web archiving institutions and the Labs checklist for publishing collections as data. This short talk will provide 1) the context for our work (the Collections as Data principles and the International GLAM Labs Community), 2) different use cases, and 3) a summary of our objectives and deliverables based on the WACAD workshops delivered at the 2025 IIPC Web Archiving Conference in Oslo and the Digital Humanities of the Nordic Countries in Tartu.

Moderator: Natalia Márquez-Bustos, Pontificia Universidad Javeriana (Colombia)