Un estudio encuentra que podríamos perder la ciencia si los editores quiebran


Cuando las publicaciones científicas se publicaban en papel, las bibliotecas desempeñaban un papel clave para garantizar que el conocimiento no desapareciera. Se enviaron copias a tantas bibliotecas que cualquier fracaso (una editorial que quiebra, una biblioteca que cierra) no nos pondría en riesgo de perder información. Pero, como ocurre con cualquier otra cosa, el contenido científico se ha vuelto digital, lo que ha cambiado lo que implica la preservación.

Las organizaciones han ideado sistemas que deberían ofrecer opciones para preservar el material digital. Pero, según una encuesta publicada recientemente, muchos documentos digitales no aparecen constantemente en los archivos destinados a preservarlos. Y eso nos pone en riesgo de perder la investigación académica, incluida la ciencia financiada con dinero de los contribuyentes.

Rastreando referencias

El trabajo fue realizado por Martin Eve, desarrollador de Crossref. Esa es la organización que organiza el sistema DOI, que proporciona un indicador permanente hacia los documentos digitales, incluidas casi todas las publicaciones científicas. Si las actualizaciones se realizan correctamente, un DOI siempre se resolverá en un documento, incluso si ese documento se cambia a una nueva URL.

Pero también tiene una forma de manejar los documentos que desaparecen de su ubicación esperada, como podría suceder si una editorial quebrara. Hay un conjunto de lo que se llama «archivos oscuros» a los que el público no tiene acceso, pero que deben contener copias de cualquier cosa a la que se le haya asignado un DOI. Si algo sale mal con un DOI, debería hacer que los archivos oscuros abran el acceso y el DOI se actualice para apuntar a la copia en el archivo oscuro.

Sin embargo, para que eso funcione, las copias de todo lo publicado deben estar en los archivos. Entonces Eve decidió comprobar si ese es el caso.

Utilizando la base de datos Crossref, Eve obtuvo una lista de más de 7 millones de DOI y luego comprobó si los documentos se podían encontrar en los archivos. Incluyó algunos muy conocidos, como Internet Archive en archive.org, así como algunos dedicados a trabajos académicos, como LOCKSS (Lots of Copies Keeps Stuff Safe) y CLOCKSS (Controlled Lots of Copies Keeps Stuff Safe).

No bien conservado

Los resultados fueron… no muy buenos.

Cuando Eve desglosó los resultados por editor, menos del 1 por ciento de los 204 editores habían colocado la mayor parte de su contenido en múltiples archivos. (El límite fue el 75 por ciento de su contenido en tres o más archivos). Menos del 10 por ciento había colocado más de la mitad de su contenido en al menos dos archivos. Y un tercio parecía no estar realizando ningún archivo organizado.

A nivel de publicaciones individuales, menos del 60 por ciento estaban presentes en al menos un archivo, y más de una cuarta parte no parecía estar en ninguno de los archivos. (Otro 14 por ciento se publicó demasiado recientemente para haber sido archivado o tenía registros incompletos).

La buena noticia es que las grandes editoriales académicas parecen ser razonablemente buenas a la hora de guardar cosas en archivos; la mayoría de los números no archivados provienen de editoriales más pequeñas.

Eve reconoce que el estudio tiene límites, principalmente porque puede haber archivos adicionales que no ha verificado. Hay algunos archivos oscuros destacados a los que no tuvo acceso, así como cosas como Sci-hub, que viola los derechos de autor para poner a disposición del público material de editoriales con fines de lucro. Por último, los editores individuales pueden tener su propio sistema de archivo que podría evitar que las publicaciones desaparezcan.

¿Deberíamos preocuparnos?

El riesgo aquí es que, en última instancia, perdamos el acceso a algunas investigaciones académicas. Como lo expresa Eve, el conocimiento se expande porque podemos construir sobre una base de hechos que podemos rastrear a través de una cadena de referencias. Si empezamos a perder esos vínculos, los cimientos se vuelven más inestables. El archivado conlleva sus propios desafíos: cuesta dinero, debe organizarse, deben establecerse medios coherentes para acceder al material archivado, etc.

Pero, hasta cierto punto, estamos fallando en el primer paso. «Un punto importante a destacar», escribe Eve, «es que no hay consenso sobre quién debería ser responsable de archivar los estudios en la era digital».

Una cuestión un tanto relacionada es garantizar que las personas puedan encontrar el material archivado: el problema para el que se diseñaron los DOI. En muchos casos, los autores del manuscrito colocan copias en lugares como arXiv/bioRxiv o PubMed Centra de los NIH (este tipo de archivo es cada vez más un requisito para los organismos de financiación). El problema aquí es que es posible que las copias archivadas no incluyan el DOI que debe garantizar su localización. Eso no significa que no pueda identificarse por otros medios, pero definitivamente hace que encontrar el documento correcto sea mucho más difícil.

Dicho de otra manera, no poder encontrar un artículo o no poder estar seguro de que está viendo la versión correcta puede ser tan malo como no tener ninguna copia del mismo.

Nada de esto quiere decir que ya hayamos perdido importantes documentos de investigación. Pero el artículo de Eve cumple una valiosa función al resaltar que el riesgo es real. Estamos en una era en la que las copias impresas de las revistas son irrelevantes para la mayoría de los académicos y han proliferado las revistas académicas exclusivamente digitales. Ya es hora de que tengamos estándares claros para garantizar que las versiones digitales de la investigación tengan la resistencia que han disfrutado las obras impresas.

Revista de Biblioteconomía y Comunicación Académica, 2024. DOI: 10.31274/jlsc.16288 (Acerca de los DOI).



Source link-49