¿Cuánto tiempo hay que conservar los datos originales de un estudio/publicación?

La mayoría de las revistas requieren que los datos estén disponibles en el momento de la publicación (repositorio/a pedido o similar). Pero, ¿durante cuánto tiempo deben conservarse los datos (campo de la (bio)medicina)? Esto sería especialmente interesante en relación con el deseo científico de conservar los datos para siempre frente al Reglamento General de Protección de Datos (GDPR).

Las pautas de la revista que se muestran a continuación parecen no especificar esto...

¿Por qué mantener los datos para siempre entraría en conflicto con el RGPD?
Porque según el RGPD los datos deben conservarse el menor tiempo posible
@Younes: supongo que si experimentas y te vuelves consciente y te instalas en la UE, ¿podría haber un problema?
@lordy: los datos personales deben conservarse el menor tiempo posible, tal vez. Pero los experimentos de física no son personas.
@JonCuster he adoptado la pregunta por biomedicina
En este caso, las reglas de los editores no DEBEN entrar en conflicto con el RGPD y el investigador debe cumplir con el RGPD antes que los requisitos del editor (o revista). Muchas empresas fuera de la UE se vieron obligadas a cambiar sus requisitos para que coincidieran con el RGPD. Supongo que esto también se aplica a los editores.
@lordy ¿Cuántos de sus datos son realmente identificables personalmente?

Respuestas (2)

Esta es una pregunta que debe hacerle a la agencia de financiamiento que está pagando por su trabajo. Por lo general, tienen requisitos sobre cómo se deben manejar los datos que se producen.

A modo de ejemplo, esto es lo que dice la principal agencia de financiación alemana DFG :

Den Regeln der Guten Wissenschaftlichen Praxis folgend sollen Forschungsdaten in der eigenen Einrichtung oder in einer fachlich einschlägigen, überregionalen Infrastruktur für mindestens 10 Jahre archiviert werden.

Mi traducción aproximada:

Siguiendo las reglas de las buenas prácticas científicas, los datos de investigación deben archivarse en sus propias instalaciones o en una infraestructura nacional relevante para el tema durante al menos 10 años.

Ciertamente, existen diferentes consideraciones cuando los datos de investigación contienen información privada, por ejemplo, datos de pacientes. No puedo decir nada sobre las regulaciones allí, solo estoy considerando datos de investigación públicos que no tienen implicaciones de privacidad.

En general, la comunidad científica se beneficia si los datos permanecen disponibles para siempre. Y aunque los 10 años en mi ejemplo son un mínimo, muchas partes de los datos producidos, como las publicaciones y depósitos de datos estructurados en repositorios como estructuras cristalinas en el PDB, permanecen archivadas indefinidamente. Y muchos repositorios como el PDB están aumentando constantemente la cantidad de datos sin procesar que les gustaría obtener junto con el resultado final.

La pregunta "¿cuánto tiempo debo conservar los datos de mi investigación" es básicamente un sinónimo de "¿cuánto tiempo debería ser relevante mi investigación?" Una vez que su trabajo ya no se puede reproducir, su valor y capacidad para ser parte de la discusión sobre su tema se ven seriamente limitados.

Esto no significa que necesariamente deba ocultar sus conjuntos de datos para siempre, pero me pregunto por qué alguien elegiría imponer la obsolescencia de su propia investigación. Hay muchas soluciones excelentes en línea que hacen que su mantenimiento sea gratuito y prácticamente sin esfuerzo*. Algo tan simple como poner su código en GitHub y sus datos en Google Drive, hacer que ambos sean públicos y proporcionar un enlace a ellos en su sitio web se encargará del problema en el futuro previsible. Por supuesto, si Microsoft o Google alguna vez deciden terminar con estas plataformas (extremadamente populares), tendría que hacer nuevos arreglos, pero al menos todo estaría recopilado en un solo lugar y listo para ir a otro lado.

En cuanto al RGPD, tengo entendido que solo se aplica a los datos personales. De hecho, si abre la entrada de Wikipedia para ello, la sección "Excepciones" enumera claramente la investigación científica.

La única otra excepción que se me ocurre es el caso de los datos privados o de identificación personal, como las encuestas de salud. En este caso, el control de los datos probablemente se detalló (¿con suerte?) en las propuestas iniciales y/o se llevó ante un IRB.

* Asumo aquí que sus datos no son datos "grandes". Si su trabajo se basa en medio terabyte de datos, todo cambia. Pero si trabaja en el campo de "grandes datos", es probable que ya tenga más conocimiento sobre cómo trabajar con ellos.

Ver §5(1b) y §89(1) del RGPD .
Sin embargo, tenga en cuenta: el avance de la ciencia puede cambiar lo que está suficientemente seudonimizado (o no identificable personalmente) y lo que son datos personales. GDPR también requeriría que uno se mantenga al día con dichos cambios (y cierto procedimiento burocrático) siempre que existan los datos; por lo tanto, almacenar dichos datos puede causar costos continuos y molestias muy por encima de algunos HDD nuevos de vez en cuando.