Conceptos básicos de publicación de datos: ¿dónde, por qué, cómo y cuándo debo publicar mis datos no publicados?

Muchos investigadores tienen datos no publicados. Es posible que algunos de estos datos nunca se publiquen como manuscrito. Pero me gustaría hacer contribuciones académicas de datos que no tengo intención de publicar, por ejemplo, publicando un "documento de datos".

El término "documento de datos" puede ser demasiado nuevo para ser familiar, así que aquí hay una descripción del sitio web de Ecological Archives :

Los documentos de datos son compilaciones y síntesis de conjuntos de datos y metadatos asociados que se consideran de gran interés para los miembros de la ESA y la comunidad académica. Los artículos de datos son revisados ​​por pares y se anuncian en forma de resumen en la revista impresa correspondiente como un artículo de datos. Los artículos de datos difieren de los artículos de revisión o síntesis publicados en otras revistas de la ESA en que los artículos de datos normalmente no probarán ni refinarán la teoría ecológica. Los documentos de datos pueden facilitar el rápido avance del conocimiento y la teoría ecológicos al mismo tiempo que difunden información. Además, Ecological Archives proporciona un mecanismo de recompensa (en forma de objetos citables revisados ​​por pares) por el esfuerzo sustancial requerido para compilar y documentar adecuadamente grandes conjuntos de datos de interés ecológico.

Esto plantea las siguientes preguntas:

¿Qué hace un buen repositorio de datos?

¿Qué repositorios de datos proporcionan un doi: para datos sin procesar?

¿Deberían estar separados los datos publicados de los artículos en un CV?

Cuando dice datos, ¿se refiere a filas y columnas de números (que es la suposición obvia) o son todos DATOS pertinentes a la investigación, como ecuaciones, figuras?
@dna Quizás los documentos de datos pueden incluir estadísticas descriptivas, pero no más que eso.
@david, ¿te refieres a algo como DataOne ?
@David: debe proporcionar una descripción más completa de lo que desea publicar. ¿Son solo datos sin formato sin procesar? ¿Son datos posprocesados ​​del tipo que se ajusta a un archivo existente? ¿Qué recursos tiene disponibles en su institución? ¿Hay algo específico del campo ya disponible?
@aeismail son datos posprocesados ​​pero no necesariamente un formato estandarizado. El campo específico es la ciencia de la tierra y podría ser apropiado para la ciencia del sistema terrestre , los archivos ecológicos o, como lo sugiere abe, DataOne .
Es triste que se puedan publicar resultados no reproducibles (sucede mucho en informática).

Respuestas (5)

Hay algunas cosas que consideraría al elegir un repositorio de datos:

  • ¿Le permite divulgar sus datos bajo una licencia con la que está satisfecho?
    • La aplicación de una licencia demasiado restrictiva puede impedir que alguien haga algo útil con los datos, así que piense en lo que está dispuesto a permitir. En particular, recuerde que la mayor parte de la investigación realizada en la academia podría considerarse "comercial" desde una perspectiva legal. Por otro lado, es posible que desee elegir una licencia que le asegure obtener crédito por su trabajo. Puede estar o no de acuerdo con ellos, pero leer los Principios de Panton le dará una idea de los problemas aquí. También eche un vistazo a esta lista de licencias escritas con datos en mente
  • ¿Qué tan fácil será encontrar sus datos?
    • Las personas solo usarán sus datos si pueden encontrarlos. Recomiendo buscar en Google (otros motores de búsqueda disponibles) para algunos conjuntos de datos que conoce en su campo y ver si aparecen: esos repositorios que están indexados por los principales motores de búsqueda lo pondrán en una gran ventaja cuando se trata de atraer citas.
  • ¿Qué repositorios son bien conocidos en su campo?
    • Su institución puede tener un repositorio en el que puede depositar fácilmente, pero no será el primer lugar en el que los colegas en su campo pensarán buscar. Si hay repositorios bien establecidos, preferiría esos, o me aseguraría de que sus datos estén indexados por un agregador bien establecido (sé que ANDS tiene un agregador nacional en Australia).
  • ¿Qué permite su institución?
    • En muchos casos, su institución será propietaria (o tendrá derecho a) los datos que genere como parte de su investigación, así que verifique cuáles son sus políticas locales y, si es necesario, pregunte a su supervisor, jefe de departamento, equipo legal, etc. Esto afectará particularmente a su elección de licencia.

Las otras partes de su pregunta probablemente puedan ser respondidas mejor por otros aquí (¿o tal vez debería dividirse en varias?)

Figshare proporciona alojamiento en línea y un enlace permanente a su conjunto de datos, aunque no proporciona un DOI. He estado publicando algunas cifras allí, pero no datos, y me gusta bastante el servicio. También permiten la opción de mantener los datos privados, por lo que puede usarlos para almacenar los datos y luego liberarlos cuando haya terminado.

Actualización: creo que Figshare ahora proporciona DOI figshare.com/faqs/#q2

Creo que el mejor lugar para los datos es un repositorio de datos centrado en el tema, pero en ausencia de eso, hay repositorios como Dryad .

Biomed Central acaba de anunciar una asociación con un sitio llamado LabArchives para alojar datos de autores de BMC, incluidos los DOI para los datos y la licencia CC0 que promueve la reutilización, pero no tengo ninguna experiencia con el sitio.

Si tiene un sitio web con preimpresiones gratuitas de su trabajo (que probablemente debería tener), coloque sus datos (y código) allí. Alternativamente, conozco personas que usan GitHub (o similar) con el propósito de almacenamiento (distribuido). Esto tiene el encanto de la persistencia y un potencial inmediato de colaboración.

Para un enfoque persistente (con suerte) de la citabilidad, DataCite parece legítimo. En particular, emiten DOI y están financiados por bibliotecas e instalaciones de investigación de todo el mundo .

Parece que podría ser apropiado para Pangaea: http://www.pangaea.de/submit/