Justificación del pequeño tamaño de un conjunto de datos debido a las dificultades de recopilación

Estoy trabajando en un campo empírico y recientemente tuve un artículo sobre un esfuerzo de recopilación de datos y su posterior análisis que fue aceptado provisionalmente, sujeto a revisiones. El comentario negativo más difícil de abordar es que el conjunto de datos que adquirí se consideró relativamente pequeño; ¿Cómo puedo justificar el tamaño pequeño del conjunto de datos de manera sólida debido a las dificultades prácticas para adquirir datos?

No me es posible recopilar más datos en términos de dinero, mano de obra o incluso tiempo... que se suman más o menos al "capital de investigación". He visto otros conjuntos de datos utilizados que no son mucho más grandes, pero también hay corpus que son más grandes por un margen significativo. Del mismo modo, algunos conjuntos de datos son bastante similares, mientras que otros no tienen ninguna relación con los míos. Finalmente, aunque algunos corpus están disponibles gratuitamente, para la mayoría de los artículos en mi campo, es bastante raro que las publicaciones establezcan explícitamente cómo se pueden adquirir los datos para sus propios fines, y por lo tanto, la capacidad real de adquirir datos incluso en segundo lugar. la mano parece tener manchas.

Básicamente, necesitaría reformular el párrafo anterior en alguna forma que pueda poner en el documento que necesita revisión; ¿Qué puedo hacer?

Esto se reduce a estadísticas, en particular un análisis de poder. O su conjunto de datos es lo suficientemente grande como para respaldar sus conclusiones con certeza razonable o no lo es. Las dificultades para obtener datos no son relevantes para esa pregunta. Sin embargo, el revisor no rechazó el manuscrito, ¿verdad?
@Roland no, ninguno de los revisores rechazó el artículo, pero hubo muchos comentarios sobre cosas que tengo que abordar. La mayoría no son un problema, pero este es el que realmente "no puedo hacer mucho al respecto", excepto, como usted recomendó, para demostrar que al menos los resultados de este estudio específico son significativos. Sin embargo, el documento trataba principalmente sobre el conjunto de datos en sí mismo, por lo que si no es reutilizable, entonces es una gran marca negra en su contra.
"Sin embargo, el documento trataba principalmente sobre el conjunto de datos en sí". Siempre existe el argumento "es útil para los metanálisis" si los datos son lo suficientemente raros.
¿Podría ser que el revisor quiera que usted reconozca y discuta los problemas del pequeño tamaño de la muestra, es decir, que un estudio con poca potencia podría dar como resultado tamaños del efecto sobreestimados y, por lo tanto, un falso positivo?
@Mark sí, posiblemente-- No había pensado en eso. Los comentarios no eran directivas como "agregue valores p exactos y describa cómo definió los intervalos de confianza", sino "comentarios" reales, por ejemplo, "el conjunto de datos es bastante pequeño..."
@Roland sí, exactamente mi punto: he hablado con otras personas que realizan investigaciones similares y recopilar datos es extremadamente difícil, por lo tanto, espero que haya una forma académica de "probar" esta dificultad.

Respuestas (2)

Esta respuesta ampliará algunas de las notas en los comentarios y la respuesta de OldDoc. Sugeriría tres cosas:

  1. En la sección de datos, reconozca que el tamaño de la muestra es relativamente pequeño. Tenga en cuenta que esto está en línea con otros trabajos publicados que abordan la pregunta, y que la adquisición de datos relacionados con esta pregunta enfrenta desafíos A, B, C... Explique que el análisis y la discusión abordarán el tamaño de muestra relativamente pequeño.
  2. En la sección de análisis/resultados, asegúrese de informar los valores p y los intervalos de confianza. El objetivo es tener en cuenta la pequeña muestra en los análisis estadísticos.
  3. En la discusión, explique cómo tener un tamaño de muestra pequeño afecta el poder de/su confianza en sus resultados y la generalización de las conclusiones. Ayude al lector a comprender de qué manera una pequeña muestra es una limitación para su trabajo sin subestimarlo.

Como se ha dicho, un análisis estadístico de su conjunto de datos aclarará con cuánta confianza y precisión puede concluir sus hallazgos. Esta es una parte esencial del proceso olfativo

Particularmente en las ciencias naturales, la recopilación de datos puede ser problemática y limitada por el tiempo y el presupuesto, pero la comunidad es consciente de esto, al igual que su revisor.

¡Todo lo que se requiere es que informe sus hallazgos de manera adecuada, incluso si no necesariamente le gusta la respuesta! En circunstancias extremas, es posible que tenga conjuntos de datos tan escasos o variados que simplemente necesite más trabajo. Sucede.

La ciencia progresa con el conocimiento que incluye datos menos que óptimos, al igual que ayudar a los que vienen después de usted a hacerlo mejor al explicar en su artículo cómo podría mejorar su propio enfoque.

Estoy de acuerdo en que el revisor probablemente esté solicitando este tipo de análisis y no por qué no pudo hacer todo el trabajo que le hubiera gustado.