¿Hay algún ejemplo de una publicación de ArXiv que fomente o prevenga el plagio?

En primer lugar, se trata de plagio en el sentido de robar ideas. Se incluye el plagio de copiar y pegar, pero no es probable que suceda en los casos relevantes para esta pregunta.

Teniendo en cuenta la publicación de un artículo antes de la publicación revisada por pares en ArXiv (u otro servidor de preimpresión), generalmente hay dos posiciones principales considerando un posible robo de la idea (o que alguien tenga la misma idea):

  • Si alguien logra publicar su idea en una revista revisada por pares antes que usted, puede demostrar que se le ocurrió la idea primero o al menos de forma independiente si ha publicado su artículo en ArXiv. Por lo tanto, es una buena idea publicar artículos sobre ArXiv antes de que se publiquen en una revista revisada por pares.
  • Si publica su artículo en ArXiv antes de que se publique en una revista revisada por pares, otros pueden robar su trabajo y publicarlo revisado por pares antes que usted y, por lo tanto, tomar el crédito científico. Es difícil atacar a esas personas ya que el ArXiv no es revisado por pares. Alguien podría ganarse la vida plagiando artículos de ArXiv. Por lo tanto, es una mala idea publicar artículos sobre ArXiv antes de que hayan sido publicados en una revista revisada por pares.

¿Hay algún caso de ejemplo (o incluso estudios) que respalde cualquiera de estas declaraciones? Tales ejemplos incluirían, pero no se limitan a:

  • ¿Alguna vez una revista revisada por pares retiró un artículo porque plagió un artículo de ArXiv?
  • ¿Existen casos bien conocidos de plagio “impune” de artículos de ArXiv?
  • ¿Alguien ha resuelto con éxito una disputa de prioridad con una publicación en ArXiv?
  • ¿Alguien ha acusado alguna vez a alguien de plagiar un artículo de ArXiv (con el hecho de que el artículo plagiado se publicó en ArXiv afectando el resultado)?

Tenga en cuenta que lo que estoy buscando son realmente ejemplos y no un análisis teórico de las declaraciones. (Ninguna de las dos posiciones refleja completamente mi opinión y algunas de las premisas blandas¹ son discutibles. Sin embargo, debatir sobre estos puntos de vista sobre una base teórica o atacar algunas de las premisas suele ser inútil).


¹ p. ej., que el crédito científico solo se decide mediante una publicación revisada por pares

Para citar a Howard Aiken: "No se preocupe de que la gente le robe sus ideas. Si sus ideas son buenas, tendrá que hacérselas tragar a la gente".
Totalmente digno de recompensa. Si pudiéramos obtener una lista de ejemplos , existe una buena posibilidad de que esto termine convirtiéndose en una pregunta de exhibición/stock para el sitio. :)
La tercera posición: dado que nadie ha encontrado ningún ejemplo, simplemente publique su preprint en arxiv y deje de preocuparse. ;-)
¿Alguien que tenga experiencia con arxiv y publicaciones académicas ha ocupado alguna vez el segundo puesto? Lo encuentro completamente irracional. ¿Cómo puedes ganarte la vida robando contenido con marca de tiempo pública...
@SashoNikolov: He escuchado a profesores (de campos atendidos por ArXiv) hacer esta afirmación (no es que la apoye). Creo que esa debería ser razón suficiente para motivar esta pregunta. También recuerde que podría considerar que esta pregunta permanece esencialmente sin respuesta como una evidencia notable por sí misma.
@Wrzlprmft No estoy seguro de lo que sugiere esa evidencia. De todos modos, estos son eventos raros, y dudo que estén bien documentados cuando los editores de revistas los captan, al menos no públicamente. Si es difícil encontrar casos de documentos arxiv plagiados, creo que eso sugiere que el sistema funciona disuadiendo el plagio o deteniendo las disputas de prioridad en las primeras etapas. Ciertamente, hay muchos casos en los que el "trabajo independiente" se establece por fechas arxiv, como se sugiere en las respuestas.

Respuestas (5)

Si publica su artículo en ArXiv antes de que se publique en una revista revisada por pares, otros pueden robar su trabajo y publicarlo revisado por pares antes que usted y, por lo tanto, tomar el crédito científico. Es difícil atacar a esas personas ya que el ArXiv no es revisado por pares.

Esto supone que las publicaciones revisadas por pares determinan el crédito científico, lo que puede ser cierto en algunos campos, pero no es universal. En matemáticas, no es relevante en absoluto para la asignación de créditos. Los artículos revisados ​​por pares, por supuesto, se revisan más a fondo, pero no le otorgan ningún crédito intelectual adicional, por lo que esta dificultad ni siquiera surge. (En particular, para la asignación de crédito, un artículo de arXiv supera a un artículo publicado con una fecha de presentación no trivialmente posterior).

Por ejemplo, ¿alguna vez una revista revisada por pares retiró un artículo porque plagió un artículo de ArXiv? ¿O hay casos bien conocidos de plagio “impune” de artículos de ArXiv?

Esta es una pregunta difícil de responder, porque ¿cómo podría saberlo? Si el plagiario no copia ningún texto, sino que simplemente toma ideas, entonces es prácticamente imposible probar que algo fue robado.

En matemáticas, funciona así. Si alguien hace circular públicamente un documento, entonces hay una breve ventana en la que las personas que han hecho el mismo descubrimiento de forma independiente tienen la oportunidad de anunciar este hecho y reclamar una parte del crédito. Deberían hacerlo más o menos inmediatamente después de enterarse de ello.

Por el contrario, si transcurre demasiado tiempo, la comunidad no lo considera un descubrimiento simultáneo, sino que, en el mejor de los casos, redescubre algo que ya se sabía (lo que le da mucho menos crédito al redescubridor). No hay un límite claro para el tiempo, pero lo veo de la siguiente manera: días después definitivamente está bien, semanas después podría estar bien, meses después generalmente no está bien, un año después definitivamente no está bien.

La mayor debilidad de este sistema es que hay una ventana en la que es posible robar las ideas de alguien y afirmar que se te ocurrieron de forma independiente. Esto ciertamente es poco común (de hecho, las afirmaciones de descubrimiento independiente son poco comunes, independientemente de si son verdaderas o falsas), pero es difícil saber con certeza qué tan raro es debido a la dificultad de probar el plagio de ideas. La mayoría de las afirmaciones de descubrimiento independiente son obviamente ciertas (porque hay un manuscrito que no podría haber sido escrito tan rápido, o hay un historial de charlas o discusiones con otros investigadores, o hay variaciones no triviales de las ideas y aplicaciones), pero cada vez dentro de un rato alguien hace tal afirmación sin pruebas claras.

Incluso cuando no hay mucha documentación, me inclino a creer en las afirmaciones de descubrimiento independiente. Fingir esto requiere mucho descaro y esfuerzo, no es algo de lo que puedas salirte con la tuya repetidamente y es una situación incómoda en la que no querrías ponerte innecesariamente, por lo que parece razonable darles a las personas el beneficio de la duda.

En la práctica, no creo que el peligro real sea el robo absoluto, donde alguien que no estaba trabajando en este tema se da cuenta de un nuevo documento y dice "¡Eso se ve bien! Creo que lo robaré". En cambio, la situación más preocupante es cuando alguien estaba trabajando en ideas similares, pero en realidad no había terminado de resolver los detalles. Cuando ven el documento, inmediatamente reconocen algunas de sus ideas, y los detalles restantes se sienten tan naturales que dicen: "Sí, eso es exactamente lo que tenía en mente. Este documento simplemente está desarrollando mis ideas". Honestamente creen que prácticamente habían completado este trabajo, cuando podrían haber estado algo más lejos de lo que pensaban. Aquí hay todo un continuo, desde personas que básicamente tienen razón en sus creencias hasta aquellas que están completamente equivocadas, y eso es todo.

Por supuesto, no tengo idea de con qué frecuencia alguien afirma un descubrimiento independiente basado en creencias exageradas (una vez más, es básicamente indemostrable), pero imagino que sucede ocasionalmente. Ciertamente es desafortunado si se lleva a cabo, pero no es tan malo como un robo total. El peor de los casos es tener que compartir el crédito con alguien que lo merece menos.

Aunque esta es una muy buena respuesta, responde a otra pregunta: vea mi edición de la pregunta.
@Martin: ¡Gracias! Wrzlprmft: Buen punto, no doy ningún ejemplo concreto, pero creo que será difícil producir buenos ejemplos.

Hay partes difíciles en su pregunta, pero es fácil encontrar ejemplos en los que publicar en arXiv estableció prioridad. De hecho, puede abrir documentos publicados al azar y encontrar que una proporción decente de ellos cita preprints de arXiv (encontré uno en mi segundo intento al azar ).

Para dar un ejemplo famoso, Grigori Perelman publicó sus artículos innovadores solo en arXiv, y fue acreditado por ellos hasta el punto de que le ofrecieron la medalla Fields y el premio Clay de un millón de dólares (como es bien sabido, rechazó ambos). ).

Estos documentos fueron digeridos por la comunidad durante varios años, dando lugar a varios conjuntos de notas de diferentes grupos de matemáticos, todos los cuales, por supuesto, acreditaron a Perelman por resolver la geometrización y las conjeturas de Poincaré; algunas de estas notas, que contenían aclaraciones, detalles o pruebas alternativas de parte del trabajo de Perelman, se publicaron, a veces, en las principales revistas. Esta parte también proporciona un ejemplo interesante de publicación en línea (en una página web, no en arXiv, pero parece ir al grano) que establece un precedente, consulte la siguiente errata. En resumen, los autores de un artículo publicado escribieron una errata para reconocer que no citaron correctamente un preprint que solo se distribuyó en línea y no se publicó formalmente, mientras que usaron algunas de las ideas contenidas en él. Esta es la forma en que se espera que cualquier revista y autores razonables traten estos casos, al menos en matemáticas.

Tenga en cuenta que si bien su respuesta me hizo notar que redacté uno de mis ejemplos de manera demasiado amplia, esto no invalida su respuesta en mi opinión.
Una historia similar, aunque menos glamorosa, rodea el trabajo de Alex Postnikov sobre el Grassmanniano totalmente positivo. El único artículo es una preimpresión incompleta publicada en arXiv. Algunos de los capítulos no escritos han sido completados por otros autores y publicados en muy buenas revistas.

Según Stephen J. Blundell (en Superconductivity: a Very Short Introduction ), lidiar con la prioridad y el plagio fue exactamente la razón por la que la gente comenzó a circular e indexar preprints en línea en primer lugar.

¿Alguna vez una revista revisada por pares retiró un artículo porque plagió un artículo de ArXiv?

Aquí hay un ejemplo para esto:

El artículo A se retractó porque plagió el artículo B que había aparecido previamente en el arxiv. El documento B se envió a arxiv el 7 de mayo de 2018 y se envió a Physical Review D el 9 de mayo de 2018. El documento A se envió a la Sección A de Instrumentos y métodos nucleares en investigación física el 8 de mayo de 2018.

Esta línea de tiempo muestra que el trabajo A debe haber plagiado de la versión arxiv del trabajo B, y lo hizo antes de que el trabajo B se enviara para la revisión por pares. Presumiblemente, la marca de tiempo arxiv habrá ayudado a hacer de este un caso de plagio abierto y cerrado, aunque es posible que haya otras vías de prueba disponibles.

Este ejemplo se encontró examinando las entradas de Retraction Watch relacionadas con la física de alta energía (uno de los campos más antiguos y prolíficos para usar arxiv). Una conclusión secundaria de este ejercicio es que las retractaciones por plagio son raras en este campo.

He encontrado este enlace. Parece que arXiv tiene una política de plagio.

También un documento describe la "aplicación a gran escala de métodos para encontrar plagio y autoplagio en colecciones de documentos de investigación". titulado como "Detección de plagio en arXiv".

Si no me equivoco mucho, ambas fuentes son sobre contenido plagiado que se ha publicado en ArXiv, no sobre publicaciones que plagiaron publicaciones de ArXiv.