¿Por qué subir a sitios académicos de preprints como arXiv?

La pregunta reciente sobre la legalidad de subir contenido a arXiv me hizo darme cuenta de que no entiendo por qué uno subiría a un sitio de preimpresión. (No trabajo en un campo donde parecen ser comunes).

¿Por qué uno se preocuparía por obtener un manuscrito en arXiv, si ya está siendo revisado por una revista?

¿Se debe a la larga línea de tiempo de publicación de las revistas? (Eso podría explicar por qué la informática, que publica mucho más en conferencias, no parece hacer mucho con ellos).

probablemente no valga la pena una respuesta completa, pero otra es el proceso de revisión absurdamente lento en matemáticas. Tengo un documento que ha estado en arXiv durante 4 años y medio y todavía está esperando una decisión.
No creo que esto sea realmente un duplicado: esta pregunta es específicamente sobre arXiv, mientras que la otra pregunta es más general sobre la publicación de documentos de trabajo, por ejemplo, en sitios web personales. Las respuestas también son muy diferentes. Votó para reabrir.
Esto definitivamente no es un duplicado, ya que la versión revisada de la otra pregunta es específicamente sobre los documentos de trabajo que discuten el trabajo en curso. El arXiv, por otro lado, se usa principalmente para publicar artículos esencialmente terminados (es decir, listos para enviar a una revista o similar).
Tenga en cuenta que también puede cargar "postprint" (el manuscrito aceptado) en el archivo de preprint. Eso es lo que hago con mis artículos que se ajustan a arXiv: en mi campo todavía hay una zona gris si un manuscrito anterior en arXiv estaría comprometiendo la novedad.
@cbeleites: Eso es interesante. En matemáticas, está claro que un manuscrito anterior en arXiv está bien, pero en algunos casos no está claro si publicar la versión aceptada viola el acuerdo de publicación.
@MarkMeckes: eso es cierto, no todos los acuerdos de transferencia de derechos de autor lo permiten. Pero hoy en día muchos lo hacen. Consulte también los cambios en la ley alemana de derechos de autor que permiten esto ahora para proyectos financiados con fondos públicos después de un embargo de 1 año.
@BenWebster, pero entonces, ¿por qué uno enviaría artículos en revistas, si sus artículos obtienen las mismas revisiones allí? ¿O es esto incorrecto?
@Ooker One se envía a las revistas principalmente porque quiere ser titular. De vez en cuando, uno también recibe comentarios útiles de los árbitros, pero eso es muy impredecible.

Respuestas (5)

En matemáticas, hay varias razones para publicar en arXiv:

  1. Brinda acceso gratuito a documentos que de otro modo podrían estar ocultos detrás de muros de pago. Por supuesto, puede lograr esto publicando en su página web, pero su página web puede moverse o desaparecer, mientras que arXiv es mucho más estable. Esto significa que es mejor para propósitos de archivo y más adecuado para citas. [Tenga en cuenta que esto no se trata solo de preprints: continúa siendo relevante mucho después de la publicación].

  2. Atrae a los lectores. Muchas personas prestan mucha atención a las publicaciones de arXiv en su área, de una manera que no sucede tanto con las tablas de contenido de las revistas. No tengo estadísticas, pero mi impresión es que una fracción sustancial de las personas que se enteran de mis artículos lo hacen a través de arXiv. Si puede obtener una atención notablemente mayor para su investigación casi sin esfuerzo adicional, ¿por qué no lo haría?

  3. Establece prioridad. Enviar a una revista no lo hace: si envía a una revista sin hacer circular su trabajo públicamente, aún puede terminar compartiendo el crédito con cualquiera que haga el mismo descubrimiento antes de que su artículo se haga público. La forma de establecer la prioridad es distribuir su trabajo tan ampliamente que ningún competidor pueda afirmar de manera creíble que no lo conocía. Enviar a arXiv es la forma más fácil de demostrar que lo ha hecho: es muy leído y conserva todas las versiones del artículo con marcas de tiempo.

  4. Es convencional. Esto varía un poco entre los subcampos, pero una vez que el uso de arXiv alcanza una masa crítica en un área determinada, se convierte en la forma estándar de anunciar al mundo que ha completado un trabajo. En ese momento, no publicar en arXiv parece extraño.

En comparación con otros campos, las matemáticas y la física son anómalas al hacer un uso intensivo del arXiv, siendo la física incluso más que las matemáticas. Según tengo entendido, en la física de partículas de alta energía, arXiv reemplazó un elaborado sistema de distribución de preimpresión en papel que se usó a finales de los 80 (y rápidamente se hizo popular porque obviamente era mejor que la infraestructura en papel). El uso se extendió a otras áreas de la física, desde la física a las áreas adyacentes de las matemáticas, y luego a las matemáticas.

Las cosas son más complicadas en otros campos, porque muchas de las ventajas dependen de los efectos de red. Si nadie en tu campo se fija en un servidor, no es convencional y cuenta poco o nada en cuanto a prioridad, entonces hay menos razones para publicar en él (aunque todavía tiene algo de valor). No me sorprende que se entienda lentamente y se propague principalmente a los campos adyacentes, pero espero que los servidores verdes de acceso abierto como arXiv se vuelvan más populares con el tiempo.

Gran resumen de las apelaciones. ¡Me hace desear que mi subcampo en realidad fuera más grande en el uso de arXiv / preprint!
@MatthewG. ¡Alguien tiene que empezar la tendencia! ¿Por qué no usted y sus colaboradores?
@DavidRicherby Es un buen punto, y lo mencionaré la próxima vez que se reúna el grupo de investigación.

A mi modo de ver, las principales razones para utilizar arXiv y servidores de preimpresión similares son:

  • Para difundir su artículo sin esperar el proceso de revisión por pares y publicación. Este es un problema serio: en matemáticas, por ejemplo, la revisión por pares a menudo toma un año o más, y pueden pasar varios años más antes de que su artículo llegue al frente de la fila para aparecer impreso.

  • Hacer que el artículo esté permanentemente disponible para los lectores que no estén suscritos a la revista donde se publica el artículo.

  • En algunos casos, para difundir y solicitar comentarios sobre un artículo que puede no estar listo para su publicación, al mismo tiempo que se establece la prioridad.

Por cierto, de los informáticos aquí, tengo la impresión de que CS usa arXiv muy fuertemente, hasta el punto de que prácticamente reemplaza a las revistas como una forma de distribuir artículos. ¿Quizás me equivoco o varía según el subcampo?

Definitivamente varía según el subcampo: al mirarlo, veo que la sección CS parece estar en buen estado, pero nunca he leído un artículo que provenga de arXiv. Debe ser mi subcampo, o tal vez sea una gran brecha en mi base de conocimientos.
Varía mucho. Una aproximación aproximada es que cuanto más cerca esté el campo de las matemáticas (TCS, ML, etc.), más probable es que vea cosas en el arxiv. Por ejemplo, no creo que nadie en arquitectura informática publique en arxiv.
Muy relacionado con el subcampo. En ingeniería de software, hasta ahora he visto un gran total de cero artículos relevantes en arxiv (sin embargo, no lo sigo de cerca ya que el ROI es muy pequeño en mi campo).
@xLeitix es hora de cambiar esto en ingeniería de software. Autoarchivé el 100% de mis (pequeñas cantidades) de publicaciones en ingeniería de software. Esta es también una forma de agradecer a quien archivó su artículo antes que yo para que yo pudiera acceder a él y desarrollarlo.
¿Cuáles son los sitios web similares a arxiv en ingeniería y otras ciencias?
@parsa: No sé. Hágalo como una nueva pregunta si lo desea.

Permítanme agregar un punto no mencionado por otras respuestas hasta ahora.

En campos de rápido movimiento (p. ej., la mayoría de las ciencias de la computación), un gran beneficio de publicar informes técnicos en series reconocidas/citables (al menos un ISSN) y/o arXiv es obtener una referencia citable antes de la publicación en un lugar más serio , como como una conferencia, o una revista.

Así que el flujo de trabajo es el siguiente:

  1. escribir y pulir un papel
  2. antes de enviarlo a un lugar serio, publíquelo como una preimpresión de TR/arXiv (a menos que esto entre en conflicto con las políticas de doble ciego o de derechos de autor del lugar de destino)
  3. enviar al lugar de destino
  4. Justo al día siguiente puede escribir un artículo siguiente refiriéndose al trabajo que publicó como una preimpresión. Puede ser un trabajo incremental, o cualquier otra cosa usando el resultado que logró recientemente, etc. Todo esto lo puede hacer mucho antes de que el artículo aparezca realmente en las actas, o en un número de revista.
  5. si el trabajo fue aceptado en el lugar de destino, bien por ti
  6. si no fue así, aún puede consultar el trabajo, mientras lo mejora y lo envía la próxima vez/en otro lugar/etc.

Como puede ver, el tiempo de respuesta es de lo que se trata todo esto. Por supuesto, uno debe tener cuidado más tarde con respecto a reemplazar las referencias a los TR con referencias a las cosas realmente publicadas en las versiones CR, si hay tiempo/espacio para ello.

Esto es un buen punto sobre los diferentes marcos de tiempo de investigación y publicación. En algunos campos, como las matemáticas, la validez/interés de un artículo puede depender mucho de otros artículos muy recientes, de los mismos autores o no. Con frecuencia, esos documentos más antiguos aún no están impresos, tal vez todavía en revisión, cuando los documentos más nuevos están siendo evaluados. Sin acceso a los artículos más antiguos, puede ser difícil o imposible tomar una decisión razonable sobre la publicabilidad del artículo más nuevo. Pero este argumento es menos para un autor individual que para todo un campo.

Si los artículos se publicaran en arXiv antes de enviarlos, creo que sería más fácil diversificarse. También creo que aumentaría la calidad de las presentaciones y la velocidad del progreso. En general, debería beneficiar a su comunidad y, aunque indirectamente, a usted mismo.

Cito de esta publicación de blog una ilustración.

El sistema actual refuerza la división de la investigación en (sub)áreas, lo que dificulta que un extraño deje la suya. Por supuesto, es bueno tener un dominio de experiencia y producir resultados profundos en él. Aún así, creo que sería mejor si fuera un poco más fácil trabajar en diferentes áreas.

Para ilustrar la dificultad, suponga que desea comenzar a trabajar en una nueva área activa X. Para conocer los antecedentes, normalmente tiene que leer documentos. Sin embargo, por cada documento que lea, no es raro que haya otro que esté o haya estado en proceso de presentación. De hecho, la comunidad está produciendo grandes resultados, la mayoría de los cuales son rechazados debido a limitaciones de capacidad. Entonces, a menos que estos trabajos estén en archivos electrónicos como arXiv, no tienes acceso a ellos.

¿Que hace? Los expertos del área X, a quienes se envían estos trabajos para que sean debidamente evaluados. Pero puede ser difícil para los revisores ignorar los envíos hasta su publicación. Supongamos, por ejemplo, que ha estado trabajando en el problema Y durante meses y ahora se le pide que revise un documento que resuelve Y. ¿Va a ignorar esta información y seguir trabajando en Y a pesar de saber que será derrotado? Además, cuando el artículo sale, has tenido mucho tiempo para internalizar sus implicaciones.

La ventaja que actualmente se le da a un interno sobre un externo es de meses si el trabajo se acepta de inmediato; pueden ser años de lo contrario.

@TobiasKildetoft ¿por qué no responde la pregunta? Explica por qué beneficiaría a su comunidad e indirectamente a usted mismo. Me parece una razón válida "¿Por qué uno se preocuparía por obtener un manuscrito en arXiv, si ya está en revisión con una revista?"
Parece ser una explicación de por qué sería beneficioso para la comunidad científica si hubiera un requisito para publicar en arXiv. Esto no es lo que hace la pregunta.
@TobiasKildetoft Explica por qué beneficiaría a la comunidad científica si la gente lo hiciera . Un requisito es solo una forma de hacer cumplir esto. He reformulado mi respuesta para poner énfasis en las personas y no en los requisitos.

Algunos investigadores (supuestamente de escuelas respetuosas) usarán preprints como una forma de piratear el proceso doble ciego y tratar de impresionar a los revisores que posiblemente duden con su nombre o el nombre de sus instituciones. Los preprints suelen aparecer en Google Scholar si trabajas en ese campo. Entonces, cuando el artículo llega al revisor, él o ella ya sabe quién lo escribió. En mi opinión eso viola el proceso de doble ciego, pero la posición oficial es que no lo hace, al menos en las conferencias donde presento. ¿Alguien conoce las diferentes políticas?