¿Por qué la gente publica en arXiv en lugar de en otros lugares? [duplicar]

Trabajo en ingeniería y un colega me advirtió hace años que no debería citar materiales en arXiv porque no están revisados ​​por pares. Aunque nunca me quedó claro qué significaba la revisión por pares porque los documentos allí parecían estar bien mantenidos y los que encontré eran teóricamente sólidos. Academia stackexchange ciertamente no ayudó a aliviar algunas de esas ansiedades con las personas que preguntan si están " arruinadas " por publicar en arXiv.

Uno puede entender mejor mi punto de vista al considerar que en ingeniería hay conferencias bien establecidas y una lista de artículos publicados a través de esas conferencias (aunque no todos de alta calidad). Al navegar a través de una lista de citas publicadas por ingenieros, hay una falta definitiva de artículos relacionados con "arXiv". Esto se ve agravado por el hecho de que los documentos de arXiv parecen ser menos aplicados y más teóricos, "matemáticos", por lo que están en gran parte ocultos a la vista del ingeniero típico.

Pero a partir de mis experiencias recientes, parece que algunos investigadores bastante notables en mi campo tienen un amplio historial de publicación de materiales en arXiv. Gente como Steven Strogatz que trabaja en sistemas dinámicos no lineales y John Baez. En el pasado, planteé la hipótesis de que investigadores muy bien establecidos envían artículos en arXiv en lugar de revistas científicas porque les gustaría una audiencia más amplia, y los investigadores universitarios envían artículos en arXiv porque no hay otro lugar para ellos. Pero, por supuesto, no estoy seguro de si ese es realmente el caso.

Ahora estoy leyendo material publicado en arXiv por alguien con quien no estoy muy familiarizado. Todavía no estoy 100% seguro de la "calidad" del artículo, es decir, la precisión científica de los resultados teóricos y experimentales. Pero creo que estaría más abierto a usar materiales en arXiv en el futuro si puedo entender la motivación detrás de enviarlos a arXiv, es decir, si son solo documentos de baja calidad sin ningún otro lugar que los acepte.

¿Puede alguien ofrecer un desglose de algunas de las razones por las que uno publicaría en arXiv?

Otro aspecto que se considera es que la ciencia va hacia el acceso abierto, y arxiv fomenta el movimiento de acceso abierto en la ciencia.
Su colega se equivoca al no citar documentos publicados en arxiv porque no son revisados ​​por pares. Debe citar cualquier cosa que use y en la que confíe, ya sea que haya sido revisada por pares o no. Si no puede juzgar por sí mismo si una fuente es confiable, entonces probablemente no debería publicar.
@DanFox, ¿lo que dijiste no se aplica también a Wikipedia?
@Ooker Lo siento, llegué un poco tarde con esto. Pero Wikipedia es para un trabajo de investigación lo que un libro de texto es para una revista experimental. Se podría decir que los artículos de Wikipedia son una compilación de conocimiento científico. Ahora de dónde vienen, la investigación, está documentada en un papel. Por lo tanto, citar un artículo (revisado por pares o no) no es exactamente lo mismo que citar artículos de Wikipedia.
Sin embargo, dicho esto, existe una diferencia entre citar artículos de arXiv y los revisados ​​por pares. @DanFox, recuerda, los investigadores también se equivocan. Solo publican SUS pensamientos, teorías y hallazgos sobre las cosas. Entonces, mientras más personas critiquen un artículo, es más probable que encuentre falacias, paradojas y demás (esencialmente, la idea detrás de la revisión por pares). Si bien citar documentos de arXiv no es algo que deba desalentarse (siempre y cuando confíe en la información del documento), definitivamente es más probable que haya citado documentos "malos" (por falta de un mejor término).

Respuestas (3)

El principal caso de uso de arXiv es para difundir manuscritos que también publica en una revista o conferencia. Al publicar una preimpresión en arXiv, las personas pueden encontrar su investigación, desarrollarla, citarla y brindarle comentarios al respecto de inmediato , mientras que al mismo tiempo el mismo trabajo pasa por el (a veces lento) proceso de revisión por pares. Algunos de estos documentos quedarán fuera de la tubería de revisión por pares en algún momento y solo aparecerán en arXiv, pero eso no significa necesariamente que sean menos útiles, importantes o sólidos.

Para dar un ejemplo específico, en el último año más o menos he estado trabajando en un área tan nueva que la mayor parte de la investigación relevante aún está disponible solo en arXiv. Espero que estos artículos también aparezcan eventualmente en las revistas, pero el lento proceso de revisión por pares significa que los últimos números de las revistas no representan el estado del arte para este tema en particular. Las conferencias tienen un ciclo de revisión por pares más rápido y son más actuales, pero la mayoría solo publica artículos relativamente cortos.

arXiv también es útil para el trabajo que está en un formato que no es adecuado para una conferencia o revista (por ejemplo, una tesis), o para versiones extendidas de artículos que se publican en otro lugar.

Advertiría contra reglas como "No debo citar materiales en arXiv porque no están revisados ​​por pares". La revisión por pares no garantiza una investigación sólida y de alta calidad, ni tampoco lo contrario. Debe evaluar críticamente cada documento, revisado por pares o no, según sus méritos individuales. (Consulte también esta pregunta relacionada en Desbordamiento matemático ).

Buena revelación para el uso de arXiv; +1 por el último párrafo. Volviendo a los artículos de arXiv que se publican como revistas, ¿habría alguna forma de alias para combinar las citas de las dos versiones? Además, ¿alguien puede simplemente poner su tesis en arXiv (para la visibilidad), o necesita el permiso de su institución para hacerlo?
@ÉbeIsaac Hasta donde yo sé, Scopus no cuenta las citas de la versión Arxiv de un artículo. Lo cual es una razón para citar la versión publicada (si existe) en lugar de la de Arxiv.
@FedericoPoloni: ¿Qué hay de Google Scholar?
"Debe evaluar críticamente cada documento, revisado por pares o no, según sus méritos individuales". Si no utiliza la revisión por pares como una guía sobre lo que vale la pena su evaluación crítica, básicamente niega el sentido de las revisiones por pares. Además, tu vida terminaría antes de que pudieras encontrar algo útil.
@ÉbeIsaac Google Scholar cuenta las citas de ambos, por lo general. Pero eso es irrelevante para mi punto: el hecho de que una base de datos académica común requiera citas de la versión publicada es motivo suficiente para preferirlas, en mi opinión. "Contratamos a X en lugar de a Y también porque tiene más citas en Scopus", sucede, lamentablemente.
@BartoszKP: No estoy de acuerdo. Las revisiones por pares son útiles, pero no obligatorias. Muchas publicaciones revisadas por pares tienen serias fallas, incluso en revistas acreditadas. En algunos casos, incluso una esencia/idea puede ayudar a ver un problema desde un nuevo ángulo para resolverlo, no necesariamente requiere un revisor lento para evaluarlo. A veces (en realidad, muchas veces), el proceso puede llevar hasta 4-6 años. En tales casos, muchos métodos tienden a quedar obsoletos incluso antes de que se publiquen.
@ÉbeIsaac No dije que son obligatorios, quise decir que son útiles, porque entendí la parte que cité como una sugerencia de que no son útiles en absoluto. Por supuesto, puede ser beneficioso navegar y hojear artículos no revisados, pero definitivamente no "evaluarlos críticamente" todos (bueno, dependiendo de su campo, por supuesto, y la cantidad de artículos disponibles).
Votaría a favor de esta pregunta tantas veces, si pudiera, incluso solo por la "revisión por pares no garantiza una investigación sólida y de alta calidad, ni tampoco es cierto lo contrario". . Finalmente alguien que entiende que la revisión por pares no es la verdad baja a la Tierra.
@BartoszKP Personalmente, no encuentro que "ha sido revisado por pares" sea una heurística útil para decidir a qué documentos prestar atención y "evaluar críticamente". Por supuesto, no dedicaré tiempo a todos los trabajos no revisados; Tampoco dedicaré tiempo a todos los artículos revisados. En su lugar, decido si dedico tiempo a un trabajo en función de su aparente relevancia y si, a primera vista (rápida), parece estar bien escrito y sólido.
@ ff524 "Personalmente, no encuentro que "ha sido revisado por pares" sea una heurística útil". Eres libre de hacerlo, pero de nuevo, esto significa que estás negando el sentido de cómo funciona la ciencia actualmente. Además, en muchas universidades (no sé sobre la suya, por supuesto), los trabajos que no fueron revisados ​​por pares no están permitidos, o al menos se desaconsejan como referencias de tesis.
En cuanto a si necesita permiso institucional para enviar una tesis a arXIv: depende de la institución, sus políticas y la ley local. Algunas instituciones afirman los derechos de autor u otro control sobre las tesis de sus estudiantes; en ese caso, necesitaría su permiso para publicar o distribuir la tesis o su contenido en cualquier lugar. En muchas otras instituciones, el estudiante conserva la propiedad total de la tesis y es libre de enviarla a arXiv o en cualquier otro lugar que desee.
@BartoszKP "Eres libre de hacerlo, pero nuevamente, esto significa que estás negando el sentido de cómo funciona la ciencia actualmente". no confundas el mero acto de publicar toneladas de material con ciencia real: son dos conceptos totalmente diferentes.
@GennaroTedesco No entiendo a qué te refieres. Publicar toneladas de material que no fue revisado por pares es exactamente lo que presenté como un mal ejemplo de cómo debería funcionar la ciencia. Ni siquiera me refería a qué es la ciencia, solo a cómo funciona el proceso actualmente. Y funciona gracias a las revisiones por pares. Por supuesto, puede argumentar que no es ideal (es decir, publicar toneladas de material revisado por pares, pero de alguna manera no de muy buena calidad), pero todavía no se ha encontrado una solución mejor, práctica e implementable.
@BartoszKP Me refería a lo contrario de la declaración (la que resaltó entre paréntesis), en particular, el proceso de publicación de material que de hecho ha sido revisado por pares es diferente de hacer ciencia. No tomaría las revisiones por pares como una evaluación de lo que es o no es científico. Hay muchos ejemplos de investigaciones muy buenas (incluso resultados sobresalientes) que ni siquiera se han enviado a ningún lado (por elección de los autores) y miles de millones de ejemplos de material de calidad de la escuela secundaria que, por razones aún desconocidas, llegan a revistas y similares.
@GennaroTedesco No dije que publicar es ciencia . Solo digo que las revisiones por pares son, en general, la única heurística sensata que tenemos actualmente (vea mi comentario de que obviamente no es ideal en mi comentario anterior). En algunos campos específicos es posible que usted mismo evalúe todo lo que se publica, pero en general no es posible. Y también, vea mi comentario anterior sobre cómo se maneja esto formalmente en las universidades. Repito: estoy de acuerdo en que no es ideal, pero no puedes simplemente escribir que es básicamente inútil y que no debes confiar en él en absoluto.
@BartoszKP Uso wikipedia todos los días y es tremendamente útil. ¿Cómo llegaste a creer que la revisión por pares es la única forma de crear contenido útil? Internet está lleno de contenido útil, y no, no paso toda mi vida buscando contenido: con la búsqueda de Google se tarda segundos en obtener MUCHO material útil, que nunca es revisado por pares. Por otro lado, he visto un montón de BS en revistas revisadas por pares...
@deusexmachina Wikipedia tiene una forma de revisión por pares y una política bastante estricta sobre qué fuentes debe citar (adivine qué tipos de publicaciones se consideran las mejores fuentes). Estaba muy interesado en mencionar que a) existe contenido útil sin revisión por pares b) algún contenido revisado por pares es de baja calidad, pero de alguna manera no ha tenido en cuenta el hecho de que c) también existe contenido inútil y de baja calidad sin revisión por pares. Entonces, para ser justos, tendríamos que comparar no solo las cantidades de contenido útil creado con y sin relaciones públicas, sino también la cantidad de basura que necesita buscar para encontrarlo.
@BartoszKP Bueno, wikipedia tiene una forma de revisión por pares, pero no es exactamente el tipo de revista clásica de revisión por pares. En ese sentido, arxiv también tiene alguna forma de "revisión por pares", ya que se eliminará el material ofensivo, etc. El punto es que proyectos como wikipedia (y SO, por cierto) muestran que una alternativa al modelo clásico de revisión por pares (por ejemplo, todos pueden comentar/votar a favor) proporciona contenido útil.
@BartoszKP Por ejemplo, aquí en SO, no tengo que buscar durante toda mi vida para encontrar respuestas útiles; ) De hecho, encuentro material útil mucho más rápido en Internet que en los periódicos. Resulta que la única forma de acceder a la gran cantidad de literatura científica son los servicios web como Google Scholar o SciFinder. Entonces, realmente no entiendo que la revisión por pares ayude a encontrar contenido rápidamente porque ese no es el caso. ¿Alguna vez leyó todos los artículos de Nature del mes actual? La única pregunta es si queremos un modelo transparente para la exploración o servicios propietarios como Google Scholar.
@deusexmachina No en un contexto científico . Estoy de acuerdo en que los ejemplos que menciona brindan contenido útil y valioso, pero este es un nivel un poco diferente. Y el hecho de que ambos ejemplos tengan una especie de revisión por pares, sugiere fuertemente que esta es la clave. Mencionar en cada ocasión que existe contenido de relaciones públicas de baja calidad es simplemente infantil: también hay artículos de Wikipedia sin valor y publicaciones SO sin valor con puntaje alto. Por supuesto que no existe un proceso perfecto . Pero cuanto más se verifica y se examina el contenido, más posibilidades hay de que sea exacto.
@deusexmachina No me refiero a la capacidad de búsqueda en el contexto de hacer coincidir su problema en cuestión, sino en el sentido de calidad. Cuando estoy leyendo Inteligencia artificial de Elsevier, estoy seguro de que cada uno de los artículos presentados es un trabajo de alta calidad, proporcionado por expertos y verificado (y sí, los accidentes ocurren y hay algunas fallas en este proceso). Este es solo a veces el caso de SO, cuando la mayoría de las veces tiene respuestas de personas "aleatorias", de las cuales solo sabe que probablemente solo fueron útiles para el OP. No tiene nada de malo: SO tiene un propósito un poco diferente al de las revistas científicas.
@BartoszKP La calidad es una cuestión de contexto. Simplemente no estoy de acuerdo con la opinión: "Además, tu vida terminaría antes de que pudieras encontrar algo útil". Básicamente, dependes de material no revisado por pares todo el tiempo, y de hecho es bastante útil; )
@deusexmachina "dependes de material no revisado por pares todo el tiempo". No si quieres hacer ciencia a nivel profesional.
@BartoszKP ¿No? ¿Nunca usas Google? ¿Nunca? ¿Crees que la tierra es plana? ¿Cómo sabe con certeza que no lo es? ¿Lo buscó en una revista revisada por pares? Al final, todos confiamos en el voto de la mayoría: el voto de la mayoría se convierte en la verdad, y prefiero tener la verdad de 2-3 mil millones de personas que la verdad de 2-3 revisores; )
@deusexmachina Mi comentario inicial se refería a la preocupación de "citar" y no "mirar". Además, he mencionado explícitamente que es una pauta obligatoria , no una regla a seguir. "y prefiero tener la verdad de 2-3 mil millones de personas que la verdad de 2-3 revisores ;)", incluso si la mayoría de las personas apesta en matemáticas y no tiene ni idea de medicina y estos 2-3 revisores resultan ser expertos en la materia? Buena suerte.

Parte de su pregunta parece ser "¿Por qué algunos investigadores se someten a arXiv mientras que otros no?".

Un punto aún no mencionado: arXiv solo cubre algunas áreas temáticas específicas. Es la primera línea en la página de inicio:

Acceso abierto a 1.175.314 e-prints en Física, Matemáticas, Informática, Biología Cuantitativa, Finanzas Cuantitativas y Estadística

Dado que la ingeniería no está en esa lista, sería una excelente razón para que la mayoría de los investigadores de ingeniería no publiquen su trabajo en arXiv.

Los "investigadores notables en su campo" que menciona como prolíficos carteles de arXiv, en cierto sentido, no están realmente en su campo. Strogatz es matemático y Baez es físico matemático. Ambos campos están cubiertos por arXiv, por lo que tiene sentido que lo usen.

Ahora bien, es muy posible que, aunque piense que su campo es ingeniería, algunos de sus artículos pueden contener "suficiente" física o matemáticas para abordar el tema de las secciones correspondientes de arXiv. Pero es posible que tengas que pensarlo primero.

También se debe enfatizar enfáticamente que estas personas no se envían a arXiv en lugar de revistas revisadas por pares, sino además de . Esto es perfectamente aceptable según los estándares de la mayoría de las revistas de matemáticas y física. Hay muchos puntos de venta revisados ​​por pares para su trabajo y los están usando. Basta con mirar sus CV.

Ahora bien, es muy posible que, aunque crea que su campo es ingeniería, algunos de sus artículos contengan "suficiente" física o matemáticas para abordar el tema... En caso de que la gente se lo pregunte, en ingeniería eléctrica, por ejemplo, los investigadores que trabajan en teoría de la información, aprendizaje automático/estadístico, control y en varios problemas de optimización, publique bastante en arXiv.

Lo más importante es saber si las revistas revisadas por pares en su campo aceptarán publicar su artículo si se ha publicado previamente en arXiv.

En mi campo, la química, la respuesta es no, por lo que publicar en arXiv nunca ha sido una opción. Sin embargo, tenga en cuenta que algunos editores permiten que un artículo aceptado se publique en arXiv, pero eso es después de que haya sido aceptado.