¿Cómo verifican los editores de revistas el recuento de palabras en los archivos PDF?

He leído publicaciones de editores de revistas en Academia Stack Exchange que lo primero que hacen es verificar el recuento de palabras de los artículos enviados.

¿Cómo verifican los editores de revistas el recuento de palabras de los artículos enviados, considerando que los autores pueden enviar artículos en formato pdf con numerosas tablas y figuras?

Para revisar mis propios artículos, PDF producidos en LaTeX, abro mi PDF, selecciono todo, luego copio y pego en Microsoft Word. Este método sobreestima la cantidad de palabras ya que incluye todos los números de página y todos los números dentro de las tablas, pero lo prefiero a TeXcount ( http://app.uio.no/ifi/texcount/online.php ) ya que incluye referencias y bibliografía .

Convertir pdf a doc, etc...
Usted dice "Lo prefiero a TeXcount […] ya que incluye referencias y bibliografía", pero TeXcount también contará los elementos de la bibliografía si se lo pide: simplemente pásele el indicador "-incbib".
A menudo excedimos el número de palabras (para resúmenes y cosas por el estilo) y nunca recibimos una queja. Supongo que esto solo se hace si la longitud total es demasiado larga (de todos modos, el recuento de palabras puede ser una medida terrible para la longitud). Por lo general, las páginas son el recuento que preocupa a los editores.
Una forma para los menos expertos en tecnología: academia.stackexchange.com/q/102691/25112
Creo que los editores no están interesados ​​en rechazar artículos que excedan ligeramente el número permitido de palabras, por lo que no necesitan un conteo realmente preciso. Una aproximación aproximada es suficiente para lo que realmente quieren hacer: si un manuscrito es demasiado largo, entonces rechácelo por "exceder en gran medida el número de palabras permitido".

Respuestas (2)

Sospecho que en muchos casos en los que los autores envían un PDF y los editores no usan Linux (como puede ser el caso en muchas disciplinas, incluidas la mayoría de las disciplinas de artes y humanidades), es posible que no se obtenga un recuento exacto de palabras. En su lugar, se puede determinar un recuento aproximado de palabras basado en la longitud y el formato del manuscrito.

Cuente las palabras en 3 líneas en diferentes párrafos, promedie, luego multiplique el número de líneas...

Una forma de hacerlo es

$ pdftotext paper.pdf | wc-w

Este comando funciona en la mayoría de los sistemas Linux y lo que hace básicamente es convertir el pdf a texto y luego contar las palabras.