Programa para buscar repeticiones de palabras en documentos Word

Tengo un documento bastante grande que contiene mucho texto, por lo que estoy buscando una herramienta que automatice el proceso de encontrar repeticiones de palabras.

Requisitos

  • Encuentre repeticiones de palabras (que, por ejemplo, ocurren en el mismo párrafo) dentro de un documento de Microsoft Word.
  • La forma más conveniente probablemente implicaría un complemento de Word, pero otras formas (por ejemplo, programas que funcionan en formatos exportados como PDF) también son bienvenidas.

  • Se debe permitir que las repeticiones difieran en caso, prefijos, sufijos, declinación o número gramatical.
    Por ejemplo, los siguientes pares en cada caso deben tratarse como si fueran iguales:

    • permitir, Adejar
    • casa Casas
    • permitir A_
    • amigo amigo's

    (En mi opinión, un algoritmo que use una heurística que compare las raíces de la palabra sería suficiente en muchos casos).

Opcional

  • Una lista negra de palabras (por ejemplo, of, the, by) que es manejable por el usuario.

Mi solicitud es diferente de un analizador de frecuencia de palabras en la medida en que me gustaría recibir repeticiones de palabras que solo ocurren en el mismo párrafo o en el mismo conjunto de líneas específico.

El software gratuito siempre es bienvenido, pero también estoy abierto a versiones de prueba que me permitan probar el programa antes de comprarlo.

Respuestas (1)

Encontré dos piezas de software que podrían ayudarte.

  1. Detector de repetición :

    • destaca las repeticiones cercanas y lejanas,
    • es un software independiente, pero una vez que su texto está dentro, mantiene el formato de MS Word,
    • no es gratis ($7.40 por la licencia) pero obtienes 30 días de prueba gratis.
  2. Edición inteligente :

    • muestra repeticiones,
    • hace un montón de otras cosas como dirigir la atención a la puntuación excesiva/mal utilizada, palabras mal utilizadas o mal utilizadas, etc.
    • funciona como complemento de Word,
    • no es gratis, pero tiene una prueba gratuita.

Tal vez valga la pena echarle un vistazo.

¡Acabo de probar ambos y ambos tienen sus aplicaciones! Repetition Detector parece ser la combinación perfecta para resaltar en color las repeticiones vecinas . SmartEdit (tanto la versión independiente como la del complemento de Word) parece ignorar esta localidad, por ejemplo, dice que usé "foo" X veces en el documento, pero si estas apariciones están muy lejos unas de otras, entonces esto es algo que no se preocupan por. Sin embargo, SmartEdit muestra otra información útil, como adverbios usados, palabras posiblemente mal usadas y posibles redundancias (por ejemplo, "podría posiblemente") .