Tengo un documento bastante grande que contiene mucho texto, por lo que estoy buscando una herramienta que automatice el proceso de encontrar repeticiones de palabras.
Requisitos
La forma más conveniente probablemente implicaría un complemento de Word, pero otras formas (por ejemplo, programas que funcionan en formatos exportados como PDF) también son bienvenidas.
Se debe permitir que las repeticiones difieran en caso, prefijos, sufijos, declinación o número gramatical.
Por ejemplo, los siguientes pares en cada caso deben tratarse como si fueran iguales:
A
dejars
A
_'s
(En mi opinión, un algoritmo que use una heurística que compare las raíces de la palabra sería suficiente en muchos casos).
Opcional
of, the, by
) que es manejable por el usuario.Mi solicitud es diferente de un analizador de frecuencia de palabras en la medida en que me gustaría recibir repeticiones de palabras que solo ocurren en el mismo párrafo o en el mismo conjunto de líneas específico.
El software gratuito siempre es bienvenido, pero también estoy abierto a versiones de prueba que me permitan probar el programa antes de comprarlo.
Encontré dos piezas de software que podrían ayudarte.
Tal vez valga la pena echarle un vistazo.
ComFreek