¿Alguien sabe de alguna buena opción de software que me permita comparar documentos con un conjunto de glifos (mapa de caracteres detrás de documentos pdf)?
¿O si alguien conoce un buen software de OCR que pueda leer y comparar documentos? Debe ejecutarse en Windows, y no tengo margen de precio.
Si desea trabajar con un SDK de OCR comercial, puede consultar el SDK de OCR de LEADTOOLS . Puede OCR fácilmente un documento en solo unas pocas líneas de código, consulte a continuación.
// Initialize the OCR engine
ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage,
// Startup the engine
ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS 19\Bin\Common\OcrAdvantageRuntime");
using (IOcrDocument ocrDocument = ocrEngine.DocumentManager.CreateDocument())
{
//Load image
RasterImage image = ocrEngine.RasterCodecsInstance.Load(file, 0, CodecsLoadByteOrder.Rgb, 1, -1);
//Add pages
ocrDocument.Pages.AddPages(image, 1, -1, null);
//Recognize Page
ocrDocument.Pages.Recognize(null);
//Save Output
ocrDocument.Save(outPut, Leadtools.Forms.DocumentWriters.DocumentFormat.Text, null);
}
También puede encontrar una demostración interactiva de OCR HTML5/JavaScript si está interesado en probar esto con su archivo. Este SDK funcionará en Windows, Linux, Mac, Android, WinRT e iOS.
Descargo de responsabilidad: soy un empleado de este producto
Nicolás Raúl
Nicolás Raúl