Un analizador de CV/currículum de software libre

Estoy buscando una solución de software para extraer datos de currículum vitae en varios formatos (PDF, Microsoft Word, etc.).

Lo que necesito es:

  1. extracción de nombre, apellido, correo electrónico, números de teléfono, dirección postal segmentada (calle, código postal, etc.) en una salida estructurada explotable
  2. una solución de software libre
  3. extraer otras entradas típicas del currículum (título de trabajos anteriores, etc.)
  4. una solución que integra directamente los resultados anteriores en OpenERP (tenga en cuenta que OpenERP ahora se conoce como odoo ).

Idealmente, se integraría a la perfección con OpenERP , pero cualquier solución que proporcione una salida de clave/valor sería suficiente, ya que puedo desarrollar el pegamento de integración yo mismo. Debería permitirme obtener resultados en un servidor Linux, por lo que un software compatible con Linux sería mejor, pero incluso un servicio web con un tiempo de respuesta razonable para un uso interactivo podría estar bien.

Según mi propia investigación, Open Applicant podría haber sido un buen candidato, ya que proporcionaba un "análisis de reanudación" y era un software gratuito. Pero lamentablemente parece que desapareció de la web.

Los softwares no libres que pueden hacer el trabajo incluyen DaXtra Parser , ResumeGrabber, Rchilli Resume Parser , Automated Hr Software Resume Parser.

OrangeHRM anuncia que integra " Preselección usando el análisis de currículos para leer currículos y palabras clave ", pero aún no sé si es una solución nativa o si se basa en algún SaaS .
¿Alguna vez viniste alrededor de esto? ¿Encontraste una solución? En caso afirmativo, ¿publicarías una respuesta?
Lo siento, no encontré ninguna respuesta satisfactoria en ese momento, y no planeo investigar más sobre este tema.
Aunque el código de OpenApplicant ya no está en Sourceforge sourceforge.net/projects/openapplicant/files , parece que se ha conservado aquí: en.pianshen.com/1360840
Te sugiero que lo publiques como respuesta. Bien hecho por encontrarlo. Por lo que puedo ver en Way back Machine, esa página nunca tuvo un enlace de descarga web.archive.org/web */ linuxlinks.com/article/20091006152306344/ OpenApplicant.html

Respuestas (5)

Dado que el tono de su pregunta sugiere cierta experiencia en programación, sugeriría que esto probablemente podría lograrse en python mediante:

  1. Convertir cada CV a un formato común, como Markdown o texto sin formato:
  2. O : seleccione datos relevantes usando un conjunto de expresiones regulares de Python usando re / regex , esto probablemente le dará los resultados más rápidos pero posiblemente no los más completos o :
  3. Analice y analice utilizando nltk: esta es posiblemente la solución más poderosa, pero su implementación requerirá mucho tiempo y esfuerzo.

    • extraer nombre, apellido, correo electrónico, números de teléfono, dirección postal segmentada (calle, código postal, etc.) en una salida estructurada explotable - Un buen conjunto de expresiones regulares debería ser suficiente para esto.
    • Gratis - aparte de los costes de desarrollo
    • extraer otras entradas típicas del currículum: depende del esfuerzo que realice y probablemente requerirá la solución nltk .
    • Integre con OpenERP, dado que puede generar en cualquier formato que necesite, diría que sí o podría usar un cliente OpenERP .
    • Ejecutar en un servidor Linux, definitivamente .

Encontré otra empresa de análisis de currículums www.candidatezap.com que afirman poder cargar currículums en muchos ATS/CRM sin codificación/programación y sin necesidad de integración.

¡Hola! ¿Podría ampliar su respuesta para que sea independiente? ¡Intenta estructurarlo para que responda los 4 puntos en la pregunta OP!

Aquí hay un servicio gratuito de API de análisis de currículum vitae / CV que puede usar, bastante simple de integrar con sus aplicaciones o sitios web. Tiene alguna muestra de integración de código .net en el sitio web

Parece que ese enlace ahora está muerto :-(

Si está buscando un analizador de currículum gratuito, consulte https://affinda.com/resume-parser/

La salida está en formatos XLS, JSON y XML. Esta solución se creó utilizando los últimos avances en procesamiento de lenguaje natural para garantizar que pueda manejar el conjunto más amplio de formatos de currículum.

Necesitará desarrollar la integración descrita usted mismo, y debería ser sencillo dado que la salida puede estar en un archivo JSON.

Los campos incluyen nombre, ubicación, teléfono, correo electrónico, sitios web, experiencia laboral (trabajo, empleador, ubicación, fechas), educación (institución, título, ubicación, fechas), habilidades y más.

¡Ojalá esto ayude!

Suena una solución interesante pero no gratuita como en el software libre. Más bien lo contrario en realidad, ya que parece una solución única en la nube.

Nuestro software de análisis de CV lo ayuda a extraer detalles de los currículos. Por lo general, es compatible con todos los formatos de currículos/CV.

¿Podría dar algunos detalles de e. Por ejemplo, ¿cuál es el formato de salida? XML? ¿Puede escribir directamente en mi base de datos? Además, cuál es el precio (no es necesario para responder a la pregunta, pero es bueno saberlo). Supongo que es compatible con Linux como preguntó el OP. Windows también?
Además, ¿hay un archivo de salida de ejemplo en algún lugar de su sitio web, para que podamos ver exactamente cómo se ve?
La salida está disponible en formatos XML y JSON. Ayudará a almacenar directamente en su base de datos, CRM o ATS. Para brindarle un mejor servicio, proporcione sus datos aquí. ( rchilli.com/contacts ).
Si hubiera publicado detalles aquí, podría haber ayudado a muchas personas y obtener muchas consultas. Tal como están las cosas, me gustaría ese servicio, pero no voy a preguntar si no da ningún detalle aquí.