Soluciones para el reconocimiento de objetos en dispositivos móviles

Voy a escribir una aplicación móvil que reconozca imágenes dentro de un grupo objetivo cerrado . Supongo que el grupo contiene de 20 a 50 imágenes cómicas como esta .

La aplicación reacciona si alguno de esos objetivos es capturado por la cámara del dispositivo. Eso es todo.

Sin embargo, hay algunas limitaciones.

  • Debe reconocer objetivos rotados .
  • Debe reconocer aquellos con las diferentes perspectivas y niveles de luz .
  • Si puede manejar obstrucciones como los dedos, estaré feliz con eso. (opcional)
  • Debe ser fácil de entrenar. (opcional)
  • Prefiero soluciones inexactas pero rápidas . (¿no más de 3 segundos, tal vez?)

No tengo suficiente tiempo para la tarea y soy un poco nuevo en el procesamiento de imágenes, por lo que comenzar con OpenCV lleva mucho tiempo, aparentemente.

Espero sus sugerencias.

Además, las soluciones no tienen que ser gratuitas.


Editar:

En términos de nuestro presupuesto, es posible que tenga que preguntarle a mi jefe no técnico que probablemente no conozca el precio común. Solo dame sugerencias/ofertas sin importar el precio y luego elegirá una.

Entrenar un clasificador Haar para OpenCV en realidad no es tan difícil. Por ejemplo, consulte youtube.com/watch?v=WEzm7L5zoZE . . . la parte del problema que requiere mucho tiempo es obtener suficientes imágenes de muestra para completar la capacitación.
@NeilSlater, buen video. Entonces, el entrenamiento en sí parece ser sencillo con OpenCV. ¡Asombroso! Lo probaré. Muchas gracias.

Respuestas (1)

[ Descargo de responsabilidad: trabajo para Moodstocks ]

Debería echar un vistazo al SDK de Moodstocks . Se adapta a la mayoría de sus requisitos:

  • es resistente a los rayos y a los cambios de perspectiva,
  • tolera la oclusión parcial, por ejemplo con los dedos,
  • no requiere ningún tipo de capacitación: solo carga ( index ) una imagen para que sea reconocible al instante,
  • es extremadamente rápido: la coincidencia de imágenes se realiza localmente, por lo que en un teléfono inteligente moderno obtendrá un resultado en mucho menos de 300 ms.

El único problema es la solidez de la rotación: el SDK de Moodstocks solo admite una rotación pequeña (~30°). Dicho esto, dado el hecho de que tiene un número limitado de imágenes, esto se puede resolver fácilmente de una manera bastante bruta al indexar varias instancias de cada imagen bajo diferentes rotaciones.

¡Espero que esto ayude!

Gracias por tu sugerencia, Renón. Me estoy divirtiendo con la prueba, es súper fácil y es realmente capaz de ocluir parcialmente como dijiste. ¡Buen trabajo!