Tengo un millón de imágenes y necesito categorizarlas con palabras clave.
Ejemplo: una imagen de un perro conduciendo un coche cerca de la Torre Eiffel obtendría las palabras clave "perro", "coche" y "torre Eiffel".
Requisitos:
En el sitio de Tensorflow Github hay modelos preentrenados , algunos de los cuales se basan en colecciones de imágenes. Creo que investigando un poco encontrarás más.
Aquí hay uno disponible como modelo de NodeJS: MobileNet : clasifica imágenes con etiquetas de la base de datos de ImageNet .
`npm i @tensorflow-models/mobilenet`
Aunque no lo he usado personalmente. Hace un tiempo, en un Meetup, vi una charla de otra persona que usaba modelos preentrenados con Python.