Necesito crear un analizador ETL en Java. ¿Hay alguna herramienta o marco de código abierto disponible para construir un analizador ETL para datos no estructurados?
Quiero crear un analizador y necesito definir el formato en el archivo de propiedades y el analizador debe poder analizar según el formato en el archivo de propiedades.
No estoy pidiendo el código completo. Cualquier sugerencia sería apreciada.
Para construir procesos Etl simples y complejos, recomiendo Kettle. Actualmente se llama Pentaho Data Integration. Escrito en Java con una GUI agradable y fácil de integrar en el software Java. Fuente disponible. Ver sitio web .
El único marco de código abierto que conozco (y utilizo) para el procesamiento de ETL en Java es Spring-Batch y es la única implementación (AFAIK) de jsr-352
.
No estoy seguro de si te conviene porque en una simple búsqueda en Google encontré algunos marcos ETL puros como CloverETL pero aún no los he probado, así que no puedo opinar. Hasta ahora, he estado usando Spring-Batch para ETL y procesamiento por lotes durante casi 6 meses y estoy muy contento con él :) ¡
Espero haber ayudado un poco!
Para una transparencia total, trabajo para Talend.
Talend tiene una versión de código abierto de nuestras capacidades de integración de datos, llamada Talend Open Studio. El resultado de los trabajos ETL de Talend son código nativo. Para los sistemas tradicionales, esto sería Java.
Talend Open Studio tiene más de 3 millones de descargas y una gran comunidad de usuarios en https://www.talendforge.org/ .
guido leenders
NegroPOP