Herramienta GUI de código abierto para la gestión de datos con poca o ninguna programación

Un analista con problemas de programación tiene datos como estos:

ID          NAME    DATE
SYSID-1054  XYZ     1
SYSID-1054  XYZ     2
SYSID-1054  OPQ     3
SYSID-1054  OPQ     4
SYSID-1054  XYZ     5
SYSID-1054  XYZ     6
SYSID-1054  XYZ     7
SYSID-1055  ABC     8
SYSID-1055  ABC     9
SYSID-1055  DEF     10
SYSID-1055  DEF     11

El objetivo es encontrar registros donde NAMElos cambios de un día para el mismo ID, la salida debe ser esta:

ID          NAME    DATE
SYSID-1054  XYZ     1
SYSID-1054  OPQ     3
SYSID-1054  XYZ     5
SYSID-1055  ABC     8
SYSID-1055  DEF     10

Sí, sé que en SQL/algún lenguaje de programación esto es fácil de hacer. Estoy buscando una herramienta basada en GUI para el analista que no puede o no está dispuesto a aprender a programar y que todavía quiere construir una canalización de procesamiento de datos en la aplicación que pueda calcular resultados como este.

Hasta ahora he mirado a Orange , pero no he podido obtener un resultado como este en la aplicación (tal vez sea porque sé poco cómo usarlo por ahora), pero también estoy buscando alternativas.

¿ Puedes KNIMEhacer esto?

Recomiende alguna herramienta que pueda transformar datos como este sin escribir código o escribiendo poco código.

He jugado con KNIME y creo que puede hacer lo que quieras. Sin embargo, se necesita un poco de aprendizaje para usarlo.

Respuestas (1)

Te sugiero que uses OpenRefine .

Primero debe agregar una nueva columna basada en las columnas IDy NAME, por ejemplo, usando esta expresión:cells["ID"].value + ";" + cells["NAME"].value

Ordenar por la nueva columna, usar la función "Blank down" y luego crear una "Facet by blank" le permite eliminar las combinaciones ID+ duplicadas.NAME