Un analista con problemas de programación tiene datos como estos:
ID NAME DATE
SYSID-1054 XYZ 1
SYSID-1054 XYZ 2
SYSID-1054 OPQ 3
SYSID-1054 OPQ 4
SYSID-1054 XYZ 5
SYSID-1054 XYZ 6
SYSID-1054 XYZ 7
SYSID-1055 ABC 8
SYSID-1055 ABC 9
SYSID-1055 DEF 10
SYSID-1055 DEF 11
El objetivo es encontrar registros donde NAME
los cambios de un día para el mismo ID
, la salida debe ser esta:
ID NAME DATE
SYSID-1054 XYZ 1
SYSID-1054 OPQ 3
SYSID-1054 XYZ 5
SYSID-1055 ABC 8
SYSID-1055 DEF 10
Sí, sé que en SQL/algún lenguaje de programación esto es fácil de hacer. Estoy buscando una herramienta basada en GUI para el analista que no puede o no está dispuesto a aprender a programar y que todavía quiere construir una canalización de procesamiento de datos en la aplicación que pueda calcular resultados como este.
Hasta ahora he mirado a Orange , pero no he podido obtener un resultado como este en la aplicación (tal vez sea porque sé poco cómo usarlo por ahora), pero también estoy buscando alternativas.
¿ Puedes KNIME
hacer esto?
Recomiende alguna herramienta que pueda transformar datos como este sin escribir código o escribiendo poco código.
Te sugiero que uses OpenRefine .
Primero debe agregar una nueva columna basada en las columnas ID
y NAME
, por ejemplo, usando esta expresión:cells["ID"].value + ";" + cells["NAME"].value
Ordenar por la nueva columna, usar la función "Blank down" y luego crear una "Facet by blank" le permite eliminar las combinaciones ID
+ duplicadas.NAME
eric s