visualización de datos a lo largo del tiempo

Tengo un conjunto de datos de tamaño decente: 500,000 registros, cada uno de los cuales representa un evento.

Los campos son:

  • fecha
  • tiempo
  • quien hizo el evento
  • cuál fue el evento (habrá, digamos, 5-10 tipos de eventos)
  • donde fue el evento (habrá alrededor de 20 ubicaciones para un evento)
  • 'otras cosas'

hay alrededor de 500-1000 eventos por día

Mi máxima fantasía sería tener un video vinculado a una cierta escala de tiempo: solo faltan 2 años de datos, así que haga que el video (para discusión) dure 2 minutos, cada minuto es un año, y así sucesivamente. Cada ubicación se mostraría como un círculo de cierto tamaño que crecería a medida que los eventos 'sucedieran' en esas ubicaciones. Una versión aún más pervertida de esta fantasía es donde cada círculo es un gráfico circular y los segmentos circulares crecen o se reducen según el tipo de evento en cada lugar.

¿Hay algunas herramientas listas para usar, o bibliotecas de código abierto para python, o un sitio web que alguien recomendaría?

¿Es este el tipo de cosas que contratas a alguien a un precio elevado para que lo haga por ti?

y lo siento, la lista de campos resultó extraña [fecha] [hora] [quién] [qué] [dónde] [otro]
Primera vez que veo esto. Esta publicación de blog parece ser muy relevante para esto: responsivenews.co.uk/post/87988072178/…

Respuestas (5)

Hay dos bibliotecas de JavaScript que pueden resultarle útiles para lograr algo como esto:

De lo contrario, hay muchas, muchas bibliotecas de gráficos que podría adaptar, algunas Flash, algunas PHP, algunas jQuery. Digg solía hacer algunas visualizaciones realmente geniales en los laboratorios de Digg, pero desafortunadamente, todo lo que queda ahora después de su rediseño es este video .

Mira esta presentación de Hans Rosling.

Está disponible en gapminder.org y en Google Spreadsheets.

Si bien esto puede responder teóricamente a la pregunta, sería preferible incluir las partes esenciales de la respuesta aquí y proporcionar el enlace como referencia.

Como tiene ubicaciones, el resultado puede ser un mapa interactivo. Los software de mapas interactivos de código abierto no son muy numerosos, pero puede generar imágenes estáticas y luego ensamblarlas en una animación.

Una gran combinación de software es R + python + FOSS GIS (gratis y de código abierto, como GRASS o QGIS). Algunos contenidos educativos introductorios se enumeran aquí: http://www.osgeo.org/educational_content

Como cartógrafo profesional, recientemente me pidieron que creara una herramienta de visualización en línea de valores cuantitativos espacializados como puntos, a lo largo del tiempo, y usé GeoExt lib, un puente entre el marco web Ext.JS de Sencha y el marco de mapeo OpenLayers, pero es quizás un poco complicado.

Existe una asombrosa variedad de posibilidades para el manejo de datos geoespaciales. De hecho, podrías usar Google Earth para esto. Google Earth tiene una línea de tiempo incorporada y una gran cantidad de funciones. Ya no es independiente y se integra fácilmente en la web.

Aquí hay una larga lista de herramientas geoespaciales.

gefi

Gephi en sí mismo es una herramienta de visualización de redes, pero hay muchos complementos, también para geoespacial.

Gapminder Mira esta presentación fenomenal de TED de Hans Rosling: amo a ese chico

Gapminder se mencionó anteriormente, pero podría volver a mencionarse fácilmente :)

gráficos de Google

Los gráficos de Google pueden manejar big data, pero debe verificar las limitaciones y si tendría que pagar por una cuenta de big data.

somvis

Una bonita herramienta para la extracción de datos de grandes conjuntos de datos.

Rafael

También mencionado anteriormente. Que yo sepa, Raphael tiene algunas limitaciones en cuanto a los datos realmente grandes.

Exhibición del MIT (anteriormente llamada Similie)

Hacía tiempo que no jugaba con Similie, pero recordad que tienen capacidad para big data. Las imágenes pueden no ser las más elegantes, pero eso podrías hacerlo tú mismo.

d3

Uno de los buenos-viejos, javascript altamente adaptable.

Gráficos altos

Muy profesional y versátil (me encanta que se vinculen directamente a jsfiddle para sus gráficos). Puede pagar por las soluciones de gama alta, y eso debería manejar fácilmente grandes datos en vivo.