Software para almacenar y visualizar fácilmente segmentos de datos multidimensionales

Tengo varios cientos de valores, cada uno correspondiente a una tupla de características de diferentes dimensiones. Por ejemplo, el valor es precio , las dimensiones son:

  • Fruta: manzanas, naranjas, plátanos (dimensión enumerada)
  • Origen: Estados Unidos, Argentina, Marruecos, ...
  • Mes: febrero 2014, enero 2014, diciembre 2013, ...
  • Volumen mínimo de compra: 1 kg, 10 kg, 1000 kg (pseudo-medida)

Estoy buscando un software multiplataforma para almacenar dichos datos y facilitar la visualización de segmentos de datos: dibujar diferentes gráficos (3D, apilados, área, porcentaje, barra), seleccionar varias funciones para ejes.

Ejemplos:

  • Gráfico de líneas con precios de manzanas por 1 kg de Argentina (mes por eje X).
  • Gráfico de barras con precios de naranjas, origen por eje X, y agrupados por volumen mínimo de compra.
  • Gráfico 3D con precios de banano, mes por eje X, siendo el mínimo volumen por eje Y, precios promediados por origen.
El tiempo también estaría bien, con una compresión de este mes/último mes, o abril para cada año de datos

Respuestas (2)

Recomendaría Pentaho para esto.
No es exactamente fácil, pero tampoco demasiado difícil una vez que entiendes el concepto.

Tiene muchas opciones para insertar sus datos (por ejemplo, CSV).
Luego puede generar profundización en las dimensiones que desee y generar buenos gráficos.

También puede definir paneles e informes actualizados automáticamente.

La edición comunitaria (CE) es de código abierto (licencia Apache 2) y se puede encontrar aquí .
Lo usé en Linux y Windows, pero también funciona en Mac OS X.

ingrese la descripción de la imagen aquí

La edición comunitaria gratuita no es fácil de encontrar en el sitio web; debe buscar en community.pentaho.com para encontrarla. Además, no creo que el "acuerdo de participación" cumpla con los requisitos de CUALQUIER licencia de código abierto.
Wikipedia afirma que Community Edition está bajo la licencia Apache 2, lo que significa código abierto. No he visto ningún "acuerdo de participación" al descargar desde sourceforge.net/projects/pentaho/files

Recomendaría encarecidamente echar un vistazo a python + si sus datos son realmente grandes pyTables y MatPlotLib o para tamaños moderados de datos Pandas ; de cualquier manera, obtiene una vista gratuita, multiplataforma y totalmente personalizable de sus datos.

Solo hay cientos, máximo varios miles de valores. Pandas parece interesante. No necesito analizar los datos (medias, distribuciones, etc.), solo visualizar. Tengo un poco de experiencia con Matplotlib y eso es lo que me gustaría evitar. Matplotlib es poderoso, pero no simple.
Eche un vistazo a los ejemplos en: pandas.pydata.org/pandas-docs/stable/rplot.html
Todo esto suena bien y personalmente los uso para todo, pero básicamente requiere que él escriba su propio software. Si bien el OP podría hacer eso, no ayudará a alguien que, por ejemplo, quiera deshacerse de Excel