¿Cómo empiezo en el análisis de datos astronómicos?

Estoy aprendiendo algo de aprendizaje automático (tengo experiencia previa en estadísticas) por mi cuenta, y estoy interesado en obtener algo de práctica haciendo algunos análisis de ML en R y Python.

Dado lo loco que estoy por la astronomía, me encantaría ensuciarme las manos haciendo algo de ML usando datos abiertos. Soy consciente de que organizaciones como la NASA tienen muchos conjuntos de datos abiertos. Lo que no me queda claro es el tipo de análisis que hay que hacer.

Entonces, me gustaría saber si hay algún sitio web donde pueda obtener un repositorio de datos espaciales (imágenes, señales, lo que sea) y que pregunte qué análisis se requiere; algo así como Kaggle donde uno obtiene el conjunto de datos y tiene la pregunta requerida que puede intentar.

Es posible que primero eche un vistazo a algunos cursos de estadística o astroestadística. Eso debería canalizar tu 'locura' en canales constructivos e instructivos.
Mi sugerencia es que vayas a arXiv.org y elijas un artículo que te interese. Luego, reproduce el análisis, para que sepa qué datos, qué métodos y a qué apuntar.
@KornpobBhirombhakdi Desafortunadamente, a menudo es mucho más fácil decirlo que hacerlo, muchos artículos no son muy claros cuando se trata de describir su análisis en detalle. Hay algunos ejemplos de documentos que también incluyen la pila de análisis completa, incluidos los cuadernos Jupyter, etc., pero es demasiado raro.
@Thriveth, estoy de acuerdo. Sin embargo, deberías tener algo a lo que aferrarte e ir desde allí. Esta estrategia sigue siendo la mejor en mi opinión, y siempre sugiero a los estudiantes que comiencen con ella. Si bien los estudiantes pueden preguntar a sus profesores en las escuelas, una comunidad como esta es importante para apoyar a otros, como los autodidactas o los estudiantes de educación en el hogar cuando necesitan ayuda.

Respuestas (3)

Una posibilidad podría ser un curso en una universidad, youtube o un curso de autoaprendizaje a través de un libro.

Lo que hemos usado en nuestra clase de astroestadística fue "Wall & Jenkins: Estadística práctica para astrónomos", que presenta secciones teóricas con ejercicios como seguimiento. No existen secciones de respuesta, ya que necesita programar algunas de ellas.

Pero tal vez puedas prestar este libro u otros similares en la biblioteca de una universidad local, sin necesidad de gastar dinero.

¡Gracias! Realmente lo aprecio. Soy miembro vitalicio de la biblioteca de mi universidad; buscaré allí. Si no lo encuentro allí, entonces no me importa comprar el libro si no es demasiado caro.

El módulo AstroML de Python puede resultarle interesante. Está acompañado por un libro de texto sobre aprendizaje automático aplicado a conjuntos de datos astronómicos, pero si no tiene dinero para gastar en el libro, hay algunos ejercicios y conjuntos de datos incluidos en el módulo que le darán mucho en lo que profundizar.

Cualquier idea de qué fracción de AstroML depende de Linux. cuando lo intenté la última vez, parecía que mucho necesitaba Linux.

Aquí hay una buena fuente de datos públicos https://pds-imaging.jpl.nasa.gov/ . Mi temor es que sin algunos cursos básicos de astronomía, habrá muchos pequeños problemas (p. ej., las coordenadas expresadas en coordenadas esféricas, etc., y es posible que espere un lector de formato xyz. FITS) para cualquier persona nueva. Esté mentalmente preparado para numerosos pequeños obstáculos.