Conjunto de datos para la clasificación estelar MK de aprendizaje automático

Me gustaría crear un programa para la clasificación estelar automática de Morgan-Keenan utilizando el aprendizaje automático. Para eso, necesito un conjunto de datos de estrellas con magnitud absoluta conocida, temperatura y tipo de luminosidad (0, Ia, Ib, ..., VII). Encontré algunos conjuntos de datos (por ejemplo, kaggle.com ), sin embargo, contienen solo unos pocos cientos de estrellas y no todos los tipos de estrellas están representados.

¿Hay algún conjunto de datos lo suficientemente grande (al menos 1000 estrellas) en el que se representen todos los tipos de estrellas, desde hipergigantes hasta enanas, y con toda la información mencionada?

Respuestas (1)

Que sé que existe el catálogo XHIP a través de VizieR y puede ingresar un rango en UMag (o banda B y V) por ejemplo de -20 .. 20. Marque la casilla SpType y Tc para obtener también el tipo espectral y la temperatura (consulte la literatura para conocer las cantidades que necesita)

En la columna de la izquierda titulada Preferencias , establezca la cantidad máxima en ilimitada (es la cantidad de datos) y el cuadro justo debajo indica el formato para descargar los datos, si desea *.csv, seleccione CDS Portal y haga clic en Enviar .

Será redirigido al portal de CDS y simplemente haga clic en Guardar y luego en Mis datos , le mostrará una lista del conjunto de datos que guardó y podrá seleccionar el formato de su archivo (csv, fit, etc.) y luego descargarlo.

Con el rango simple de la magnitud absoluta V entre -20 y 20 obtienes más de 100k estrellas

Editado: noté que bajando los datos por el portal CDS no te da las cantidades que chequeas, pero alguna fija. Tal vez pueda sugerir seleccionar texto ascii/sin formato y luego descargar la página.

Gracias, eso es exactamente lo que estaba buscando.