Muchas publicaciones escriben sobre "integridad". Tengo una vaga idea de que tiene que ver con la proporción de cuántas fuentes de una observación se detectan y cuántas fuentes hay realmente en ese campo. Sin embargo, alguien me puede explicar por favor:
a) ¿Cuál es la definición de completitud?
b) ¿Cómo se calcula la completitud de una observación?
Como ejemplo: Smolčić et al. 2008 están escribiendo sobre la integridad. Eche un vistazo a Un nuevo método para separar la formación estelar de las galaxias AGN en el corrimiento al rojo intermedio: la población de radio Submillijansky en la encuesta VLA-COSMOS
a) ¿Cuál es la definición de completitud?
La integridad es el número de objetos en un conjunto de datos que se detectan sobre el número que existe. En astronomía, la completitud a menudo se estima para una determinada magnitud aparente o densidad de flujo. Como ejemplo, para fuentes que son tan brillantes como el Sol (magnitud -27), tenemos una integridad de 1. Es decir, hemos descubierto todas las fuentes en la esfera celeste con la magnitud del Sol. A medida que llegamos a objetos muy tenues, como pequeñas piezas de basura espacial en las órbitas de la Tierra, nuestra tasa de integridad se reduce drásticamente.
b) ¿Cómo se calcula la completitud de una observación?
En una curva ROC , la integridad es la Tasa de verdaderos positivos o el eje y si se han observado todos los objetos (¡gracias @ProfRob!). Si solo se ha observado una fracción de los objetos, la integridad es esa fracción multiplicada por la tasa positiva verdadera. Tenga en cuenta que un clasificador solo produce una mejor integridad a costa de tasas de falsos positivos más altas. Aquí hay un excelente ejemplo de curvas ROC para diferentes algoritmos que diferencian los cuásares de las estrellas:
El panel izquierdo muestra los datos utilizados en la clasificación fotométrica basada en colores de estrellas y cuásares. Las estrellas se indican con puntos grises, mientras que los cuásares se indican con puntos negros. El panel derecho muestra las curvas ROC para la identificación de cuásares basadas en los colores u - g , g - r , r - i e i - z.
Si no conoce la verdadera tasa positiva, puede ejecutar una simulación en la que inyecta objetos en su conjunto de datos y determina qué parte de estos encuentra su algoritmo. Esto le dará una estimación de su integridad. Matlab tiene una función específica para la simulación de Monte Carlo de la curva ROC , por ejemplo.
UH oh