Combinar dos puntos de datos con diferentes incertidumbres

Tengo dos algoritmos separados (llámelos "A1" y "A2") que reconstruyen el ( X , y ) -posición de un evento en un detector de partículas. Puedo probar ambos algoritmos en eventos simulados de un Monte Carlo muy preciso del experimento. Tenga en cuenta que A1 y A2 funcionan en diferentes observables en el detector y sus errores no están correlacionados (aunque los propios observables están correlacionados). No hay un sesgo sistemático con ninguno de los algoritmos y, por lo tanto, en conjunto, el error de reconstrucción X y y es aproximadamente cero sobre todos los eventos.

Digamos que A1 reconstruye un evento MC dado en alguna posición ( X 1 , y 1 ) , y A2 reconstruye el mismo evento MC en alguna posición diferente ( X 2 , y 2 ) . Ejecuto A1 y A2 en cada evento de MC, y termino con dos distribuciones: una que da la distancia (distancia escalar, no vector) desde la verdadera posición de MC del evento hasta ( X 1 , y 1 ) para todos los eventos, y uno que da la distancia desde la verdadera posición MC del evento a ( X 2 , y 2 ) para todos los eventos. Dado que esta distancia es necesariamente no negativa, estas distribuciones tienen algún valor medio positivo y algo de RMS.

Todo está bien: estas dos distribuciones tienen cada una una media (que caracteriza la precisión del algoritmo) y un RMS (que caracteriza la precisión del algoritmo), y las dos distribuciones son más o menos gaussianas. A continuación, quiero usar estos algoritmos A1 y A2 en datos reales del detector y usar las propiedades de estas distribuciones MC para poner un límite a la incertidumbre de mis posiciones reconstruidas.

Mi pregunta es la siguiente: conociendo los RMS y las medias de las distribuciones de distancia A1 y A2, cuando uso A1 y A2 en datos reales , debería poder encontrar un punto de "mejor ajuste" y ponerle cierta incertidumbre. Por un lado, siento que debería promediar las medidas y sumar los errores en cuadratura, pero esto se siente incorrecto por alguna razón (quizás porque la media de A2 tiende a ser mucho más alta que la media de A1).

¿Es esta la forma correcta de analizar estos datos? ¿Estoy pensando demasiado en esto?

Los comentarios no son para una discusión extensa; esta conversación se ha movido a chat .

Respuestas (2)

Como se explica en los comentarios, para un evento MC dado, los errores d X y d y para los dos métodos de reconstrucción A1 y A2 no están correlacionados. Por lo tanto, no se obtiene información adicional mediante el uso de ambas reconstrucciones. Deberíamos usar el mejor.

Ahora, ¿qué significa "mejor"? Como se indica en el OP, para ambas reconstrucciones, las distribuciones de d X y d y son gaussianas con media cero. Sin embargo, las desviaciones estándar son diferentes. Suponiendo que para cualquier método de reconstrucción σ d X = σ d y σ , la mejor estrategia es simplemente elegir el método con el menor σ . A diferencia de d X y d y , el error "distancia" d r d X 2 + d y 2 tiene una distribución que es estrictamente positiva y tiene una media distinta de cero. [ a ] Como se señaló en el OP, A1 y A2 conducen a dos distribuciones diferentes de d r , cada uno con su propia media (positiva) y varianza. Tenga en cuenta, sin embargo, que la media y la varianza de la distribución de Rayleigh no son independientes (consulte el artículo vinculado a continuación), por lo que realmente solo desea utilizar el método de reconstrucción con la media más pequeña d r , que es lo mismo que elegir el que tiene la gaussiana más pequeña σ como se describió anteriormente.

Nuestra declaración anterior de que deberíamos usar el método de reconstrucción que tiene el menor σ depende críticamente del hecho de que A1 y A2 usan los mismos datos de MC. Sin embargo, OP mencionó que en el experimento real, A1 y A2 usan diferentes observables en el detector. En este caso, nos beneficiamos al combinar los datos de ambos métodos, en esencia porque más datos significan más información. La pregunta entonces es cómo combinar los resultados. Esta es realmente una pregunta muy interesante.

Para un evento de detector dado, obtenemos cuatro números:

X 1 , y 1 , X 2 , y 2
dónde X i es el X coordenada reconstruida por el método Ai, y de manera similar para y . Ahora, basándonos únicamente en los resultados de A1, nuestro conocimiento del verdadero X la posición es

PAG X 1 ( X | X 1 ) = 1 2 π σ 1 2 Exp [ ( X X 1 ) 2 2 σ 1 2 ] .
Las expresiones para PAG Y 1 , PAG X 2 , y PAG Y 2 son las cosas similares obvias. Ahora lo interesante: la distribución de los X la posición del evento, dadas ambas medidas A1 y A2 es
PAG X 1 + 2 ( X | X 1 , X 2 ) = 1 norte PAG X 1 ( X | X 1 ) PAG X 2 ( X | X 2 )
dónde norte es un factor de normalización.

Tenga en cuenta que si cualquiera de A1 o A2 es mucho mejor que el otro, puede ignorar el peor sin perder mucha precisión.

[ a ] : Por si sirve de algo, la distribución de d r se llama distribución de Rayleigh .

Perdona mi ignorancia, pero dado que σ 1 , σ 2 , X 1 , y 1 , X 2 , y y 2 son todas constantes, solo quiero sustituirlas en la fórmula anterior y encontrar los valores de X y y que dan la máxima probabilidad, ¿correcto? Mi siguiente pregunta es: ¿cómo combino los sigmas para obtener un límite de error para el resultado? X y y ? ¿Simplemente sacar la raíz de la suma de los cuadrados?
@AndrewWatson Primero, sí, la fórmula que di para PAG X 1 + 2 se puede escribir explícitamente con todos los X 1 , X 2 , etc valores. No lo hice porque confío en que puedas hacerlo ;) En segundo lugar, una vez que escribas esa fórmula, ciertamente puedes encontrar el punto de máxima probabilidad por los medios habituales (es decir, derivar y poner a cero). Finalmente, pregunta sobre la combinación de sigmas. ¡Ten cuidado! Cuando X 1 X 2 la distribución para X ya no es gaussiano, por lo que no necesariamente puede simplemente agregar las variaciones.
@AndrewWatson Recuerde que debido a que mide cada evento dos veces, tiene una distribución que depende de dos puntos espaciales. Si desea conocer la varianza de un par dado medido de X 1 y X 2 , puedes simplemente hacer numéricamente la integral apropiada. No estoy seguro de si hay una representación de forma cerrada. ¡Podría haber!
¡Excelente! ¡Gracias! Y sí, me di cuenta de eso después de publicar mi comentario anterior. Realmente no quiero mucho más que un solo número para el error (no quiero una distribución 2D) para cada evento, así que puedo ignorarlo por ahora.
@AndrewWatson Feliz de ayudar. ¡Esta fue una pregunta muy divertida! Le preguntaría si podría regresar y arreglar la publicación original. Por ejemplo, en este sitio no ponemos etiquetas "EDITAR" en las preguntas; simplemente editamos la pregunta :) Si pudiera hacer esto e integrar la información útil de los comentarios en la publicación principal, se lo agradeceríamos mucho. Luego podemos pedirle a un mod que elimine la cadena de comentarios (bastante larga).
Creo que he incluido todas las partes importantes. De nuevo, gracias por tu ayuda. Resultó que el error en A2 era un obstáculo demasiado grande para ser superado, y la combinación de los algoritmos a través de su método condujo a una mejora de solo ~0,5 % en la reconstrucción de la posición (o 1/18 000 del radio de este detector en particular). ). ¡Oh bien! Al menos aprendí algo nuevo hoy.

Para mí, usar la distancia para medir datos bidimensionales es dudoso, especialmente si los eventos están cerca de la posición reconstruida (supuesta distancia 0). Diga si los eventos forman un círculo (el círculo es gaussiano perfecto). La distribución ya no será gaussiana ya que el área azul (en el dibujo) será menor que la amarilla:

ingrese la descripción de la imagen aquí


ingrese la descripción de la imagen aquí