No pude encontrar ninguna publicación de LIGO que explique cómo debemos interpretar este valor. Lo más cercano que he encontrado es la siguiente cita:
Esto significa que un evento de ruido que imite a GW150914 sería extremadamente raro; de hecho, ¡esperamos que un evento tan fuerte como GW150914 aparezca por casualidad solo una vez en aproximadamente 200,000 años de tales datos! Esta tasa de falsas alarmas se puede traducir en un número de "sigma" (denotado por s), que se usa comúnmente en el análisis estadístico para medir la importancia de un reclamo de detección. Esta búsqueda identifica a GW150914 como un evento real, con un significado de más de 5 sigma.
http://www.ligo.org/science/Publication-GW150914/index.php
De mi lectura, parece que la importancia se refiere a:
La probabilidad de observar tal señal dado que el modelo de ruido de fondo describe correctamente todas las entradas a los detectores en el momento de la señal .
Me gustaría verificar que la interpretación anterior es correcta y es diferente de la probabilidad GW150914:
Pregunto porque he visto publicaciones en este sitio y en otros lugares (tanto noticias como blogs) que parecen implicar algo diferente. Me preocupa que pueda estar malinterpretando alguna terminología específica de la astrofísica.
Además, ¿alguien sabe qué cálculos se usaron para convertir la tasa de falsas alarmas en # de sigmas? Este detalle parece haber quedado fuera de los documentos, así que asumo que es algo trivial que me estoy perdiendo debido a la falta de experiencia en esta área.
Editar:
Permítanme aclarar (lo que he aprendido es incorrecto) la interpretación #1 anterior. Esta es la regla de Bayes:
dónde,
Solo para ser 100% claro:
El último término se puede reescribir como:
En las respuestas establecimos la -level es una transformación simple del valor p, que es igual a . Está claro que debe tener un valor numérico diferente al valor p, excepto en algunas circunstancias muy específicas, es decir, cuando . El valor p se calcula bajo el supuesto de que es cierto, y de las ecuaciones 1/2/3 vemos que depende explícitamente de ambos y la probabilidad de observar tal señal si Es falso: .
Si nuestra hipótesis es cierta, creo que todos estamos de acuerdo en que la única forma de obtener una señal como GW150914 es una coincidencia fortuita de patrones de ruido entre los dos detectores LIGO. Entonces, cuando escribimos, a menudo usamos taquigrafías como:
Hay muchas formas abreviadas de decir lo mismo que confunden las cosas. El punto es que el valor p no es la probabilidad de que GW150914 haya sido causado por (surgió de; se debe a) la casualidad (ruido de fondo; coincidencia aleatoria). Tampoco es la probabilidad de que GW150914 "no sea real", o "cuán improbable" es que GW150914 se deba al azar.
En este caso, el valor p es aparentemente . Además, aparentemente la única otra explicación plausible es una fusión BH-BH. En una pregunta anterior , estimamos la probabilidad previa de que esto sea . Si suponemos que esa es la única otra explicación posible, esa debe ser la probabilidad de que H sea falsa independientemente de observar GW150914: .
Primero, usemos el límite inferior: . De la ecuación 3, entonces . Además, GW150914 aparentemente coincidió exactamente con la predicción. Por lo tanto, la probabilidad de ver tal señal dado que H es falsa es . Introduciendo estos valores obtenemos:
Haciendo lo mismo para el límite superior obtengo . Ahora podemos decir que "la probabilidad de que GW150914 haya ocurrido debido al azar varía de , que es bastante diferente del valor p. ¿Algún error en este razonamiento?
Veo a dónde vas con tu pregunta. Déjame alimentar las llamas.
El valor sigma que se cita es equivalente a una probabilidad de falsa alarma. Le dice cuán improbable es que su experimento, dada su comprensión (teórica y empírica) de las características del ruido, haya producido una señal que pareciera GW de un BH fusionado.
Personalmente, prefiero la afirmación del texto que cita. Tal evento se habría visto (en ambos detectores) aproximadamente una vez cada 200.000 años. Dado que las observaciones fueron durante 16 días, eso significa que se esperaría que hubiera tales eventos en los datos. es decir, una posibilidad entre 4,6 millones.
El equipo de LIGO acaba de convertir este número en números de importancia sigma utilizando una integral bajo una cola de la distribución normal. Usando una de las calculadoras fácilmente disponibles, por ejemplo , http://www.danielsoper.com/statcalc3/calc.aspx?id=20 , vemos que 5.0-5.1 (conocido como z-scores) corresponde a los valores p de a , poniendo entre paréntesis el valor encontrado arriba.
Sin embargo, este no es el nivel de confianza de que se trata de una onda gravitacional o de un agujero negro que se fusiona. Siempre existe la posibilidad de que se haya infiltrado alguna fuente de error imprevista que imite una señal GW (pero tenga en cuenta que debe afectar a ambos detectores) o que alguna otra fuente astrofísica podría ser capaz de producir la señal. Que yo sepa, aparte de las teorías de conspiración habituales (bostezo), nadie ha presentado una alternativa plausible a los GW de un BH fusionado.
Nsigma=qnorm(exp(-r*t))
, donde r="tasa de falsas alarmas" y t="tiempo transcurrido". En este caso obtengo Nsigma=5.05.En todas las pruebas de hipótesis frecuentistas, uno encuentra una llamada -valor: la probabilidad de obtener tales observaciones "extremas" (es decir, una prueba estadística tan extrema) si la hipótesis nula fuera verdadera.
La hipótesis nula se rechaza si y si. -el valor es menor que un valor crítico preespecificado o un nivel de confianza. De lo contrario, el valor nulo no se acepta ni se confirma, simplemente no se rechaza.
En este caso, la hipótesis nula es que
el modelo de ruido de fondo describe correctamente todas las entradas a los detectores
y fue rechazado con confianza alta.
El -los valores se convierten convencionalmente en significados gaussianos de una cola, es decir, un número de desviaciones estándar tales que una probabilidad idéntica está en la cola de la distribución gaussiana,
En tu comentario aludes al teorema de Bayes ya un cálculo de la probabilidad o plausibilidad de la hipótesis nula. La prueba de hipótesis LIGO es, sin embargo, estrictamente frecuentista. Solo se considera la probabilidad de datos y pseudodatos. Dado que los datos parecen ser tan sólidos en este caso, no debería haber diferencias cualitativas en las conclusiones de los métodos frecuentistas o bayesianos.
Tienes razón, por supuesto, en que
Puede encontrar interesante arXiv:1609.01668 , ya que analiza las diferencias entre los análisis bayesianos y frecuentistas de las señales LIGO. Sorprendentemente, incluso los pequeños significados podrían corresponder a colosales factores de Bayes. El evento tuvo un factor de Bayes de , que es el número más grande que he visto en este contexto.
Since the data is so strong in this case, there shouldn't be any qualitative differences in the conclusions of Bayesian or frequentist methods.
Ver mi pregunta anterior . Parece que la explicación preferida también era algo improbable, por lo que el valor p exagera la evidencia frente a la explicación de fondo.Es un valor p, escrito en términos de una puntuación z.
Cualquier cálculo de una probabilidad se basa en un modelo, a veces incluso está consagrado en el nombre de hipótesis nula. Para el primer avistamiento directo de una onda gravitacional, la hipótesis nula podría ser que las ondas gravitatorias no existen, pero sus detectores pueden reaccionar al ruido.
Ahora, el cálculo no es tan simple como la posibilidad de obtener un conjunto de datos en particular. En realidad, ordena los datos en aquellos que se parecen a los datos de onda predichos y aquellos que no. Y luego, dentro de los que se parecen a los datos de olas pronosticados, los ordena según su intensidad.
Y luego averiguas la posibilidad de que reaccione así de fuerte como una señal... o más fuerte (y esa o la parte más fuerte es de lo que tratan estos dos últimos párrafos). Y ese es su valor p. Realmente se trata de cometer un error al decir que vio una señal cuando en realidad esos datos a veces ocurren por casualidad... dada la hipótesis nula.
Finalmente, toma la probabilidad calculada desde arriba y encuentra el límite de puntuación z que tiene esa probabilidad como su cola. Y luego informa ese puntaje z en "unidades" de
El punto es que tal estándar puede disminuir la frecuencia con la que nos anunciamos descubrimientos que en realidad eran solo ruido. Y los físicos tienen un estándar bastante alto (en comparación con los valores p de 0,05 o 0,01).
¿Alguien puede dar el cálculo exacto de la tasa de falsas alarmas? años a ?
Intuitivamente estás mirando la teoría para identificar cosas llamadas señales. Y luego mirar los detectores para averiguar con qué frecuencia los detectores producen resultados que se parecen a esas señales solo por el ruido. Por lo tanto, implica saber cómo se ven las señales y cómo reaccionan los detectores al ruido. Ambas son cosas que debe saber si está diseñando un detector. Ninguno de los dos va a ser un cálculo simple. La teoría requirió muchos cálculos muy largos y tediosos, horas de tiempo de computadora. El ruido también es difícil de calcular ya que pusieron muchas cosas para reducir el ruido. Literalmente ajustaron cómo funcionan los brazos para ajustar el ruido para tener menos ruido en algunas áreas que la energía de punto cero que produce naturalmente.
Pero tienes el conjunto de señales y el modelo de cómo reacciona el detector al ruido. La velocidad (en el tiempo) a la que el detector generó (a partir del ruido) resultados que se parecen a las señales dependerá de la longitud de las diferentes señales. Una señal que es corta tiene muchas veces que podría aparecer en un período de tiempo de 200.000 años. Una señal más larga tiene menos veces.
No es un cálculo simple cuando tienes muchas señales diferentes, de diferentes longitudes y diferentes formas. No puedes simplemente buscarlo en una tabla. Puede buscar el valor p en la puntuación z en una tabla. Pero la conversión a una tasa en el tiempo dependerá de la frecuencia con la que la máquina se ponga en modo de recopilación de datos y el tiempo que tarden en recopilarse las posibles señales cuando la máquina está encendida.
Está diseñado para no tener demasiados informes sobre cosas que son solo ruido.
timeo
1. arose due to chance
?Lívido
Lívido
innisfree
Lívido
the probability GW150914: p(GW150914 arose due to chance|data)
, es decir, la probabilidad de una probabilidad. Además, gracias ambas respuestas abordan mi primera preocupación. ¿Alguien puede dar el cálculo exacto de la tasa de falsas alarmas?innisfree
ProfRob
ProfRob
Lívido
Lívido