¿Qué significa "bin" en un contexto de espectroscopia?

En el siguiente artículo en línea

http://www.star.le.ac.uk/~sav2/stats/a.html

Veo que se usa la palabra "contenedor", en relación con la espectroscopia de rayos X, tanto como verbo como sustantivo (la gente "contiene" cosas y habla de cada "contenedor"). También he oído hablar de él en otros lugares. Parece haber una muy buena explicación de por qué lo haríamos "bin", pero el artículo no parece decir qué significa realmente este proceso. Al buscar el término, veo todo tipo de definiciones, pero la mayoría tiene que ver con fotometría.

En lugar de citar las áreas del artículo que no entiendo, simplemente pregunto que, dado el contexto de la espectroscopia, ¿qué significa "bin"?

Esto trae a la mente una imagen visual de partes en contenedores. Uno es tomar valores de señal continuos (analógicos) y fusionarlos en categorías discretas, una por contenedor. ecx.images-amazon.com/images/I/61hKnNidNkL._SY300_.jpg

Respuestas (3)

Suponga que está analizando los pesos de las personas en el Reino Unido para ver cómo es la distribución de pesos. Suponga también que puede medir el peso con una precisión arbitraria, de modo que los pesos de dos personas no sean exactamente iguales. Cuando termina, traza sus datos en un histograma, pero el problema es que debido a que todos tienen un peso diferente, obtiene un histograma que se parece a (los datos son completamente ficticios):

Sin agrupamiento

Y esto no le sirve a nadie. Puede ver que hay cierta agrupación en torno al peso promedio, pero es imposible obtener ningún detalle del gráfico.

Ahora suponga que elige grupos de pesos, por ejemplo, 50-55 kg, 55-60 kg, 60-65 kg, etc., y ahora cuenta el número de personas cuyos pesos caen en cada grupo. Esta vez su histograma se verá así:

con agrupamiento

y puedes ver emerger la buena forma de campana antigua. Para que pueda ver el promedio y el ancho de la distribución. Los grupos se denominan bins y el proceso de asignación de cada punto de datos a un bin se denomina agrupación .

Usted elige el tamaño del contenedor que mejor se adapte a sus datos. Si hace que los contenedores sean pequeños, obtendrá muchos puntos en su histograma, pero tendrá mucho ruido estadístico. Haga que los contenedores sean demasiado grandes y obtendrá una excelente relación señal/ruido, pero muy pocos puntos en su histograma para que sean útiles.

He usado pesos porque ese es un ejemplo particularmente simple, pero exactamente lo mismo se aplica a la medición de espectros. Cada contenedor sería un rango de longitudes de onda y mediría la intensidad integrada para el rango. Usted elige el tamaño del contenedor para hacer que la relación señal/ruido sea lo mejor posible mientras mantiene la resolución espectral dentro de los límites aceptables.

Ten un dólar unicornio...
El término 'contenedor' significa 'un lugar para tirar cosas', lo que podría ayudar a las personas que no hablan inglés como primera lengua. maidstone.gov.uk/__data/assets/image/0014/5153/… Imagine una pared de contenedores y arroja sus puntos de datos en el contenedor más cercano a donde realmente está, solo para organizarlo un poco. Aparte, los gráficos acumulativos muestran información similar (de una manera diferente) sin necesidad de agrupar (la inclinación de cdf corresponde a la altura del histograma)

"Bin" como verbo significa dividir/discretizar datos en un grupo de rangos (frecuentemente de igual ancho), para facilitar varios tipos de análisis y visualización. Ver: https://en.wikipedia.org/wiki/Data_binning

En particular, el agrupamiento es la base de los gráficos de histograma, entre otras cosas. ( https://en.wikipedia.org/wiki/Histogram )

Como sustantivo, un "bin" se refiere a uno de los rangos utilizados para subdividir los datos.

Como un ejemplo simple y concreto, si tiene datos sobre el ingreso promedio en cada edad entera de 21 a 65 años, y combinó rangos de 5 años para producir un ingreso promedio a las edades de 21 a 25, 26 a 30, 31 a 35, etc. eso sería agrupar (verbo) los datos. 21-25 sería un contenedor (sustantivo), 26-30 sería el segundo contenedor, etc.

En su forma más simple, la agrupación de datos de algo como una cámara CCD (como se puede usar para espectroscopia) significa agregar varios píxeles.

En un detector de matriz 2d (como una cámara de todos los días), podría, por ejemplo, usar una agrupación de 2x2 para sumar 4 píxeles en un valor de salida. Cada píxel contribuye exactamente una vez a los datos de salida, es decir, aparece exactamente en un contenedor. Esto reduce a la mitad su resolución (en ambos ejes), entonces, ¿por qué lo haría? Para reducir el ruido y aumentar la señal. Sin entrar en demasiados detalles, la suma de ruido aleatorio de varios píxeles provoca un aumento en el ruido proporcional a la raíz cuadrada del número de píxeles, mientras que la señal (si se distribuye uniformemente entre los píxeles) aumenta con el número de píxeles.

Ahora, en un sistema espectroscópico, puede tener 2 ejes: uno espectral y posiblemente uno espacial. Por lo general, toda la información espacial se descarta al agrupar todos los píxeles en esa dimensión. Esto se muestra en la Figura 1 a continuación (para un tipo diferente de espectroscopia, pero es lo que tenía). La dimensión vertical aquí contiene datos espaciales (extraños), mientras que la luz se dispersa en la horizontal ( X ) dirección para formar un espectro

Imagen CCD a espectro

Figura 1: Una imagen leída de un CCD (arriba) se resume en y para generar un espectro. agrupamiento en el X La dimensión se puede utilizar para mejorar la relación señal-ruido a expensas de la resolución. El espectro aquí es real, mientras que la imagen CCD es un boceto que ilustra la apariencia de la señal y el ruido.

Así que ahora podemos concentrarnos en el binning espectral. Aquí sumamos los valores de los píxeles adyacentes, reduciendo la resolución espectral y el ruido. En la figura eso significa sumar valores adyacentes en el X dirección de la lectura CCD sin procesar. No es necesario hacer esto en el espectro que he mostrado, se pueden obtener buenos ajustes de curva tanto de la 520   C metro 1 y 568   C metro 1 picos (tenga en cuenta la × 10 4 en el y eje).

Finalmente, relacionar esto con las estadísticas máximas. Lo que tiende a interesarte es la posición del pico y la altura o el área integrada. Por lo general, se toman ajustando una función de pico de una forma adecuada al pico, comúnmente una gaussiana. Si va a ajustar una Gaussiana al máximo, necesita medir la diferencia entre un ajuste candidato y los datos reales para evaluar la calidad del ajuste candidato. En el documento que vinculó, esa diferencia se mide usando x 2 . La rutina de ajuste puede entonces ajustar los parámetros de la función pico y tratar de minimizar el x 2 . Como explica el documento vinculado, al ajustar un gaussiano usando x 2 minimización, debe tratar con datos distribuidos en Gauss. Si se trata de fotones individuales, la distribución de intensidad no será gaussiana y la calidad del ajuste se verá afectada. Según el documento que vinculó, para cuando los contenedores contengan alrededor de 20 recuentos (fotones), puede tratar la distribución del recuento de fotones como gaussiana. Reportando el mínimo x 2 El valor encontrado da una indicación de la calidad del ajuste.