En la normalización de microarreglos, ¿por qué es este el factor de normalización?

Estoy trabajando en el análisis de una gran cantidad de archivos de microarrays. Estaba tratando de comprender la necesidad de normalización en los datos de micromatrices y estaba leyendo este artículo de John Quackenbush (2002). En el artículo, el autor menciona que

Hay una serie de razones por las que los datos deben normalizarse, incluidas cantidades desiguales de ARN inicial, diferencias en el etiquetado o eficiencias de detección entre los colorantes fluorescentes utilizados y sesgos sistemáticos en los niveles de expresión medidos.

Luego habla de técnicas simples de normalización. Suponiendo que las intensidades de hibridación totales sumadas sobre todos los elementos en las matrices deberían ser las mismas para cada muestra, define un factor de normalización que se calcula sumando las intensidades medidas en ambos canales:

factor de normalización

donde G i y R i son las intensidades medidas para el 'i'ésimo elemento de matriz (por ejemplo, las intensidades verde y roja (o experimental y de control) en un ensayo de microarray de dos colores) y N array es el número total de elementos representada en el microarreglo.

Entonces el autor dice esto :

explicación del factor de normalización

Esta es la parte que no entiendo. ¿Cuál es la necesidad de presentar GRAMO k , R k y ¿por qué son lo que son? Lo más importante, ¿por qué es T i igual a R i / GRAMO i primero y luego ( 1 / norte t o t a yo )*( R i / GRAMO i )?

¿Algunas ideas?

Respuestas (1)

GRAMO k y R k son valores normalizados de GRAMO k y R k .

Tome decir G como [ 1 , 2 , 3 , 4 ] y R como [ 100 , 150 , 200 , 400 ] como sus valores y desea normalizarlos. Esto es escalar uno de ellos sobre el otro y llevarlos al mismo nivel para comparar. Así que en tu caso el factor es 85 unidades. Entonces una unidad de R equivale a 85 unidades en g

Entonces, para escalar G a R, multiplique G por 85 o puede escalar R al nivel de G dividiendo R por 85 . Entonces los valores son [ 85 , 170 , . . ] y [ 100 , 150 , 200 , 400 ] o [ 1 , 2 , 3 , 4 ] y [ 1.17 , 1.76 , . . ] de nuestro ejemplo.

Creo que debería mencionarse como T = R i / ( GRAMO i norte t o t a yo ) como en relación logarítmica de la declaración en su pregunta.

¿Su línea final significa que en el texto, debería ser T i = R i / GRAMO i = R i / GRAMO i * norte t o t a yo
Quiero decir T i = R i / GRAMO i pero T i = R i / ( GRAMO i norte t o t a yo )