(Pregunta actualizada) Problema con la media de cambio de veces en comparación con los datos absolutos (en qPCR)

Question

(Pregunta actualizada) Problema con la media de cambio de veces en comparación con los datos absolutos (en qPCR)

PCR
Biología
Estadísticas
genética-cuantitativa

pim

Para el problema a continuación, estoy al tanto de las estadísticas involucradas, pero simplemente no puedo entender lo siguiente:

En biología, usamos qPCR para medir la expresión génica o, básicamente, el número de copias de ARNm. Lo hace contando cuántos ciclos de amplificación (2^) necesita para alcanzar un umbral. Entonces, para simplificar todo, supongamos que 1024 copias requerirían 10 ciclos (2 ^ 10). Si hay más copias, se necesitarían menos ciclos para alcanzar el umbral, por lo tanto, 2024 copias tomarían 9 ciclos, 512 copias 11 ciclos, etc. Ahora imagina el siguiente escenario:

Tenemos las siguientes muestras:

Sample 1. 1024 copies of gene A and 4096 copies of gene B
Sample 2. 1024 copies of gene A and 16384 copies of gene B

Ahora queremos comparar la muestra 2 con la 1, con el gen B en relación con el gen A:

En números absolutos sería:

Sample 1. 4096 / 1024 = 4x more B
Sample 2. 16384 / 1024 = 16x more B
The average amount more B = (16 + 4) / 2 = 10x more B

Ahora, con qPCR, las mismas muestras de arriba se verían así:

Sample 1. Gene A 10 cycles, Gene B 8 cycles.
Sample 2. Gene A 10 cycles, Gene B 6 cycles.

Ahora, utilizando los métodos estándar utilizados para los datos de qPCR, primero tomamos la diferencia entre el gen B y el A. Seguido por la media de la diferencia y esto se toma 2^.

Sample 1. 10 - 8 = 2 cycles
Sample 2. 10 - 6 = 4 cycles
The average amount more B = 2^((2 + 4)/2) = 8x more B

Todas las publicaciones / herramientas de software, etc. calcularán un promedio de 8 veces más B. Y soy consciente de que esto se originó a partir de una escala log2, sin embargo, ¿por qué este método estadísticamente correcto difiere en el resultado de los números absolutos?

Actualización Simplifiqué demasiado mi pregunta, por lo tanto, debajo de algunos detalles más de mi "problema".

Condition 1 biorep 1. 1024 copies of ref and 1024 copies of gene X
Condition 1 biorep 2. 1024 copies of ref and 1024 copies of gene X
Condition 2 biorep 1. 1024 copies of ref and 4096 copies of gene X
Condition 2 biorep 2. 1024 copies of ref and 16384 copies of gene X

Entonces, para calcular en números absolutos la cantidad promedio más del gen X en la condición 2 versus 1:

We can forget the reference gene here as cDNA amounts are the same, therefore: 
Condition 1 biorep 1 & 2: average (1024 + 1024) / 2 = 1024 copies
Condition 2 biorep 1 & 2: average (4096 + 16384) / 2 = 10240 copies
Condition 2 vs 1: average 10240 / 1024 = 10x more gene X in condition 2 vs 1

Ahora, con los valores de qPCR CT basados en los números anteriores:

Condition 1 biorep 1. Ref_CT 10 and GeneX_CT 10
Condition 1 biorep 2. Ref_CT 10 and GeneX_CT 10
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 8
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 6

Ahora usando los cálculos oficiales de qPCR:

Condition 1, Ref_CT mean (10 + 10) / 2 = 10
Condition 2, Ref_CT mean (10 + 10) / 2 = 10
Condition 1, GeneX_CT mean (10 + 10) / 2 = 10
Condition 2, GeneX_CT mean (8 + 6) / 2 = 7

Ref_deltaCT (10 - 10) = 0
GeneX_deltaCT (10 - 7) = 3

delta_deltaCT (3 - 0) = 3
Difference Condition 2 vs 1 = (2^3) = 8x

Esto equivale a 8 veces más de Gene X en promedio en la condición 2 en comparación con la condición 1. Aquí ahora está la diferencia de 8x frente a 10x. Además, cualquier programa que use para completar estos valores de CT dará como resultado una relación de 8 en comparación con 10.

¿Es esto quizás porque este método que equivale a 8 solo debe usarse para repeticiones técnicas, y los biorrepetidores deben usar una ecuación diferente que dé como resultado 10?

Respuestas (1)

(Pregunta actualizada) Problema con la media de cambio de veces en comparación con los datos absolutos (en qPCR)

WYSIWYG · Answer 1

Muestra 1. 4096 / 1024 = 4x más B

Muestra 2. 16384 / 1024 = 16x más B

La cantidad promedio más B = (16 + 4) / 2 = 10x más B

Esa no es la forma correcta de proceder. Está calculando la expresión promedio de Ben ambas muestras. No significa que haya 10xmás B. Simplemente hay 4xmás Ben Sample-2relación con Sample-1.

Gene-Ano cambia su expresión entre muestras y puede usarse como gen de referencia.

Si calcula por ciclo de umbral, el cambio de pliegue $= 2^{8-6} = 4x$

Vea esta publicación también.

El promedio se calcula entre repeticiones, no entre diferentes condiciones experimentales.

A veces, se calcula el promedio de dos muestras experimentales ; esto generalmente se realiza en un análisis de diagrama MA que se realiza para filtrar los genes que muestran cambios de pliegue muy altos solo debido a su baja expresión general ( 1: 4 frente a 100: 300 ).

Responda a su edición

No debe tomar el promedio (media aritmética) de Ct. No se escalan linealmente con la expresión (y también lo contrario).

Para cualquier función no lineal $f(x)$ :

F (X + y) \neq F (X) + F (y)

$f(x+y) \ne f(x)+f(y)$

F (\frac{X + y}{2}) \neq \frac{F (X) + F (y)}{2}

$f\left(\frac{x+y}{2}\right) \ne \frac{f(x)+f(y)}{2}$

Además, para una función convexa:

F (mi [X]) \leq mi [F (X)]

$f(E[x]) \le E[f(x)]$

j mi norte s mi {norte}^{'} s i norte mi q tu a yo i t y

$Jensen's\ inequality$

dónde $E[x]$ es el valor esperado de $x$

$a^x$ es una función convexa con respecto a $x$ ( $a$ es cualquier número real > 1). Entonces puede aplicar la desigualdad de Jensen a los valores y la expresión de Ct.

Estoy totalmente de acuerdo con su respuesta, creo que simplifiqué demasiado mi pregunta, arriba edité mi publicación original para aclarar un poco más mi pregunta.
La respuesta que das en tu edición también es la respuesta que esperaba. Sin embargo, todas las herramientas (comerciales) asumen que los valores de Ct están en una escala lineal y, por lo tanto, se toma la media aritmética de Ct, lo que da como resultado 8x. Y como tomas 2^ de Ct, los valores absolutos no lo son. Esto significa que tendrías que tomar la media geométrica de 4096 y 16384, que es 8192 (que es 8x 1024). Aparentemente, todos los métodos publicados consideran que los valores absolutos no están en una escala lineal y, de hecho, los valores de Ct sí lo están. Lo cual biológicamente hablando es difícil de entender.
Si alguien está interesado en el Ct promedio, es muy posible que lo haga. Pero no estamos interesados en que somos nosotros. Independientemente los valores no están en ninguna escala. Se escalan con otro valor según alguna función. Entonces, la expresión escala exponencialmente con Ct. Entonces $Expression = f(Ct)$ . Debo aclarar al respecto. editado

(Pregunta actualizada) Problema con la media de cambio de veces en comparación con los datos absolutos (en qPCR)

pim

Respuestas (1)

WYSIWYG

pim

pim

WYSIWYG

Representación correcta/completa de las estadísticas RTPCR

¿Por qué estimar coeficientes de selección lineales y completos (lineales, cuadráticos y correlacionales) por separado?

Cómo calcular el índice de Jaccard [cerrado]

¿Están todos los fenotipos normalmente distribuidos?

¿Cuál es el propósito de los adaptadores en forma de Y en la secuenciación de Illumina?

¿Encontrar la longitud de la secuencia de ADN? [cerrado]

Distinguir padre de hermano

¿Cuál sería el método más corto y óptimo para extraer células humanas para PCR? ¿Existe un protocolo similar a la PCR de colonias para células humanas?

¿Cómo se miden las tasas de error de la ADN polimerasa?

Agrupación para qPCR