Para el problema a continuación, estoy al tanto de las estadísticas involucradas, pero simplemente no puedo entender lo siguiente:
En biología, usamos qPCR para medir la expresión génica o, básicamente, el número de copias de ARNm. Lo hace contando cuántos ciclos de amplificación (2^) necesita para alcanzar un umbral. Entonces, para simplificar todo, supongamos que 1024 copias requerirían 10 ciclos (2 ^ 10). Si hay más copias, se necesitarían menos ciclos para alcanzar el umbral, por lo tanto, 2024 copias tomarían 9 ciclos, 512 copias 11 ciclos, etc. Ahora imagina el siguiente escenario:
Tenemos las siguientes muestras:
Sample 1. 1024 copies of gene A and 4096 copies of gene B
Sample 2. 1024 copies of gene A and 16384 copies of gene B
Ahora queremos comparar la muestra 2 con la 1, con el gen B en relación con el gen A:
En números absolutos sería:
Sample 1. 4096 / 1024 = 4x more B
Sample 2. 16384 / 1024 = 16x more B
The average amount more B = (16 + 4) / 2 = 10x more B
Ahora, con qPCR, las mismas muestras de arriba se verían así:
Sample 1. Gene A 10 cycles, Gene B 8 cycles.
Sample 2. Gene A 10 cycles, Gene B 6 cycles.
Ahora, utilizando los métodos estándar utilizados para los datos de qPCR, primero tomamos la diferencia entre el gen B y el A. Seguido por la media de la diferencia y esto se toma 2^.
Sample 1. 10 - 8 = 2 cycles
Sample 2. 10 - 6 = 4 cycles
The average amount more B = 2^((2 + 4)/2) = 8x more B
Todas las publicaciones / herramientas de software, etc. calcularán un promedio de 8 veces más B. Y soy consciente de que esto se originó a partir de una escala log2, sin embargo, ¿por qué este método estadísticamente correcto difiere en el resultado de los números absolutos?
Actualización Simplifiqué demasiado mi pregunta, por lo tanto, debajo de algunos detalles más de mi "problema".
Condition 1 biorep 1. 1024 copies of ref and 1024 copies of gene X
Condition 1 biorep 2. 1024 copies of ref and 1024 copies of gene X
Condition 2 biorep 1. 1024 copies of ref and 4096 copies of gene X
Condition 2 biorep 2. 1024 copies of ref and 16384 copies of gene X
Entonces, para calcular en números absolutos la cantidad promedio más del gen X en la condición 2 versus 1:
We can forget the reference gene here as cDNA amounts are the same, therefore:
Condition 1 biorep 1 & 2: average (1024 + 1024) / 2 = 1024 copies
Condition 2 biorep 1 & 2: average (4096 + 16384) / 2 = 10240 copies
Condition 2 vs 1: average 10240 / 1024 = 10x more gene X in condition 2 vs 1
Ahora, con los valores de qPCR CT basados en los números anteriores:
Condition 1 biorep 1. Ref_CT 10 and GeneX_CT 10
Condition 1 biorep 2. Ref_CT 10 and GeneX_CT 10
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 8
Condition 2 biorep 1. Ref_CT 10 and GeneX_CT 6
Ahora usando los cálculos oficiales de qPCR:
Condition 1, Ref_CT mean (10 + 10) / 2 = 10
Condition 2, Ref_CT mean (10 + 10) / 2 = 10
Condition 1, GeneX_CT mean (10 + 10) / 2 = 10
Condition 2, GeneX_CT mean (8 + 6) / 2 = 7
Ref_deltaCT (10 - 10) = 0
GeneX_deltaCT (10 - 7) = 3
delta_deltaCT (3 - 0) = 3
Difference Condition 2 vs 1 = (2^3) = 8x
Esto equivale a 8 veces más de Gene X en promedio en la condición 2 en comparación con la condición 1. Aquí ahora está la diferencia de 8x frente a 10x. Además, cualquier programa que use para completar estos valores de CT dará como resultado una relación de 8 en comparación con 10.
¿Es esto quizás porque este método que equivale a 8 solo debe usarse para repeticiones técnicas, y los biorrepetidores deben usar una ecuación diferente que dé como resultado 10?
Muestra 1. 4096 / 1024 = 4x más B
Muestra 2. 16384 / 1024 = 16x más B
La cantidad promedio más B = (16 + 4) / 2 = 10x más B
Esa no es la forma correcta de proceder. Está calculando la expresión promedio de B
en ambas muestras. No significa que haya 10x
más B
. Simplemente hay 4x
más B
en Sample-2
relación con Sample-1
.
Gene-A
no cambia su expresión entre muestras y puede usarse como gen de referencia.
Si calcula por ciclo de umbral, el cambio de pliegue
Vea esta publicación también.
El promedio se calcula entre repeticiones, no entre diferentes condiciones experimentales.
A veces, se calcula el promedio de dos muestras experimentales ; esto generalmente se realiza en un análisis de diagrama MA que se realiza para filtrar los genes que muestran cambios de pliegue muy altos solo debido a su baja expresión general ( 1: 4 frente a 100: 300 ).
Responda a su edición
No debe tomar el promedio (media aritmética) de Ct. No se escalan linealmente con la expresión (y también lo contrario).
Para cualquier función no lineal :
Además, para una función convexa:
dónde es el valor esperado de
es una función convexa con respecto a ( es cualquier número real > 1). Entonces puede aplicar la desigualdad de Jensen a los valores y la expresión de Ct.
pim
pim
WYSIWYG