¿Cuáles son las diferencias entre los dos métodos posibles para calcular la ecuación de Hardy-Weinberg?

Estoy más que asombrado por los cálculos de los equilibrios de Hardy-Weinberg. La teoría de la fórmula asume una distribución binomial de frecuencias alélicas en una población y, por lo tanto, permite la comparación de las frecuencias fenotípicas observadas con una distribución modelo ideal.

pag 2 + 2 pag q + q 2 = 1

con

pag 2 = Frecuencia de fenotipo homocigoto PP

2 pag q = Frecuencia de fenotipo heterocigoto PQ

q 2 = Frecuencia de fenotipo homocigoto QQ

Hay dos métodos diferentes de trabajar con la ecuación HW que he encontrado, y no parecen ser compatibles; utilizados en los mismos conjuntos de datos, producen resultados muy diferentes. Siento que no estoy viendo el bosque por los árboles, para ser honesto.

¿Alguno de estos métodos (técnicamente) es incorrecto? ¿Cómo decido cuál usar para cada conjunto de datos (es decir, es válido usar el método n.º 1 en conjuntos de datos de 3 alelos)? ¿O simplemente uso el método que sea más fácil? ¿No conduce esto a discrepancias en los resultados? Esto parece una gran cosa, especialmente cuando se comparan datos de observación del mundo real con distribuciones supuestas de HW.

Conjunto de datos de ejemplo (EST/California) y resultados de los cálculos de HW. Estoy usando el fenotipo observado en lugar del genotipo observado de los datos originales.

Phenotype     n  |   HW1   HW2p   HW2q
PP           37  |  33.9   37.1   28.8
PQ           20  |  25.0   23.0   28.2
QQ            7  |   4.5    3.8    7.0

Método de cálculo #1

Como lo sugiere la fuente del conjunto de datos vinculado anteriormente y la Introducción a la ecología molecular de Beebee/Rowe , los alelos simplemente se suman para obtener valores para p y q respectivamente:

Phenotype    n  |   P    Q
PP          37  |  74    0   (37 * PP = 74 P)
PQ          20  |  20   20   (20 * PQ = 20 P + 20 Q)
QQ          7   |   0   14   ( 7 * QQ = 14 Q)
Sums        64  |  94   34

De esto podemos inferir directamente p/q: pag = 94 / ( 94 + 34 ) = 0.73 y q = 34 / ( 94 + 34 ) = 0.27 ; con la condición pag + q = 1 permaneciendo cierto.

El uso de estos valores para p y q en la ecuación HW produce:

pag 2 + 2 pag q + q 2 = 1 ( 0.73 ) 2 + 2 ( 0.73 ) ( 0.27 ) + ( 0.27 ) 2 = 1
Y una distribución de fenotipos en toda la población de

Phenotype      n
PP         33.92    p^2 * 64
PQ         24.96    2pq * 64
QQ          4.48    q^2 * 64

Método de cálculo #2

El segundo método de utilizar la ecuación HW es mucho más directo, y casi todos los libros de texto que pude encontrar usan este método para resolver problemas de más de 3 alelos (como, por ejemplo, tipos de sangre); Wikipedia elogia su utilidad para calcular las frecuencias de heterocigotos de enfermedades genéticas en grandes poblaciones.
En este cálculo, las frecuencias se infieren directamente según la definición de la ecuación HW. Esto significa pag 2 es igual a la frecuencia del fenotipo PP (ver arriba).

pag 2 = 37 64 pag = 0 .578 pag 0.76
q = 1 pag = 0.24
Conduciendo a una distribución HW de
( 0.76 ) 2 + 2 ( 0.76 ) ( 0.24 ) + ( 0.24 ) 2 = 1

Con una nueva distribución fenotípica ideal:

Phenotype      n
PP          37.1    p^2 * 64
PQ          23.0    2pq * 64
QQ           3.8    q^2 * 64

Invirtiendo el cálculo comenzando con q 2 = 7 / 64 conduce a resultados aún más divergentes:

Phenotype      n
PP          28.8    p^2 * 64
PQ          28.2    2pq * 64
QQ           7.0    q^2 * 64

Usando ambos pag 2 y q 2 viola inevitablemente la condición ( pag + q ) 2 = 1 .

Bienvenido a SE Biology, que es un sitio de preguntas y respuestas sobre biología. Obviamente has puesto mucho esfuerzo en esto, pero en este momento no veo ninguna pregunta. Es cierto que este no es mi campo, pero si no hay una pregunta planteada en el título, el comienzo o el final de su publicación, es difícil saber lo que desea saber. ¿Está preguntando cuál de los dos tipos de cálculo es correcto? Si es así, edite su publicación para que quede claro desde el principio, de lo contrario, corre el riesgo de ser declarado "fuera de tema" sobre la base de "no está claro lo que está preguntando".
Hola David, pensé que su publicación era clara. Tal vez el título deba "rogarse", pero las preguntas están al final de la publicación principal antes de los apéndices computacionales: "¿Alguno de estos métodos es incorrecto? ¿Tengo que decidir cuál usar para cada conjunto de datos? ¿Puedo incluso usar el método #1 en conjuntos de datos de 3 alelos?"
¡Hola David, hola vipatrón! Tienes razón en que mis preguntas no están tan claramente definidas como pensé que estarían. Me gustaría saber de dónde provienen las diferencias entre esas dos (tres) ecuaciones, y si alguna es más válida/precisa que el otro modelo
G'Ra. Utilice el @ para saber que ha respondido a mi comentario. Solo el cartel recibe una notificación automática. Necesitas editar tu pregunta. Una respuesta de comentario es insuficiente. @vipatron: una pregunta necesita una oración con un signo de interrogación.
Y luego está la conducción genética que destruye todos tus cálculos :-/

Respuestas (2)

Bien, el equilibrio de Hardy-Weinberg es solo eso: un equilibrio .

  • En física, un sistema (algún objeto) está en equilibrio cuando ninguna energía neta cruza su límite con los alrededores.
    • ningún cambio de energía significa que no hay cambio en el movimiento (el estado del objeto) debido a la influencia externa en el sistema.
  • En química, un sistema (el vaso de precipitados/recipiente de reacción/citosol) está en equilibrio cuando no se produce ningún cambio en la concentración de las especies químicas en su interior a lo largo del tiempo.
    • ningún cambio de composición química significa que el estado (molecular) de los átomos en el sistema está libre de la influencia energética del mundo exterior.
  • En el Equilibrio HW, un sistema (el acervo genético) está en reposo cuando no ocurre ningún cambio en la frecuencia (concentración) de sus alelos con el tiempo.
    • ningún cambio en la frecuencia de los alelos significa que no hay influencia externa en el estado del acervo genético.

Al igual que en la física básica, tenemos que definir nuestro sistema. Si nuestro sistema es el acervo genético, entonces incluso los comportamientos de los organismos en cuyas células se encuentran esos alelos están fuera del sistema . El sistema es solo los alelos, también conocido como acervo genético.

La parte más importante sobre la comprensión del Equilibrio HW es que solo se aplica cuando se mantienen esas condiciones del acervo genético libre de influencias externas. De hecho, en el enlace que diste, la introducción lo tiene en la segunda oración (no te sientas mal, también me lo perdí las primeras veces, demasiado concentrado en aplicar el álgebra para entender lo que realmente decía):

El modelo tiene cinco supuestos básicos:

1) la población es grande (es decir, no hay deriva genética)

2) no hay flujo de genes entre poblaciones, por migración o transferencia de gametos

3) las mutaciones son insignificantes

4) los individuos se aparean al azar

5) la selección natural no está operando sobre la población.

Desglosémoslos/agrupémoslos:

  • 2: Obvio en términos de equilibrio == el sistema está aislado del entorno
  • 4 y 5: La presión de selección (4: selección sexual o 5: selección natural) no está presionando al sistema.
  • 1 y 3: los efectos aleatorios no presionan al sistema (1 = error de muestreo estadístico que puede empujar a poblaciones pequeñas y 3 = mutación que empuja al sistema como si se agregara una nueva especie química a un sistema en reposo).


Con esa base sólida en la teoría, pasemos a sus preguntas sobre el álgebra. Recuerde, el equilibrio solo se aplica cuando el acervo genético no se ve afectado por factores externos. Lo que significa que las copias físicas de los alelos (gametos) deben emparejarse aleatoriamente con los posibles gametos en cada apareamiento. Si esas suposiciones no fueran ciertas, entonces las matemáticas del equilibrio no se mantendrían. Si ejecuta los números en un sistema en equilibrio, salvo pequeñas cantidades de error de muestreo (reducible con una n más grande), las predicciones del modelo HW serán precisas. Todos los métodos arrojarán resultados similares.

Sin embargo, si los valores pronosticados no coinciden con los reales con un método, puede suponer que otros métodos también generarán predicciones inexactas y que las predicciones de los dos métodos de cálculo diferentes variarán ampliamente entre sí, en gran parte debido a las suposiciones que usted hizo. están haciendo (Método 2: 1 = p+q), o no están haciendo (Método 2).

¡Hola vipatrón! Gracias por tus aclaraciones. Soy consciente de las limitaciones del modelo HW, pero debo ser honesto conmigo mismo al admitir que nunca les había dado tanta importancia. Pero si entiendo bien esto, ambos modos deberían, en una población HW ideal, producir los mismos resultados, pero inevitablemente conducirán a distribuciones sesgadas siempre que se observen poblaciones "reales" (es decir, "no ideales"). ? Teniendo en cuenta que medir las desviaciones reales del ideal del modelo HW es lo más que he visto que se utiliza HW, ¿tener dos opciones no conduce a dos resultados significativamente diferentes?
No soy un biólogo puro. Entonces, no creo que pueda responder a su pregunta excepto con una suposición respaldada por la experiencia. Supongamos que está probando una hipótesis: necesita hacer una estimación de los valores de p y q, y luego poder cuantificar el grado de desviación. Usando el "método exacto" de recuento de frecuencia alélica, puede obtener una única estimación de la frecuencia alélica y luego crear una hipótesis nula sobre cómo se vería el acervo genético si estuviera en equilibrio. Pero preferiría ver el trabajo real de alguien y explicar por qué lo hizo en lugar de hablarle al viento.
Ah, y estás entendiendo mi respuesta.
@vipatron Bajo los supuestos enumerados, el equilibrio HW se alcanza en una sola generación. El término "equilibrio" es, por lo tanto, un poco divertido y no hay mucha dinámica en el tiempo que conduzca al equilibrio. La expresión regla HW también es común y evita el término "equilibrio".

Estás metiendo números en una ecuación sin entenderla.

Si conoce los números de pp, pq y qq, no usa HWE para volver a calcularlos . Entonces, su última declaración en el Cálculo 1 no tiene sentido. Lo que ha hecho allí es calcular las proporciones para una población en HWE donde p = 0.73, pero ya se le dio la distribución real en la población, por lo que pretender que su cálculo teórico triunfa sobre los datos proporcionados es una tontería.

El cálculo 2 solo funciona perfectamente si su población está exactamente en HWE. El tuyo está un poco apagado, es por eso que no te dará las mismas p y q que al calcularlo correctamente, contando los alelos p en los homocigotos y heterocigotos.