Inferir la frecuencia de genes dentro de una especie a lo largo del tiempo

Estaba leyendo Karlsson et al. (2014) y llegué a esto:

Una variante seleccionada que aumenta rápidamente en frecuencia en los últimos 250 000 años puede detectarse como una reducción inusual en la diversidad genética.

Me di cuenta de que no sé cómo inferir una frecuencia alélica específica a lo largo del tiempo dentro de una especie dada .

Traté de buscar en Google alguna palabra clave pero me inundaron otros conceptos. ¿Podría por favor dirigirme a alguna documentación/palabras clave apropiadas?

Bienvenido a Biología.SE. By tracing over time, supongo que te refieres a observing the signature of an allele sweeping to high frequency, ¿verdad?
Edité tu publicación para incluir el enlace y corregir el error gramatical (entre vs dentro). Es posible que desee agregar de dónde proviene exactamente la oración (qué página, qué párrafo).

Respuestas (2)

Hay dos partes de su publicación que quiero abordar, la primera es la cita (porque quiero asegurarme de que la entienda bien) y la segunda trata sobre los métodos generales de inferencia para estimar la composición genética de las poblaciones ancestrales.

La cita: barridos selectivos

Una variante seleccionada que aumenta rápidamente en frecuencia en los últimos 250 000 años puede detectarse como una reducción inusual en la diversidad genética.

Cuando se selecciona un alelo, se propagará relativamente rápido en la población, en relación con la propagación de alelos neutrales, por ejemplo . Si un alelo se fija en la población, la diversidad en ese gen es cero; no hay variación genética permanente en el gen . La selección a menudo reducirá la variación genética , pero vea también esta publicación .

Sin embargo, la selección no solo reduce la diversidad genética en el locus seleccionado, sino también en los loci cercanos al gen, aquellos que están vinculados . La pérdida de diversidad genética en los loci vinculados se produce mediante un proceso llamado barrido selectivo . Esto se define (algo mal) en la versión web de su documento vinculado :

Barridos selectivos; Reducciones en la variación genética causadas por selección positiva en loci particulares.

Básicamente, un barrido selectivo ocurre cuando una fuerte selección hace que un alelo, y los loci a los que está altamente vinculado, se propaguen a través de una población. La diversidad genética se perderá de los loci vinculados a un ritmo determinado por la fuerza de la selección y el grado de vinculación (donde una vinculación más estrecha y una selección más fuerte aumentan la tasa de pérdida). Este documento (consulte la sección 7 para barridos selectivos) brinda una buena discusión de los factores que afectan la variación genética en las poblaciones naturales y se basa en el ejemplo del cromosoma Y :

Uno o más barridos selectivos habrán dejado el cromosoma Y con poca o ninguna variabilidad.

Inferencia de poblaciones ancestrales

Puede tomar muestras de ADN de la población en el momento que le interese. Sin embargo, hacerlo es muy complicado . El ADN se degrada con el tiempo, por lo tanto, es importante comprender cómo se degrada el ADN con el tiempo si desea inferir sobre la población. (Vi una charla hace un tiempo de un investigador, no recuerdo el nombre, tomando muestras de las tumbas. No sé qué tan correctamente recuerdo esto, pero gran parte del ADN que recolectan es bacteria. Solo una pequeña fracción de el ADN que obtuvieron al tomar muestras de huesos humanos encontrados en tumbas que tenían solo unos pocos cientos de años era en realidad humano. Otro problema del estudio del ADN antiguo) . A menudo es difícil encontrar fuentes de muestras de ADN que a) tengan la calidad suficiente y b)con suficientes individuos para permitir una buena inferencia de la población ancestral; una muestra pequeña será propensa al sesgo de muestreo. *

Hay otro enfoque, y ahora se usa comúnmente. Si está interesado en encontrar más, debe buscar teoría y métodos coalescentes . Esto se infiere de nuevo, basado en la composición genética actual (o relativamente más reciente) de las poblaciones y utilizando la teoría genética de poblaciones. En realidad, no se usa como un intento de estimar la frecuencia alélica específica , sino como un intento de inferir el tamaño de la población, las tasas de migración y las tasas de recombinación. Infiere cuándo fue el ancestro común más reciente (MRCA). Este artículo revisa los métodos coalescentes para árboles filogenéticos y esta es una conferencia introductoria sobre la coalescencia.. La teoría coalescente tiene muchas consideraciones que deben hacerse; ¿Son algunas mutaciones más comunes que otras (ver Reloj Molecular )? ¿Cómo afecta la selección a la variación genética (por ejemplo, barridos selectivos)? ¿Varía el ligamiento a lo largo del genoma? ¿Varían las tasas de mutación, deriva y selección a lo largo del genoma? ¿Las diferentes partes del genoma se ven afectadas de manera diferente por la migración?

Ambos enfoques plantean serias consideraciones que están a la vanguardia de la genética evolutiva en este momento. Grupos de investigación de todo el mundo están desarrollando métodos de laboratorio, métodos estadísticos y modelos matemáticos en un intento por hacer que la inferencia sea más precisa. Ahora mismo, en mi opinión, la única forma de inferir la frecuencia de alelos específicosen poblaciones ancestrales es utilizar métodos de ADN antiguo; coalescente se puede usar para inferir parámetros genéticos de población, pero con respecto a alelos específicos, tiene tantos factores a considerar que (en este momento, pero ciertamente menos en el futuro) simplemente no tenemos una comprensión completa. En otras palabras, las suposiciones que deben hacerse para que la coalescencia pueda estimar las frecuencias alélicas ancestrales específicas rara vez se cumplirán. Sin embargo, siempre que esto se discuta adecuadamente, no hay problema con el método que se utiliza, y estoy seguro de que el futuro es brillante para tales métodos.


*Sobre el sesgo de muestreo: imagina que quieres calcular la frecuencia del número dos en un dado de seis caras (sabemos que la frecuencia real es 0,167). Tiras el dado cuatro veces y el dado muestra el lado con dos puntos una vez. Su estimación de frecuencia de población es 0,25. Tu amigo lanza el mismo dado 4000 veces. Ven los dos puntos 652 veces, que es 0,163, mucho más representativo de la verdadera frecuencia de la población. La moraleja de la historia, pequeñas muestras pueden dar estimaciones engañosas de la verdad.

Tu respuesta ha sido muy útil ya que no entendía los barridos selectivos al principio, donde la explicación del enlace lo deja claro. El primer objetivo era entender cómo leer la historia de la frecuencia de un gen y @Resonating lo explicó bien.
Estaba actualizando mi respuesta para cubrir más enfoques de inferencia @zakrapovic

En realidad, hay dos formas de inferir la genética pasada.

  1. Muestra el pasado.

Realmente solo funciona si tiene muestras arqueológicas no contaminadas bien conservadas, pero funciona sorprendentemente bien, considerando. La precisión y la integridad disminuyen con bastante rapidez a medida que retrocede en el tiempo, pero es aproximadamente posible desde miles de años hasta cientos de miles de años. No tendrá muchas muestras, por lo que es difícil decir algo sobre la genética de poblaciones. No hagas esto. No funciona muy bien y es muy difícil.

  1. relojes moleculares.

Las mutaciones del mismo sentido que no afectan nada se acumulan en los genes con el tiempo a medida que se transmiten. Los genes que tienen un ancestro común distante son más diferentes que los genes que están separados por una o dos generaciones. Básicamente, así es como funciona la filogenética en su conjunto, pero puede usar las diferencias de edad entre genes cercanos para detectar la selección de esta manera. Si el gen A es casi idéntico en todos los individuos de una población, pero el gen B tiene miles de variaciones bastante distintas, está claro que el gen A hace algo importante y ha sido poderosamente seleccionado. No se limite a contar la cantidad de tipos de alelos para el gen A, calcule la relación promedio entre todos los alelos que encuentre. Si la relación del gen A es mucho menor que la de otros genes, el gen A se está seleccionando. Esto es lo que el texto quiere decir con 'reducción de la diversidad genética'

No puede calcular las frecuencias de los alelos en momentos arbitrarios del pasado sin una máquina del tiempo (incluso con un muestreo antiguo, no puede estar realmente seguro de obtener una muestra precisa de la población histórica), pero la filogenética puede insinuar lo que sucedió. detectando las firmas de la evolución.

No sabía que podíamos probar el pasado y esto es impresionante. Entonces la explicación de la mutación del mismo sentido es clara. Muchas gracias
Supongo que el artículo al que se refiere el OP habla sobre la firma genética de la selección (como un barrido selectivo). ¿No debería ser esta una tercera gran categoría? Tampoco me queda claro qué inferencia sobre el cambio en la frecuencia de alelos a lo largo del tiempo le gustaría hacer comparando el número de diferencias fijas en una sola población.
tu conjetura es correcta
@ Remi.b Lo siento, creo que esto necesita una edición para ser un poco más claro. Medir el número de diferencias fijas en una población no es particularmente sólido, especialmente si la selección ocurrió en el pasado. Algo así como 'relación media' entre muchos alelos muestreados es mucho mejor y también le permite detectar la selección en subpoblaciones observando la distribución de puntajes.