¿Cómo se podría calcular el flujo de genes entre dos poblaciones?

Imagine que hay dos poblaciones X e Y , y para cada población tiene los genotipos de cada individuo en esa población (por ejemplo, Aa, AA, aa, etc.), pero para múltiples loci (por ejemplo, AABb).

¿ Cómo se podría calcular el flujo de genes entre la población X y la población Y ?

Una respuesta recomendaría idealmente uno o:

  • Una biblioteca R/Python/C++, o cualquier otra herramienta de software
  • el desglose de las matemáticas, por lo que estaría muy agradecido, pero no del todo necesario en la respuesta

Lectura de antecedentes

Preguntas relacionadas

@ Remi.b aquí está la pregunta en caso de que esté interesado en encontrar la respuesta (por cierto, también es genial saber de usted)

Respuestas (1)

Antecedentes teóricos

De Slatkin 1991 , en equilibrio

F S T = 1 1 + 4 norte metro ( d d 1 ) 2

, dónde norte es el tamaño de la población por isla, metro es la tasa de migración y d es el número de islas ( d significa "deme"). Como d , ( d d 1 ) 2 1 y la ecuación de Slatkin se convierte en la ecuación estándar de Wright F S T = 1 1 + 4 norte metro .

De lo anterior, es fácil demostrar que

metro = ( d 1 ) 2 ( F S T 1 ) 4 d 2 F S T norte

Para 2 islas, se convierte en

metro = 9 dieciséis ( F S T 1 ) F S T norte

En consecuencia, en un modelo de 2 islas el esperado F S T es casi el doble de bajo ( 9 dieciséis = 0.5625 ) que en el modelo de isla infinita.

La ecuación anterior es una aproximación que supone...

  • baja tasa de mutación (no se aplicaría a los datos de microsatélites)
  • tasa de migración relativamente baja (hay un metro 2 término que se elimina)
  • tasa de migración simétrica (las tasas de migración hacia atrás y hacia adelante son iguales)
  • igual tamaño de población por isla
  • ¡equilibrio!

Otras lecturas

Recomiendo leer este documento ( Slatkin 1991 ), en mi opinión es uno de los mejores en el estudio de F S T . También recomendaría Nei 1973 , Slatkin 1985 y Whitlock y McCauley 1998 .

El software específico a utilizar depende del tipo de datos que tenga. En cualquier caso, si promedias F S T sobre una serie de loci, asegúrese de utilizar el método de Weir y Cockerham 1984 .

Bioinformática

El primer paso para usted es calcular su F S T . Suponiendo que tiene varios SNP, querrá usar la estimación de Weir-Cockerham de F S T . Hay una serie de soluciones para calcular tales estimaciones. Una solución para calcular esto es vcftools . El siguiente (Bash) hará el trabajo

./vcftools --vcf MyFile.vcf --weir-fst-pop individual_list_1.txt
--weir-fst-pop individual_list_2.txt --fst-window-size 800 --fst-window-step 100

, ¿dónde MyFile.vcfestán sus datos en formato vcf (es posible que eventualmente desee usar PGDspider para reformatear sus datos). individual_list_1.txty individual_list_2.txtson archivos que contienen la lista de nombres individuales (separados por \n) pertenecientes a la primera y segunda población, respectivamente. Las opciones --fst-window-sizey --fst-window-steple permite calcular la estimación en una ventana deslizante. Elegí números arbitrarios arriba. EggLib es otra buena alternativa.