Identidad por descendencia versus identidad por estado

Fondo

Los conceptos de Identidad por Descendencia (IBD) vs Identidad por Estado (IBS) son centrales en la genética de poblaciones, sin embargo, no logro comprender completamente las definiciones.

Puede encontrar ejemplos en los que mi comprensión de IBD vs IBS es bastante pobre en la respuesta de @DermotHarnett aquí o en los comentarios con @PaulStaab aquí . @PaulStaab sugiere que diferentes autores han usado diferentes definiciones de EII y SII.

lo que no me queda claro

Por lo que recuerdo de Hartl y Clark (no tengo el libro conmigo para citar), la EII depende de un umbral de tiempo arbitrario en el pasado más allá del cual si ocurrieron eventos coalescentes, todavía llamamos a los dos alelos IBS (Idéntico por estado) y no EII. ¡Sin embargo, me molesta la idea de que el concepto de EII depende de un umbral arbitrario!

Supongo que dos alelos pueden ser EII sin ser SII en el caso de un evento de mutación o recombinación en medio de la secuencia de interés anterior (mirando hacia atrás en el tiempo; más reciente) a su coalescencia. Supongo que dos alelos pueden ser IBS no pueden ser IBD solo si usamos un umbral arbitrario que es más antiguo que su tiempo de coalescencia o si ocurrió una evolución convergente/paralela.

Preguntas

  • ¿La EII depende de un umbral arbitrario?
  • ¿Hay varias definiciones de EII y SII en uso?
  • ¿La EII implica SII?
  • ¿El SII implica EII?
  • ¿Puede hacer una breve revisión de estas definiciones para aclarar las cosas?

Respuestas (2)

De hecho, el tema de la EII y el SII puede ser confuso.

La definición de identidad por estado se refiere al hecho de que en algún momento dos individuos, aunque no estén relacionados entre sí, presentan el mismo alelo en un locus específico. Debido a su falta de relación, esta similitud probablemente surgió de un evento mutacional similar.

Por otro lado, con la EII, dos individuos comparten el mismo alelo debido a su ascendencia.

Los alelos que son idénticos por descendencia también lo son por estado. Pero lo contrario no es cierto. (ver también https://www.biostars.org/p/174048/#174049 y Powell et al 2010, Nature Reviews Genetics 11, 800–805 (1 de noviembre de 2010) | doi:10.1038/nrg2865).

Ahora, sobre el umbral que mencionaba en su pregunta, no estoy completamente seguro de lo que quiere decir. Eventualmente, todos los individuos son rastreables hasta un MRCA (antepasado común más reciente). Entonces, creo que el umbral del que habla se refiere al tamaño de la población en análisis. Dependiendo del tamaño de su población, tendrá diferentes proporciones de alelos que son IBD e IBS.

Espero que esto ayude.

El "umbral arbitrario" es parte de la definición que se suele dar de la EII en los libros de texto. El problema es que, si retrocedes lo suficiente, todos los alelos descienden de un alelo ancestro común. Entonces, para definirlo, de acuerdo con la explicación del libro de texto que tanto yo como el autor de la pregunta nos sentimos incómodos, lo que debe hacer es: elegir un número de generaciones atrás, digamos, cinco: decidir considerar todos los alelos en esa generación, sin relación entre sí (no EII); y luego defina la EII como "tener un alelo ancestral común más reciente que ese número de generaciones atrás".

Esta no será una explicación completa: a mí mismo me molestan estas preguntas. Pero diré lo que sé.

Primero:

Sí, Identity By Descent (IBD) se define en relación con un número de umbral elegido de generaciones, al menos en el sentido en que lo entiendo (en caso de que haya más de un sentido, ¿creo que hay algunos que permiten la mutación?). En el número elegido de generaciones atrás, asumimos que todos esos ancestros no estaban relacionados. ¡Esto parece problemático! Pero dos cosas podrían ayudar a que parezca menos. Primero: cuando preguntamos si dos individuos están relacionados o no, en realidad estamos preguntando si están más estrechamente relacionados que el parentesco promedio de la población de fondo . Segundo: el método genealógico para estimar los coeficientes de parentesco y consanguinidad es solo eso, una forma de estimar, que puede fallar si fallan sus suposiciones (por ejemplo, si los ancestros en el umbral no fueron elegidos al azar de una población de apareamiento al azar).

Para ilustrar, considere una pregunta sobre un individuo ficticio con un árbol genealógico ficticio (spoilers de Game of Thrones , temporada 1): ¿Qué tan endogámico es Joffrey Baratheon?

Sabemos que Joffrey Baratheon no es, de hecho, hijo del rey Robert Baratheon, sino producto del incesto secreto entre su madre, la reina Cersei Lannister, y su hermano gemelo Jaime Lannister. Si eso fuera todo lo que supiéramos sobre la situación, dibujaríamos el siguiente pedigrí: ingrese la descripción de la imagen aquíal usar este pedigrí, asumimos implícitamente que los padres de Cersei y Jaime no están relacionados, es decir, elegidos al azar de una gran población de antecedentes de apareamiento aleatorio (y asumiendo que si Cersei y Jaime son más propensos que los individuos al azar a compartir un alelo, que esto se debe únicamente a la EII de uno u otro de esos padres elegidos al azar , es decir, debido a que son parientes cercanos). Con base en esta suposición, aplicando el método habitual a este pedigrí, estimamos el coeficiente de consanguinidad de Joffrey como 0.25 .

Sin embargo, si miramos más profundamente en el árbol genealógico de los Lannister, nos damos cuenta de que Cersei y Jaime en realidad están más estrechamente relacionados que una típica pareja de hermanos: sus padres no fueron elegidos al azar, sino que ellos mismos estaban relacionados (aunque no lo suficientemente cerca como para ser escandaloso ) . para la sociedad Westerosi); su padre Tywin Lannister y su madre Joanna Lannister eran primos. Usando esta información dibujamos un pedigrí más completo:ingrese la descripción de la imagen aquíUtilizando de nuevo el método genealógico habitual, ahora estamos haciendo una suposición diferente. Ya no asumimos que los abuelos de Joffrey, Tywin y Joanna, fueron elegidos al azar de la población de fondo. En cambio, asumimos que los tatarabuelos de Joffrey, Gerold Lannister y Lady Rohanne Webber, fueron elegidos al azar de la población. Esta suposición parece más razonable. Dado que este nuevo pedigrí implica más consanguinidad en la ascendencia de Joffrey, suponemos que el método debería dar una estimación más alta de su coeficiente de consanguinidad: de hecho lo hace, dándonos una estimación de 0.28125 .

Así es como esto ilustra la subjetividad de definir la EII. Cuando usamos el primer pedigrí, nos preguntamos: ¿Cuál es la probabilidad de que ambos alelos en un locus en el genoma de Joffrey desciendan del mismo alelo en la generación de los abuelos ? Cuando usamos el segundo pedigrí, nos preguntamos: ¿Cuál es la probabilidad de que ambos alelos en un locus en el genoma de Joffrey desciendan del mismo alelo en la generación de los tatarabuelos ? Estas son dos preguntas diferentes y, por supuesto, dieron dos respuestas diferentes. El problema, por supuesto, es que la cuestión de cuán endogámico es Joffrey en relación con la población de fondo, solo tiene una respuesta (¡que las respuestas del pedigrí pueden estimar más o menos bien)!

Segundo :

Aunque los coeficientes importantes como el "coeficiente de endogamia" o el "coeficiente de relación" a menudo se presentan en los libros de texto como definidos en términos de la probabilidad de que algún par de alelos sean EII, esta no puede ser la definición real. Esto se debe a que las probabilidades no pueden ser negativas , pero la relación sí puede serlo (si dos individuos son menosrelacionado que el promedio), al igual que el coeficiente de endogamia (si el animal es exogámico, es decir, sus padres tenían parentesco negativo). La posibilidad de una relación negativa incluso tiene implicaciones evolutivas interesantes. Como una especie de reverso de la regla de Hamilton para la selección altruista de parentesco, donde puede ser evolutivamente beneficioso para un gen hacer que un portador se dañe a sí mismo, para ayudar a un pariente, es decir, un individuo con más probabilidades que el promedio de portar también una copia de ese gen -la relación negativa hace posible tener una selección anti-pariente rencorosa- donde le paga a un gen hacer que su portador se dañe a sí mismo, sin ningún beneficio en absoluto, sino únicamente para dañar a un individuo con menos probabilidades que el promedio de portar una copia de mismo (y más probable que lleve a sus competidores)!

De hecho, en su formulación original de estos y otros coeficientes relacionados, Sewall Wright no invocó en absoluto las probabilidades o la identidad por descendencia. Para la relación, habló sobre la correlación entre los estados alélicos de los individuos (esto requiere asignar números a los alelos, por ejemplo, A = 1 y a = 0 ). Tenga en cuenta que los coeficientes de correlación pueden ser negativos. Malécot introdujo la interpretación de "probabilidad de EII"; se ha incluido en los libros de texto de genética de poblaciones principalmente porque es más fácil de enseñar (a pesar de la subjetividad aparentemente paradójica del número de referencia de generaciones y la inconsistencia con la posibilidad de una relación negativa).

La explicación de Wright del coeficiente de consanguinidad es más intuitiva: señala que el efecto más importante de la consanguinidad es la reducción de la heterocigosidad . Considere una población de apareamiento aleatorio: un individuo elegido al azar tendrá una cierta fracción de sus loci heterocigotos. Pero un individuo endogámico tendrá menos loci heterocigotos (más loci homocigotos). Malécot interpretó ese exceso de homocigosidad como "debido a la coancestría [desde una generación de referencia elegida subjetivamente]", pero podemos ignorar ese bagaje conceptual y solo hablar del exceso de homocigosidad (deficiencia en heterocigosidad) en sí. Por lo tanto, una mejor definición del coeficiente de consanguinidad es

F = H mi H H mi

dónde H mi es la heterocigosidad que esperaría de la descendencia de un apareamiento aleatorio dadas las frecuencias alélicas de la población, y H es la heterocigosidad real del individuo consanguíneo . Una buena presentación de esta interpretación aparece en el Primer of Population Genetics de Hartl .

Tenga en cuenta que esta definición, a diferencia de la definición de probabilidad (pero al igual que la definición de correlación de parentesco) puede ser negativa: los individuos consanguíneos tienen menos homocigosidad (más heterocigosidad) de lo esperado en apareamiento aleatorio.