Esta es una pregunta básica pero no pude encontrar una respuesta a través de una búsqueda en la web; Esperemos que este sea el lugar adecuado para preguntar. ¿El número de pares de bases en un cromosoma en particular es el mismo en todos los individuos? Por ejemplo, si tomo un cromosoma X de dos humanos al azar, ¿contaría exactamente 155,270,560 pares de bases en ambos casos? ¿O hay mutaciones que harían una más larga que la otra? Si no son exactamente iguales, ¿cuál es el rango de variación de longitud?
Bienvenido a Biología.SE.
si tomo un cromosoma X de dos humanos al azar, ¿contaría exactamente 155,270,560 pares de bases en ambos casos?
No, probablemente no encuentre exactamente el mismo número de pares de bases porque las mutaciones no solo cambian un nucleótido por otro (lo que llamamos sustitución), sino que a veces agregan o eliminan pocos (oa veces muchos) nucleótidos.
tenga en cuenta, por cierto, que no necesita tomar dos individuos diferentes, solo puede considerar los dos cromosomas X de una mujer (o cualquier otro par de cromosomas en cualquier género) y encontrar esta diferencia en la longitud de los cromosomas.
¿Cuál es el rango en la variación de longitud?
¡Buena pregunta (+1)!
Problema de telómeros
Antes de comenzar, quiero aclarar que considero la longitud de esos cromosomas en el momento de la concepción. Los cromosomas variarán en longitud durante la vida debido a la reducción de los telómeros. No consideraré esto en los siguientes cálculos. Además, algunas mutaciones introducen (o eliminan) directamente una gran cantidad de nucleótidos (elementos transponibles, por ejemplo), no estoy considerando esas mutaciones aquí, asumiendo que son raras en comparación con inserciones únicas y eliminaciones únicas (¡esta suposición podría no ser válida! ). Así que, por favor, tome lo siguiente con pinzas.
Hagamos algunos cálculos desordenados
En la genética de poblaciones teórica clásica, tendemos a considerar principalmente sustituciones. ¡Pero tal vez pueda intentar hacer alguna extrapolación de este trabajo si me permite hacer algunas suposiciones sólidas, usar estimaciones pobres de valores verdaderos reales y usar algunas matemáticas no rigurosas! Esto va a ser feo y no extremadamente confiable. .
Sin explicar por qué esto es cierto (es un resultado proveniente de la teoría coalescente), el número esperado de diferencias por pares entre dos secuencias neutras para una población diploide es (un resultado impresionantemente simple), donde es el tamaño de la población (suponiendo una población panmíctica) y es la tasa de mutación para toda la secuencia. Suponiendo una tasa de mutación constante por sitio de . Conocer la longitud de la secuencia de interés (cromosoma X) , la tasa de mutación para toda la secuencia es . Consideremos un tamaño de población de (las ecuaciones asumen una población panmíctica, así que tomé un valor que me pareció más o menos razonable, mucho más pequeño que el tamaño real de la población mundial). Por lo tanto, el número total de sustituciones debe ser .
Ahora, supongamos que sólo una fracción de de las mutaciones traen variación en el número de nucleótidos, podríamos querer considerar el valor . Y debido a que una mutación que elimina un nucleótido de una secuencia larga disminuirá el número de variantes en la longitud de la secuencia en lugar de aumentarlo, ¡digamos que dividirá este número por 10!... así que diría que dos cromosomas X típicos difieren en longitud en unos 100 nucleótidos.
Estoy seguro de que con un poco de trabajo uno puede llegar a cálculos más rigurosos y una expectativa más precisa. Intuitivamente, el resultado de 100 nucleótidos no suena del todo loco (no es 1 ni 10^6 al menos).
Además, probablemente se podrían usar los datos de secuencia disponibles para estimar este valor.
¿Hay mutaciones que harían una más larga que la otra? Si no son exactamente iguales, ¿cuál es el rango de variación de longitud?
Como se señaló en las otras respuestas, puede haber mutaciones que cambien la longitud del ADN entre individuos e incluso células individuales del mismo tejido.
Hay diferentes procesos que pueden cambiar la longitud del genoma. Los más comunes son:
Podemos ignorar los microindels y las translocaciones cromosómicas por el momento porque los primeros imparten solo un pequeño cambio en el tamaño del genoma y los segundos suelen ser raros y, en la mayoría de los casos, extremadamente perjudiciales.
Con un mapeo riguroso, se sabe que las CNV causan una variación del 4,8 % en el tamaño del genoma humano [2] . Cabe señalar que esta información no tiene en cuenta la frecuencia de los cambios; esto es solo una especie de límite máximo. También se puede notar que las deleciones tienen una mayor contribución a la variación en comparación con las inserciones.
Se sabe que los retrotransposones LINE-1 son bastante activos en el genoma humano. Representan ~17% del genoma humano y son una de las principales fuentes de variación interindividual [3] . Se destacan especialmente por promover la heterogeneidad somática en la diferenciación de las neuronas [4] . Dado que los LINE se expanden copiando y pegando, su actividad se correlaciona con el aumento del tamaño del genoma. La actividad del transposón generalmente se suprime en las células germinales por una clase de pequeños ARN no codificantes llamados piRNA [5] .
No he encontrado un artículo que describa exactamente la variación en el tamaño del genoma debido a LINE-1 u otros elementos transponibles. Agregaré una referencia si encuentro una.
Nunca contarías 155,270,560 pb en el cromosoma X. Hace 7 años, el genoma humano sin espacios (estado completo) no existía, esto es de GRCh37.p13. Esa es información sobre el genoma que tenía huecos falsos insertados. Pero en febrero de 2022 finalmente obtuvimos todo el genoma (también el cromosoma Y) y el número perfecto es 154,259,566. Todos los demás números para otros cromosomas están en wikipedia tomados de aquí. https://www.ncbi.nlm.nih.gov/assembly/GCA_009914755.4
PD Literalmente no sabías lo básico. 155,270,560 es un número con espacios falsos insertados, puede verlo aquí: https://www.ncbi.nlm.nih.gov/grc/human/data?asm=GRCh37.p13 El número que quería estaba en la pestaña Longitudes sin espacios, en ese momento era 151.100.560. Entonces eso significa que en el momento de GRCh37.p13 algo de eso no se sabía.
Adán Phelps
MattDMo
Adán Phelps
Galeno