¿El número de pares de bases en un cromosoma dado es el mismo entre diferentes individuos?

Esta es una pregunta básica pero no pude encontrar una respuesta a través de una búsqueda en la web; Esperemos que este sea el lugar adecuado para preguntar. ¿El número de pares de bases en un cromosoma en particular es el mismo en todos los individuos? Por ejemplo, si tomo un cromosoma X de dos humanos al azar, ¿contaría exactamente 155,270,560 pares de bases en ambos casos? ¿O hay mutaciones que harían una más larga que la otra? Si no son exactamente iguales, ¿cuál es el rango de variación de longitud?

No sólo no es lo mismo en dos individuos diferentes. No es lo mismo en un individuo (a lo largo de su vida o en dos células diferentes en un momento dado). en.wikipedia.org/wiki/Telomere Consulte también en.wikipedia.org/wiki/Insertion_(genetics) y en.wikipedia.org/wiki/Deletion_(genetics) .
@Adam da una respuesta a eso
Si alguien quisiera usar mi comentario para formular una respuesta (o mejorar la respuesta existente, no dude en hacerlo). Realmente no tengo tiempo en este momento para armar una respuesta bien referenciada con la que estaría feliz.
@ Adam, lo agregaré.

Respuestas (3)

Bienvenido a Biología.SE.

si tomo un cromosoma X de dos humanos al azar, ¿contaría exactamente 155,270,560 pares de bases en ambos casos?

No, probablemente no encuentre exactamente el mismo número de pares de bases porque las mutaciones no solo cambian un nucleótido por otro (lo que llamamos sustitución), sino que a veces agregan o eliminan pocos (oa veces muchos) nucleótidos.

tenga en cuenta, por cierto, que no necesita tomar dos individuos diferentes, solo puede considerar los dos cromosomas X de una mujer (o cualquier otro par de cromosomas en cualquier género) y encontrar esta diferencia en la longitud de los cromosomas.

¿Cuál es el rango en la variación de longitud?

¡Buena pregunta (+1)!

Problema de telómeros

Antes de comenzar, quiero aclarar que considero la longitud de esos cromosomas en el momento de la concepción. Los cromosomas variarán en longitud durante la vida debido a la reducción de los telómeros. No consideraré esto en los siguientes cálculos. Además, algunas mutaciones introducen (o eliminan) directamente una gran cantidad de nucleótidos (elementos transponibles, por ejemplo), no estoy considerando esas mutaciones aquí, asumiendo que son raras en comparación con inserciones únicas y eliminaciones únicas (¡esta suposición podría no ser válida! ). Así que, por favor, tome lo siguiente con pinzas.

Hagamos algunos cálculos desordenados

En la genética de poblaciones teórica clásica, tendemos a considerar principalmente sustituciones. ¡Pero tal vez pueda intentar hacer alguna extrapolación de este trabajo si me permite hacer algunas suposiciones sólidas, usar estimaciones pobres de valores verdaderos reales y usar algunas matemáticas no rigurosas! Esto va a ser feo y no extremadamente confiable. ¨ .

Sin explicar por qué esto es cierto (es un resultado proveniente de la teoría coalescente), el número esperado de diferencias por pares entre dos secuencias neutras para una población diploide es mi [ π ] = 4 norte m (un resultado impresionantemente simple), donde norte es el tamaño de la población (suponiendo una población panmíctica) y m es la tasa de mutación para toda la secuencia. Suponiendo una tasa de mutación constante por sitio de m s = 10 9 . Conocer la longitud de la secuencia de interés (cromosoma X) L 1.55 10 8 , la tasa de mutación para toda la secuencia es m = L m s = 0.155 . Consideremos un tamaño de población de norte = 5 10 7 (las ecuaciones asumen una población panmíctica, así que tomé un valor que me pareció más o menos razonable, mucho más pequeño que el tamaño real de la población mundial). Por lo tanto, el número total de sustituciones debe ser mi [ π ] = 4 5 10 7 0.155 10 7 .

Ahora, supongamos que sólo una fracción de 1 100 de las mutaciones traen variación en el número de nucleótidos, podríamos querer considerar el valor 1 100 10 7 = 10 3 . Y debido a que una mutación que elimina un nucleótido de una secuencia larga disminuirá el número de variantes en la longitud de la secuencia en lugar de aumentarlo, ¡digamos que dividirá este número por 10!... así que diría que dos cromosomas X típicos difieren en longitud en unos 100 nucleótidos.

Estoy seguro de que con un poco de trabajo uno puede llegar a cálculos más rigurosos y una expectativa más precisa. Intuitivamente, el resultado de 100 nucleótidos no suena del todo loco (no es 1 ni 10^6 al menos).

Además, probablemente se podrían usar los datos de secuencia disponibles para estimar este valor.

En cierto sentido, sí, pero es un poco engañoso la forma en que lo expresas. Las mutaciones pueden traer variaciones en la longitud de los cromosomas. Luego, dentro de la vida de un cromosoma individual, la longitud varía mucho porque en cada mitosis, los cromosomas pueden acortarse (necesitarás leer sobre la réplica cromosómica, los telómeros, la dirección de las hebras de ADN, los fragmentos de Okasaki para entender por qué). Entonces, uno de esos mecanismos explica la variación en función de la edad de los dos individuos que muestrea, mientras que el otro mecanismo es independiente de la edad y explica la variación en la longitud de los cromosomas que están presentes en el óvulo.
Gracias por la explicación. Entonces parece que hay (al menos) dos mecanismos diferentes que pueden cambiar la longitud de un cromosoma: (1) reducción de telómeros y (2) eliminación aleatoria de pares de bases (¿también es posible la adición?). Por lo que leí hasta ahora, el primero consiste en eliminar partes de una secuencia repetitiva de bases en los extremos de los cromosomas. Esto parece un proceso más determinista que el segundo. Creo que los cálculos que hiciste dan cuenta del segundo tipo. Si es correcto (100 de 155 millones), el rango es bastante pequeño.
Calculé la diferencia esperada en longitud entre 2 cromosomas muestreados al azar de huevos (sin considerar la contracción de los telómeros durante la vida, lo que nos obligaría a considerar la distribución de la edad, la distribución del número de mitosis dada la edad y la contracción esperada de los telómeros en cada mitosis). El rango total esperado de longitud en una población dada es necesariamente mayor que la diferencia de longitud esperada por pares... tal vez 10 o 100 veces más diría intuitivamente.
Además, por favor, de nuevo, no tome esos números demasiado en serio ya que los cálculos no son realmente rigurosos. Me alegró ver que terminé con un valor que me resultó intuitivo.
También hay elementos transponibles que pueden cambiar loci en un genoma. En varios microbios, pueden tomar o eliminar plásmidos. Los retrovirus pueden incorporar su ADN en sus huéspedes.
Entiendo que estos son realmente la parte posterior de los cálculos de tipo de sobre; pero aun así son lo suficientemente útiles como para guiar el siguiente nivel de detalle. El siguiente paso para mí es aprender cómo se tienen en cuenta estas variaciones al crear, actualizar y procesar bases de datos de cromosomas.
Por lo general, es más fácil para mí aprender algo si tengo un problema concreto con datos reales para trabajar. Si elijo un solo cromosoma corto de un organismo simple y solo quiero hacer un análisis estadístico simple sobre las variaciones de esos cromosomas; ¿Cuál sería un buen material de introducción sobre cómo acceder a una base de datos disponible abiertamente y hacer algunos cálculos simples?
Debe abrir una nueva publicación para su nueva pregunta y verificar una respuesta si su pregunta en esta publicación ha sido respondida (o simplemente no marcar nada si su pregunta aún no ha sido respondida). No estoy muy seguro de cuál es exactamente su pregunta, pero si aún no lo ha hecho, es posible que desee seguir primero un curso de bioinformática.

¿Hay mutaciones que harían una más larga que la otra? Si no son exactamente iguales, ¿cuál es el rango de variación de longitud?

Como se señaló en las otras respuestas, puede haber mutaciones que cambien la longitud del ADN entre individuos e incluso células individuales del mismo tejido.

Hay diferentes procesos que pueden cambiar la longitud del genoma. Los más comunes son:

Podemos ignorar los microindels y las translocaciones cromosómicas por el momento porque los primeros imparten solo un pequeño cambio en el tamaño del genoma y los segundos suelen ser raros y, en la mayoría de los casos, extremadamente perjudiciales.

Con un mapeo riguroso, se sabe que las CNV causan una variación del 4,8 % en el tamaño del genoma humano [2] . Cabe señalar que esta información no tiene en cuenta la frecuencia de los cambios; esto es solo una especie de límite máximo. También se puede notar que las deleciones tienen una mayor contribución a la variación en comparación con las inserciones.

Se sabe que los retrotransposones LINE-1 son bastante activos en el genoma humano. Representan ~17% del genoma humano y son una de las principales fuentes de variación interindividual [3] . Se destacan especialmente por promover la heterogeneidad somática en la diferenciación de las neuronas [4] . Dado que los LINE se expanden copiando y pegando, su actividad se correlaciona con el aumento del tamaño del genoma. La actividad del transposón generalmente se suprime en las células germinales por una clase de pequeños ARN no codificantes llamados piRNA [5] .

No he encontrado un artículo que describa exactamente la variación en el tamaño del genoma debido a LINE-1 u otros elementos transponibles. Agregaré una referencia si encuentro una.

Cifras interesantes. Si un solo mecanismo (CNV) puede causar una variación del 4,8 % en la longitud y algunos afirman que "en términos de secuencia de ADN, todos los humanos son un 99,5 % similares a cualquier otro ser humano" ( en.wikipedia.org/wiki/Human_genetic_variation ), entonces, se están utilizando definiciones o estas variaciones tienen estadísticas extrañas –
@secretlyfamous Tenga en cuenta que las CNV no necesitan interrumpir la homología, es decir, la "similitud" entre dos genomas. Cuando hablamos de similitud, generalmente nos referimos a la homología de secuencia. Y las estadísticas presentadas son para el límite superior de la longitud de las regiones CNV. Por lo tanto, la variación es un límite superior y no la desviación estándar.
gracias por la explicación. Es un poco difícil para mí aceptar que la inserción/eliminación (sin restricciones) no cambia la homología; pero guardaré los detalles para una futura pregunta.
@secretlyfamous imagina duplicaciones, solo crea una copia adicional de la región genómica que nuevamente sería homóloga a la referencia. También existe la posibilidad de deleciones homocigóticas. Otro punto a tener en cuenta es que cuando las personas dicen que el genoma es 99% similar (o incluso cuando se hace una comparación entre diferentes especies; por ejemplo, los genomas de chimpancé y humano son 95% (?) similares) entonces el genoma no transcrito (intergénico) No se consideran regiones.

Nunca contarías 155,270,560 pb en el cromosoma X. Hace 7 años, el genoma humano sin espacios (estado completo) no existía, esto es de GRCh37.p13. Esa es información sobre el genoma que tenía huecos falsos insertados. Pero en febrero de 2022 finalmente obtuvimos todo el genoma (también el cromosoma Y) y el número perfecto es 154,259,566. Todos los demás números para otros cromosomas están en wikipedia tomados de aquí. https://www.ncbi.nlm.nih.gov/assembly/GCA_009914755.4

PD Literalmente no sabías lo básico. 155,270,560 es un número con espacios falsos insertados, puede verlo aquí: https://www.ncbi.nlm.nih.gov/grc/human/data?asm=GRCh37.p13 El número que quería estaba en la pestaña Longitudes sin espacios, en ese momento era 151.100.560. Entonces eso significa que en el momento de GRCh37.p13 algo de eso no se sabía.