Cuando busqué en NCBI, vi un patrón: incluso si los tamaños de los cromosomas, la cantidad de genes y la cantidad de proteínas son diferentes, el % de GC en los cromosomas tiende a ser similar. Los ejemplos están vinculados a continuación.
Levadura , Plasmodium falciparum
Si ves el genoma de las mitocondrias, no es muy similar al cromosoma. ¿Por qué todos los cromosomas tienden a ajustar su GC% cerca del promedio del GC% total? ¿Hay alguna razón específica relacionada con la metafase de la meosis?
para aclarar más tengo algunas imágenes para ayudar
El tamaño de los cromosomas o los genes en un organismo no se ajustan cerca del promedio de su total, pero el GC% sí lo hace. Tiene solo 3-2% (falciparum) o 3-4% (vivax) de variación en GC%. Se siente como su equilibrio como ecualizador. ¿Por qué?
Como señala @dd3, el % de GC promedio indica la necesidad de estabilidad y es posible que las regiones de codificación o las regiones estructurales del genoma deban ser más estables. Pero el mayor porcentaje de GC en los genomas se encuentra en los termófilos, organismos que viven en agua a alta temperatura, en fuentes termales y respiraderos geotérmicos submarinos. Esta revisión menciona cómo se pueden encontrar algunos termófilos con GC al 50%. El termófilo extremo Thermus thermophilus puede tener un contenido de GC% del 69,4%.
Pero está preguntando cómo se promedia el contenido de GC a lo largo de un genoma grande. La respuesta es variación y selección. Cuando un gen necesita ser más estable debido a la función genómica o porque está tratando de vivir en un entorno más cálido, las mutaciones que convierten los pares de bases A/T en G/C transmitirán una ventaja incremental para la supervivencia y tenderán a retenerse en el gen. grupo siempre que no resulte una mayor desventaja para la mutación. Con el tiempo y a medida que la estabilidad crea una mayor ventaja, el % de GC migrará más y más lejos de la media.
Esto funciona tanto para la termotolerancia como para las restricciones biofuncionales de ser un telómero, un centrómero o una región de codificación: las restricciones de estabilidad y codificación se enfrentan entre sí para converger en un contenido óptimo de GC en cualquier tramo dado del genoma.
Por el contrario, la mayoría de los genomas que tienen un contenido de GC por debajo del 50 % están migrando allí porque demasiada estabilidad también puede tener un costo. Romper la hélice del ADN para la transcripción y otros procesos celulares también debe realizarse sin problemas, por ejemplo.
Las regiones codificantes son significativas para las bacterias ( E coli tiene una secuencia codificante del 89 % ).). Para las secuencias de codificación, el código genético es lógicamente un 50% de GC en promedio, pero si observa los codones reales en el diagrama a continuación, verá que, excepto en el caso de un solo codón (triptófano, metionina), la tercera base siempre tiene una opción de GC, lo que permite un contenido de GC en la mitad de los percentiles 60. La restricción de permitir que las secuencias de codificación varíen libremente es solo una aproximación: en algunos casos, las sustituciones de aminoácidos con codones ricos en GC pueden aumentar un poco el techo. Y los aminoácidos más frecuentes tienen la posibilidad de formar 2 o 3 bases de sus bases codón GC. En general, sería notable encontrar una bacteria con un % de GC superior al 72 %. Las mutaciones y los requisitos de las proteínas codificadas simplemente no lo permitirían.
Entonces: durante los períodos evolutivos, estas mutaciones de GC se acumulan donde son útiles, incluso hasta el punto de que 2/3 del genoma son pares de GC. La fuerza selectiva más fuerte para acumular un % de GC promedio alto para un genoma es la exposición del propio genoma a un entorno de alta temperatura.
Tenga en cuenta que este argumento de termoestabilidad no cuenta para muchos animales porque regulan la temperatura de su cuerpo.
Existe una variación significativa en el contenido genómico de GC, tanto entre especies como dentro de un genoma individual. Es común un contenido promedio de GC en el rango de 35% a 45%, aunque definitivamente hay organismos que se encuentran fuera de este rango. La especie de plasmodio a la que se vincula arriba es un ejemplo de riqueza extrema de AT (bajo contenido de GC), mientras que algunos genomas bacterianos tienen hasta un 70% de contenido de GC o más.
Para los genomas eucarióticos, la composición de nucleótidos no se distribuye uniformemente. El hecho de que un genoma tenga un contenido promedio de GC del 40 % no significa que pueda seleccionar cualquier región de 10 kb en el genoma y esperar que esa región tenga un contenido de GC de +/-40 %. Más bien, los genomas eucarióticos son un mosaico de grandes regiones que internamente tienen una composición muy uniforme, pero cuya composición es bastante diferente de las regiones flanqueantes ( isocoros ).
Entonces, aunque todos los cromosomas de un organismo en particular pueden tener un contenido de GC promedio similar , tenga en cuenta que esto es solo un promedio y que la composición de nucleótidos varía significativamente a lo largo del genoma.
Buena respuesta de Daniel. También agregaría que puede haber diferencias significativas entre el contenido de GC de ADN cromosómico o nuclear y el de entidades extracromosómicas como genomas mitocondriales y de cloroplastos o plásmidos (naturales). Estos ADN tienen diferentes restricciones sobre ellos (replicación, ubicación subcelular, por ejemplo) y eso puede reflejarse en cierto grado por un contenido de GC diferente al de los cromosomas nucleares.
Para comenzar, uno podría preguntarse "¿Cuál es la ventaja de un mayor contenido de GC?"
Un mayor contenido de GC se asocia con una mayor estabilidad del ADN y, en consecuencia, se ha sugerido que esto es importante para las regiones codificantes de proteínas. Se ha descubierto que hay bastantes regiones codificantes de proteínas en regiones ricas en GC, pero no estoy seguro de si lo contrario es cierto, que es la parte importante.
Si lo contrario es cierto , entonces se podría observar la distribución de las regiones codificantes de proteínas en los cromosomas y correlacionarla con el contenido de GC. Si también el tamaño de las regiones codificantes de proteínas en un cromosoma dado es proporcional al tamaño del cromosoma, entonces tendría una razón de por qué el contenido promedio de GC de cada cromosoma es similar.
Sin embargo, reconozco que todo esto es muy especulativo. ¿Alguien tiene mejores ideas?
pitido
grvpanchal