¿Cómo evoluciona el contenido de GC?

Fondo

El contenido de GC se refiere a la frecuencia de pares de bases que son C o G en el genoma, o en otras palabras, el número de pares de bases GC dividido por la suma del número de pares de bases GC más el número de pares de bases AT.

GRAMO C C o norte t mi norte t = norte GRAMO C norte A T + norte GRAMO C

Pregunta

¿Cómo evoluciona el contenido de GC y por qué el contenido de GC difiere entre poblaciones/especies/linajes? ¿Evoluciona solo bajo la deriva genética? ¿Bajo selección? Intuitivamente, diría que la proporción de probabilidades de mutar de A o T a G o C debería ser un factor importante que impulse la evolución del contenido de GC. ¿Lo hace? ¿La tasa de mutación general influye en el contenido de GC? ¿Qué otros rasgos/fuerzas influyen en la evolución del contenido de GC?

Los pares de bases GC son más estables que los pares de bases AU/AT. Puedo imaginar situaciones en las que esto juega un papel, aunque no sé si realmente es un efecto relevante.
Sí, es probablemente un factor importante. Tenga en cuenta que si esta diferencia en la estabilidad es lo único que explica la evolución del contenido de GC, entonces esperaría que existiera muy poca variación entre las especies y el punto de equilibrio debería estar dado por
PAG C GRAMO   |   A T PAG C GRAMO   |   A T + PAG A T   |   C GRAMO
, dónde PAG C GRAMO   |   A T es la tasa de mutación de A o T a C o GRAMO .

Respuestas (1)

Creo que el trabajo clave aquí es 'evolucionar'. Las proporciones generales de GC/AT cambian por mutaciones, cuya tasa es constante. La probabilidad de que, dado un evento de mutación, una base sea sustituida por otra se ha modelado de varias maneras en las que las probabilidades de diferentes mutaciones pueden o no ser las mismas .

En general, el contenido de GC tenderá a acercarse al 50%. Lo que hace que los genomas ricos en GC se vuelvan ricos en GC (60-70%) es que las mutaciones en los pares de bases de GC tienen ventajas selectivas en regiones o en el genoma en general que hacen que se conserven . La tasa de mutación puede no ser diferente (o incluso menor) en organismos ricos en GC (muchos de ellos se encuentran en las profundidades del subsuelo o bajo el agua). Los genomas ricos en GC se producen porque las mutaciones AT->GC transmiten una ventaja y se mantienen.

Las razones por las que el contenido de GC se aleja del 50% se dividen en dos categorías que llamaré entrópicas y selectivas.

Por entrópica me refiero específicamente a las secuencias codificantes de genes y otras características, como los sitios de unión en el ADN u otras características, como los centrómeros, que harán que la proporción general varíe de 1 porque la secuencia está restringida por la información que contiene. Si bien las regiones de codificación tienen una proporción superior a 1 , el contenido de GC tiende a rondar el 54 % . Los eucariotas tienen islas GC, etc., pero esto tampoco cambia en general el contenido de GC

Por lo tanto, los genomas ricos en genes y las características funcionales típicas del genoma no explican realmente algunos de los contenidos de GC espectacularmente altos encontrados; hasta el rango del 70%. Si bien el enlace anterior analiza el sesgo de GC en las regiones de codificación, es un hecho que cualquier parte del genoma que sea simplemente un espaciador entre elementos con funciones específicas variará libremente a GC si es útil.

Los factores selectivos para un alto contenido de GC incluyen, por ejemplo, entornos de alta presión y temperatura, que normalmente se inclinan fuertemente hacia un alto contenido de GC por este mecanismo. Puede imaginar cómo funciona esto: los genomas con alto contenido de GC son termodinámicamente más estables y pueden sobrevivir más fácilmente a las colisiones extramoleculares de mayor energía de esos entornos.

Los genomas ricos en GC no son simples adaptaciones para vivir. Todos los genes para los procesos orientados al ADN, como la transcripción, el empaquetamiento de cromosomas y la ADN polimerasa, tienen que ajustarse mucho. A medida que el organismo se adapta a temperaturas más altas o presiones más altas, cada proteína individual producida también tendrá que cambiar para ser estable y funcionar en las nuevas condiciones . Como tal, estos cambios ocurren solo durante largos tiempos evolutivos. Esta es probablemente una buena parte de la razón por la cual los nichos de arqueas no han sido reemplazados por eubacterias en los más de mil millones de años desde que la vida ha existido en la Tierra.

Gracias por tu respuesta. Aunque no estoy seguro de entender. Déjame tratar de reformularlo de manera diferente y me corregirás. La temperatura o cualquier factor que modifique la tasa de mutación específica de estado a estado modificará el contenido de GC, influirá en el contenido de GC y es probable que esos factores varíen de una especie a otra, lo que explica las diferencias observadas. .
También el tipo de secuencia que consideramos (y la cantidad de secuencias de ADN que son de este tipo en un genoma dado) influyen en el contenido de GC. Las secuencias de codificación, por ejemplo, no tienen la libertad de variar demasiado su información (por lo general, sólo el tercer par de bases es libre de variar). ¿Dijiste algo más? ¿Entendí?
Modifiqué mi respuesta. en resumen, sin embargo, la tasa de mutación puede no ser diferente para estos organismos, las secuencias de codificación pueden migrar al 70% de GC. toda su selección en ciertos entornos. lmk si estoy haciendo un buen caso aquí.
¡Todo está claro ahora! Entendí lo que no entendí ;) Muchas gracias.
¡Alegra oírlo! Ahora se están realizando muchas investigaciones para identificar los procesos que mediaron y aceleraron la adaptación y, por lo tanto, la evolución. En este nivel no hay tanta controversia creo...