Fondo
El contenido de GC se refiere a la frecuencia de pares de bases que son C o G en el genoma, o en otras palabras, el número de pares de bases GC dividido por la suma del número de pares de bases GC más el número de pares de bases AT.
Pregunta
¿Cómo evoluciona el contenido de GC y por qué el contenido de GC difiere entre poblaciones/especies/linajes? ¿Evoluciona solo bajo la deriva genética? ¿Bajo selección? Intuitivamente, diría que la proporción de probabilidades de mutar de A o T a G o C debería ser un factor importante que impulse la evolución del contenido de GC. ¿Lo hace? ¿La tasa de mutación general influye en el contenido de GC? ¿Qué otros rasgos/fuerzas influyen en la evolución del contenido de GC?
Creo que el trabajo clave aquí es 'evolucionar'. Las proporciones generales de GC/AT cambian por mutaciones, cuya tasa es constante. La probabilidad de que, dado un evento de mutación, una base sea sustituida por otra se ha modelado de varias maneras en las que las probabilidades de diferentes mutaciones pueden o no ser las mismas .
En general, el contenido de GC tenderá a acercarse al 50%. Lo que hace que los genomas ricos en GC se vuelvan ricos en GC (60-70%) es que las mutaciones en los pares de bases de GC tienen ventajas selectivas en regiones o en el genoma en general que hacen que se conserven . La tasa de mutación puede no ser diferente (o incluso menor) en organismos ricos en GC (muchos de ellos se encuentran en las profundidades del subsuelo o bajo el agua). Los genomas ricos en GC se producen porque las mutaciones AT->GC transmiten una ventaja y se mantienen.
Las razones por las que el contenido de GC se aleja del 50% se dividen en dos categorías que llamaré entrópicas y selectivas.
Por entrópica me refiero específicamente a las secuencias codificantes de genes y otras características, como los sitios de unión en el ADN u otras características, como los centrómeros, que harán que la proporción general varíe de 1 porque la secuencia está restringida por la información que contiene. Si bien las regiones de codificación tienen una proporción superior a 1 , el contenido de GC tiende a rondar el 54 % . Los eucariotas tienen islas GC, etc., pero esto tampoco cambia en general el contenido de GC
Por lo tanto, los genomas ricos en genes y las características funcionales típicas del genoma no explican realmente algunos de los contenidos de GC espectacularmente altos encontrados; hasta el rango del 70%. Si bien el enlace anterior analiza el sesgo de GC en las regiones de codificación, es un hecho que cualquier parte del genoma que sea simplemente un espaciador entre elementos con funciones específicas variará libremente a GC si es útil.
Los factores selectivos para un alto contenido de GC incluyen, por ejemplo, entornos de alta presión y temperatura, que normalmente se inclinan fuertemente hacia un alto contenido de GC por este mecanismo. Puede imaginar cómo funciona esto: los genomas con alto contenido de GC son termodinámicamente más estables y pueden sobrevivir más fácilmente a las colisiones extramoleculares de mayor energía de esos entornos.
Los genomas ricos en GC no son simples adaptaciones para vivir. Todos los genes para los procesos orientados al ADN, como la transcripción, el empaquetamiento de cromosomas y la ADN polimerasa, tienen que ajustarse mucho. A medida que el organismo se adapta a temperaturas más altas o presiones más altas, cada proteína individual producida también tendrá que cambiar para ser estable y funcionar en las nuevas condiciones . Como tal, estos cambios ocurren solo durante largos tiempos evolutivos. Esta es probablemente una buena parte de la razón por la cual los nichos de arqueas no han sido reemplazados por eubacterias en los más de mil millones de años desde que la vida ha existido en la Tierra.
Científico loco
Remi.b