¿Existe variación en la relación AT/CG a lo largo de las especies?

Las reglas de Chargaff dicen que el número de Adenina del número de Timina en un genoma es igual (nA=nT) y similarmente nC=nG. Esto tiene un sentido obvio sabiendo que C se une a G y A a T.

Pero ¿qué pasa con la relación norte A + norte T norte C + norte GRAMO ?

¿Existe una variación a lo largo de las especies de esta proporción que sea más alta de lo esperado por procesos aleatorios? En caso afirmativo, ¿qué causa esta variación?

Respuestas (3)

Esa proporción es esencialmente, como señaló WYSIWYG, llamada contenido de GC . En realidad, el contenido de GC se informa como ( GRAMO + C ) / ( A + C + GRAMO + T ) , convertido a porcentaje; es decir, qué porcentaje del genoma es G o C.

Existe una gran variación en el contenido de GC, tanto entre especies como dentro del propio genoma de una especie determinada. Por ejemplo, en humanos, el primer intrón y exón son generalmente más ricos en GC que los siguientes intrones/exones. 1 Los propios genes a menudo se encuentran en áreas superiores de GC, 2 , 11 en particular, las islas CpG se encuentran cerca de una gran cantidad de promotores (de mamíferos). 3

Entre especies, puede haber una gran diferencia. La levadura y Arabidopsis rondan el 35 % 4 , 5 mientras que Plasmodium falciparum ronda el 24 %; 6 Carsonella son aún más bajos, en torno al 16,5%. 14 Por otro lado, el plancton Emiliania huxleyi ronda el 65% 7 . Podemos usar estas diferencias para estudiar la historia genómica. Las bacterias a menudo tienen genes de todas partes gracias a la transferencia horizontal de genes, y el contenido de GC se puede usar para diferenciar entre sus propios genes y los de la transferencia horizontal de genes; 8 un buen ejemplo es el sistema CRISPR-Cas, 9 ¡incluso en un virus! 10

Aquí hay una lista de algunas cosas con las que se correlaciona el contenido genómico de GC: 15

  • tamaño del genoma
  • si la bacteria es de vida libre o no
  • el entorno
  • aerobiosis
  • utilización de nitrógeno

En el laboratorio, un alto contenido de GC a menudo significa una región más difícil para trabajar, ya que la presencia de tres enlaces en lugar de dos (entre A y T) requiere más energía para romperse; 12 cualquier cosa que involucre cebadores puede volverse más molesta, incluyendo (especialmente, para algunos) la secuenciación. Existe la teoría de que un alto contenido de GC sería una adaptación a las altas temperaturas para evitar daños en el ADN, pero eso es controvertido. 13 , 16 , 17 , 18

Sí, esa relación varía y generalmente se denomina contenido de GC , que se expresa como porcentaje. Anteriormente, la gente usaba el contenido de GC como uno de los identificadores de un grupo de organismos.

Aunque ha habido bastantes estudios sobre la evolución y variación del contenido de GC, todavía no hay una explicación clara de por qué ciertos organismos tienen un cierto nivel de contenido de GC; no ejerce un gran sesgo en la composición de proteínas, aunque se argumenta. que controla la expresión de proteínas. La mutabilidad química es mayor por C->Uy A->Gdebido a la desaminación, pero este podría no ser el único criterio. Puede consultar esta buena revisión para obtener más detalles.

Bueno. Leí esa reseña completamente, justo ahora. Aunque es agradable, no resume todo. Pero es posible que encuentre muchos análisis sobre este tema. Además, A no se desamina a G. Se convierte en inosina, que puede formar un par de bases con C y, por lo tanto, puede leerse como G.

El contenido de GC varía mucho entre los procariotas y se utiliza como una característica taxonómica. Está especialmente elevado en los extremófilos, como los halófilos y los termófilos, y se cree que es una adaptación a las altas temperaturas y otras tensiones químicas y físicas. Los enlaces GC son más fuertes que los AT, por lo que se supone que actúa como una protección contra los agentes desnaturalizantes.