dónde encontrar la distribución de frecuencia relativa de codones sinónimos

La mayoría de los aminoácidos pueden estar codificados por más de un codón. Por ejemplo, Serinepuede ser codificado por cualquiera de {UCU, UCC, UCA, UCG, AGU, AGC}.

Mi pregunta tiene dos partes:

1) ¿Cuáles son las frecuencias relativas de esos codones? Esta pregunta se puede formular de manera equivalente en términos probabilísticos: ¿Cuál es la probabilidad de que un aminoácido determinado haya sido codificado por un codón en particular?

2) ¿Depende esta probabilidad del contexto (los codones/aminoácidos vecinos)?

Respuestas (2)

El fenómeno de usar diferentes codones con diferentes probabilidades se llama sesgo de uso de codones . La forma en que se usan los diferentes codones a veces es bastante diferente entre las especies y requiere cierto cuidado. Esto es especialmente cierto cuando desea sobreexpresar secuencias en bacterias para producir proteínas, lo que puede necesitar la optimización de codones para garantizar un uso óptimo de codones (de lo contrario, los ARNt raros pueden ralentizar el proceso de traducción). Hay una base de datos (basada en el NCBI Genbank) que le brinda las probabilidades de codones para diferentes especies:

Además, estos documentos pueden ser interesantes:

Con respecto a su segunda pregunta, no creo (y tampoco he encontrado ninguna evidencia) que el uso de codones dependa de los vecinos.

Los sesgos de uso de codones dependen de la especie, por lo que es posible que deba medirlo para el genoma o el conjunto de genes que le interesan.

Este sesgo se correlaciona, al menos en algunos casos, con la composición del genoma en términos de A, T, G y C (consulte la figura 3 de este artículo sobre las cianobacterias ). Entonces, en cierto sentido, depende del contexto si incluye la composición de nucleótidos en lo que llama "contexto".