¿Hay selección contra proteínas largas y genes largos?

pensamiento de fondo

Titina y TTN

La titina es la proteína más grande del genoma humano con 33423 aminoácidos. La titina está codificada por el gen TTN que debe ser al menos 3 33423 100 k b largo. Observar la entrada de NCBI para el gen TTN indica que TTN en realidad tiene una longitud de aproximadamente 240 kb.

Tasa de transcripción

La tasa de transcripción promedio ( Ref. ) es de alrededor de 1,5 kb por minuto. Por lo tanto, toma alrededor 240 k 1.5 k 60 2,5 horas para transcribir TTN en ARNm. Este ARNm luego debe empalmarse antes de estar disponible para ser traducido. En consecuencia, no creo que sea posible que la traducción ocurra al mismo tiempo que la transcripción, pero bien podría estar equivocado.

Tasa de traducción

La velocidad de traducción es de unos 8,4 aminoácidos por segundo ( Ref. ). Por lo tanto, toma alrededor 33423 8.4 3600 1 hora para traducir la proteína. Claro, varios ribosomas pueden traducir el ARNm al mismo tiempo, pero sigue siendo que lleva 1 hora sintetizar al menos una proteína.

Tasa de transcripción + traducción

Suponiendo que la traducción no se produzca al mismo tiempo que la transcripción, el tiempo total para crear la primera proteína de titina es de unas 3,5 horas.

Media vida

La vida media de una proteína humana típica es de 6,9 ​​horas ( Ref. ). Intuitivamente, esperaría una correlación negativa entre el tamaño del ARNm y la vida media del ARNm.

Half-life y Transcripción + Tasa de traducción

Debido a que el tiempo para producir la primera proteína es aproximadamente la mitad de la vida media, significa que una cuarta parte de cada ARNm que se produce nunca daría lugar a una sola proteína porque se degradaría antes o después de que comience la traducción.

Suena como un costo importante y me sorprendería si un gen o una proteína pudieran ser más largos.

Pregunta

¿Existe evidencia de selección contra proteínas largas y genes largos?

¿Hay proteínas mucho más largas que la titina en otras especies?

¿Exagero el costo que representa, ya sea al no considerar que una tasa promedio (como la tasa de transcripción) no es representativa de la tasa real para un gen/proteína típicamente largo o al suponer que es costoso crear toneladas de ARNm que no t nunca ser traducido?

Estás olvidando que habría muchos ribosomas en un solo ARNm. Además, podría haber múltiples polimerasas de ARN que transcriban el gen.
Por supuesto. Todavía queda que lleva 3,5 horas sintetizar la primera proteína y espero que falle el 25% de las veces.
Digamos que se necesitan 3,5 horas para producir una sola proteína desde el momento en que se inicia la transcripción. Sin embargo, la titina es una proteína estructural y no es un tipo de proteína que tenga que responder rápidamente a los estímulos. Una vez que la proteína alcanza el estado estacionario, se produce de forma continua. Imagine un evento de transcripción que comenzó en el momento tque culmina en la producción de proteínas en t+3.5h. Digamos que hay otro evento de transcripción que comenzó en t+0.1hel cual terminará produciendo proteína en t+3.6h. Obtienes una molécula de proteína en cada 0.1h. ¿Entiendes mi punto?
De manera similar, hay múltiples ribosomas en el ARNm. Si se necesita 1hque un solo ribosoma atraviese el ORF y digamos que hay varios ribosomas en el ARNm colocado 0.1h(conviértalo en #codones), terminará obteniendo una molécula de proteína de una molécula de ARNm cada 0.1h.
Creo que entiendo este punto. Entiendo que es factible producir proteínas a una tasa deseada constante. Todavía queda que mucho mRNA se degradará sin ser útil y que mucho mRNA se degradará durante la traducción, quedando la mitad de proteínas sintetizadas que tampoco sirven. Todo esto representa un costo mucho más importante para un gen largo y una proteína larga que para un gen corto y una proteína corta. ¡Gracias por tu ayuda!
Los ARNm pueden ser bastante estables.

Respuestas (2)

¿Existe evidencia de selección contra proteínas largas y genes largos?

No tengo conocimiento de ninguna evidencia de este tipo y una búsqueda superficial en Google no reveló estudios que investigaran una correlación entre la selección de genes y el tamaño de los genes. Sin embargo, cuanto más grande es un gen, mayor es la probabilidad de una mutación perjudicial dentro de dicho gen, por lo que espero que haya algún límite en el tamaño que los genes pueden alcanzar y ser estables a lo largo de la evolución.

¿Hay proteínas mucho más largas que la titina en otras especies?

Hasta la fecha, la titina es la proteína más grande conocida

¿Exagero el costo que representa, ya sea al no considerar que una tasa promedio (como la tasa de transcripción) no es representativa de la tasa real para un gen/proteína típicamente largo o al suponer que es costoso crear toneladas de ARNm que no t nunca ser traducido?

Me gusta mucho cómo estimaste el costo de tiempo de producir titina. Sin embargo, como ya sospechas, creo que tienes varios defectos en tus suposiciones.

En primer lugar, la estabilidad del ARNm y las proteínas varía mucho y depende en gran medida de sus secuencias. La vida media de las proteínas puede variar de minutos a años . La proteína titina tiene una vida media de ~70 h .

De manera similar, la estabilidad del ARNm varía desde minutos hasta > 12 h . Se identificó especialmente que los genes domésticos y estructurales tienen ARNm con vidas medias largas.

Tanto la estabilidad de la proteína como la del ARNm no se rigen simplemente por la descomposición aleatoria, sino más bien por una degradación estrictamente regulada. Para las proteínas, un ejemplo es la ubiquitinilación, que es un proceso en el que se reconocen ciertas secuencias de aminoácidos y hacen que la proteína se ubiquitinile, lo que a su vez desencadena la degradación a través del proteasoma. Para mRNA, la estructura secundaria es crucial ya que ciertas estructuras de bucle pueden ser reconocidas por RNAses. Por lo tanto, los tiempos de vida promedio de proteína/ARNm no ayudan a estimar el recambio real de una proteína específica.

+1 Gracias por tu respuesta, fue muy útil. Además de confirmar lo que sospechaba que podría salir mal con mis estimaciones rápidas, me di cuenta especialmente de que un decaimiento exponencial negativo aleatorio no es un buen modelo para el decaimiento del ARNm. Te agradezco que hagas referencia a la mutación (que es de mi tu L , dónde tu es la tasa de mutación por par de bases y L el tamaño de un gen en una población infinita), ya que es probable que sea un factor mucho más importante que el que produje en mis estimaciones rápidas. Gracias
Esperaría que los genes con la mayor probabilidad de una mutación perjudicial estuvieran bajo una presión evolutiva más fuerte. El documento genoma.cshlp.org/content/24/9/1497.full afirma que "los genes más largos tienen menos probabilidades de producir duplicados y más probabilidades de exhibir empalmes alternativos".

En relación con sus preguntas: una cosa que se sabe es que los genes más antiguos, es decir, los genes que aparecen antes en la evolución son más largos que los genes nuevos. Además, los genes nuevos evolucionan más rápido que los antiguos. Por lo tanto, los genes nuevos suelen ser cortos y tienden a agrandarse con el tiempo.

Relación inversa entre la tasa evolutiva y la edad de los genes de los mamíferos