¿Cuál es la distribución de la estructura secundaria por AA en el proteoma humano?

Si uno clasificara cada aminoácido para estar en una bobina, hebra beta o hélice alfa, ¿cuál sería la distribución de estas clases en el proteoma humano?

¿Es 33%-33%-33% o está sesgado? Si es parcial ¿por qué?

Pensé que debería ser más o menos igual, pero analicé todo el proteoma a través de PSIPRED y encontré que la distribución era 60 % de bobina, 30 % de hélice, 10 % de hoja. ¿Por que es esto entonces?

No estoy seguro de lo que estás preguntando aquí. Parece que has respondido a tu propia pregunta sobre la distribución (¡interesante, por cierto!). Entonces, según sus propios datos, obviamente está sesgado. No sé mucho sobre proteínas, soy una persona de genómica, pero ¿por qué asumiría que no hay sesgo? Además, ¿está buscando el porcentaje de aminoácidos totales? ¿Porcentaje de proteína total en cada conformación? Un poco más de detalle sería útil.
Un porcentaje de aminoácidos en cada estructura secundaria. Realmente no creo en mis propios resultados, por lo que recuerdo de la universidad, estos deberían ser casi iguales (o como un pequeño sesgo). hay aproximadamente 20k proteínas en el proteoma humano, si decimos que cada una consta de 500 AA, obtenemos aproximadamente 10 millones de aminoácidos, lo que contrasta con mis resultados, ya que obtengo 6 millones de AA en bobinas, 3 millones en hélice y 1 millón en hojas.
Si bien me opongo firmemente al tono de la respuesta que ha recibido hasta ahora, no veo razón alguna para suponer una distribución equitativa. Las propiedades de las diferentes estructuras no son las mismas, por lo que no tiene sentido esperar tal distribución. Alguna explicación de por qué haría tal suposición podría ser una adición útil a su pregunta.
Lamentablemente, la única respuesta que podría dar es muy vaga. Las distribuciones no son iguales porque estos tres tipos de SSE juegan papeles bastante diferentes en las estructuras 3D. Las hojas generalmente se forman en el núcleo de una estructura plegada y son cortas. Las hélices tienden a acumularse alrededor del exterior y pueden ser más largas. 'Bobina' es todo lo demás y cubre la estructura como bucles largos.
Un problema importante con mi respuesta es la distribución de los pliegues. Si los genomas estuvieran repletos de haces helicoidales, la proporción de hélices aumentaría. Presumiblemente, un organismo con muchas proteínas extracelulares excretadas (que tienden a tener poca estructura secundaria) tendría una mayor proporción de espiral, y así sucesivamente.

Respuestas (1)

La pregunta es por qué la distribución de bobina, hélice alfa y hebra beta es 60:30:10 en lugar de 33:33:33. La respuesta es:

"Por que no"

Esto se debe a que no hay ninguna razón para esperar que los tres tipos de estructura (o en el caso de las bobinas, la falta de estructura*) estén presentes en cantidades iguales en las proteínas. Es como esperar que el porcentaje de intrones, exones y ADN 'basura' sea el mismo, o que el porcentaje de reservas de combustible almacenadas como glucógeno y grasa sea el mismo. Sí, pertenecen a la misma categoría, pero son lo suficientemente diferentes en cada caso como para no sorprenderse si no se requieren en cantidades iguales.

Para comprender esto, es necesario observar un poco más detenidamente la aparición de conformación de hélice alfa o hebra beta en la estructura tridimensional de las proteínas. Se pueden enfatizar tres puntos:

  • Los aminoácidos tienen conformaciones particulares porque son parte de una hélice extendida o una lámina de hebras cuya totalidad conduce a su estabilidad estructural: no tienes una mezcla aleatoria.
  • En muchos casos, las hélices o láminas se presentan en combinaciones particulares para dar una familia de proteínas de estructura general similar. Nuevamente, la idea de mezclas aleatorias no entra en la ecuación.
  • Estas estructuras generales se adaptan a funciones particulares, por lo que la abundancia de proteínas de una familia estructural particular estará determinada por el requerimiento de anticuerpos o transportadores de iones o proteínas transductoras de señales, etc., no por una sacudida de dados.

Las imágenes que ilustran dos de estas familias se muestran a continuación:

Estructura secundaria en proteinasa

(a) muestra proteínas de transporte de iones, predominantemente hélices alfa, mientras que (b) es un dominio de inmunoglobulina con un patrón distintivo de hebras beta (así como algunas hélices). Para obtener más ejemplos e información, sugiero el curso en línea EMBL sobre clasificación de proteínas y Berg et al. en línea, por ejemplo, la Sección 7.3 .

*Nota a pie de página 1: Situaciones en las que se pueden esperar ocurrencias iguales Vale la pena contrastar la situación con la estructura secundaria de la proteína con algunas en las que la expectativa previa bien podría ser para el mismo uso, y la desviación de esto podría considerarse un sesgo y una explicación que vale la pena preguntar por:

  • La diferente proporción de los 20 aminoácidos en las proteínas (aunque un químico no esperaría proporciones iguales)
  • El uso diferente de codones sinónimos del código genético en varias especies y ARNm.
  • El uso diferente de moléculas similares con un alto potencial de transferencia de grupos fosforilo: ATP, GTP, UTP y CTP (a menudo denominadas vagamente "alta energía")

*Nota al pie 2: Una bobina no es una estructura secundaria

Como se indica en la entrada de Wikipedia para Estructura secundaria de proteínas :

La espiral aleatoria no es una verdadera estructura secundaria, pero es la clase de conformaciones que indican una ausencia de estructura secundaria regular.

Podría mencionarse con respecto a la estructura de la proteína que existen motivos tridimensionales más pequeños que el análisis citado no considera. Estos tampoco ocurren en proporciones iguales, para gran sorpresa de nadie.

Los votos sobre una pregunta no tienen nada que ver con "compartir la lógica científica equivocada de la pregunta". Con el debido respeto, baja de tu caballo alto. Lo voté porque sentí que las preguntas subyacentes (¿por qué se observa tal distribución? ¿Por qué son más comunes las bobinas?) son interesantes y vale la pena investigarlas. Lamentablemente, su respuesta no aborda nada en la pregunta, aparte de la premisa obviamente defectuosa.
Esto no es una respuesta, lo siento. Esto es algo retórico. Recuerdo algo de la universidad que los porcentajes de estructuras secundarias son más o menos iguales. Esto debe ser un hecho conocido desde hace mucho tiempo (ya sea cierto o incorrecto) y todo lo que quiero es una confirmación.
David, veo en tu perfil que has hecho algunos trabajos estructurales. ¿Por qué no mejora esta respuesta y agrega algo sobre la estabilidad relativa, la plasticidad funcional o cualquier otra propiedad relevante que sea diferente en las diferentes conformaciones de proteínas y cómo se pueden usar para explicar la proporción observada?
@terdon — Me quedaré donde estoy, estoy bastante cómodo. Ciertamente respondí la pregunta. La razón por la que difieren del azar, esa era la pregunta, es porque no hay razón para que sean aleatorios. Si la pregunta hubiera sido por qué hay más hélice que hoja en las proteínas, habría votado para cerrar ya que la respuesta es una cuestión de opinión. Todo lo que obtienes es el tipo de argumento circular sobre algo que tiene una utilidad más general. El cartel necesita alejarse de su computadora y leer sobre proteínas.
@GáborErdős — Tu memoria de la universidad es defectuosa o te dijeron mentiras. No es un hecho, conocido desde hace mucho tiempo o no. Si no me cree, le sugiero que busque en Internet (o lea algunos libros) para encontrar evidencia de esto y lo cite en su pregunta.
@terdon: eliminé la oración que parecía ofender. Y, por cierto, mi trabajo sobre motivos de proteínas es principalmente computacional: mi colega es el químico de proteínas.
@GáborErdős: ahora he agregado información a mi respuesta para ayudarlo a comprender por qué su premisa era incorrecta. También reestructuré mi respuesta y proporcioné sugerencias de lectura. Si está utilizando herramientas bioinformáticas, aún debe pensar en la estructura y la biología molecular de los conjuntos de datos en los que está trabajando.