Cómo reconocer un motivo conservado de la proteína

Me gustaría asegurarme de que mi razonamiento es correcto. Suponiendo que conozco la secuencia de aminoácidos de la proteína de interés. No puedo decir nada sobre la estructura mirando solo la secuencia de aminoácidos de esta proteína. Pero si conozco esta proteína de otro organismo y se conoce la estructura de esta proteína, entonces puedo comparar ambas secuencias y concluir algo, ¿verdad? lo que quiero decir es que no hay una secuencia específica correspondiente a, por ejemplo, el motivo hélice-dos-vueltas-hélice, y que puedo tomar esta secuencia, verificar si mi proteína la tiene y decir que hay hélice-dos-vueltas. -motivo de hélice o no. Puedo hacer esto solo en comparación con la proteína cuya estructura ya se conoce, ¿verdad?

Sí. Debe conocer un motivo de secuencia (otro ejemplo de eso sería los motivos de unión del factor de transcripción) y luego puede hacer comparaciones de secuencia. Le darán una pista sobre qué estructuras pueden estar presentes, pero aún tendrá que hacer algo de cristalografía para hacer una prueba definitiva. Pero te dará una dirección. La otra posibilidad sería buscar proteínas homólogas de otras especies donde se sepa más sobre la estructura si es posible. Las comparaciones de secuencias le darán aquí una imagen más precisa.
Gracias. 'Tienes que conocer un motivo de secuencia': ¿quieres decir que, por ejemplo, el motivo hélice-dos-vueltas-hélice tiene el mismo valor específico para cada secuencia de proteína? o que necesito identificar ese motivo en la proteína homóloga y luego verificar si tengo la misma secuencia en mi proteína?
He hecho esto para motivos helix-loop-helix. Aquí alineamos una proteína conocida con varias especies diferentes. Y pudimos identificar algunos motivos que se conservaron entre especies mientras que otras regiones no se conservaron. Creo que las proteínas homólogas serían mejores, pero también puedes probar con otras proteínas hélice-giro-hélice.

Respuestas (1)

Me parece que estás preguntando sobre el modelado de homología. En ese caso, sí, debe comparar su proteína de interés con una proteína (o proteínas) de estructura conocida. El modelado de homología en pocas palabras incluye tres (¿cuatro?) pasos: identificación de plantilla/alineación de plantilla, modelado, evaluación de calidad.

Empiece por encontrar una plantilla para su modelado. Esto generalmente se hace mediante la alineación de secuencias, por ejemplo, BLASTing. Preferiblemente, utiliza la alineación de secuencias múltiples que alinea con mayor sensibilidad las regiones conservadas. Entonces desea una plantilla con la mayor identidad de secuencia posible (más del 50 % generalmente produce modelos con aproximadamente 1 Å RMSE [ 1 ] en los átomos de la cadena principal. Evite menos del 30 % donde los errores de modelado aumentan rápidamente).

Hay entonces una serie de diferentes estrategias de modelado ( wikipedia ). Pero básicamente, todos apuntan a predecir la estructura del núcleo de proteína conservado lo mejor posible (que generalmente es lo que realmente le interesa). Los aminoácidos periféricos son más dinámicos y más propensos a la evolución y, por lo tanto, son más difíciles de predecir. Luego, lo más importante, evalúa la calidad de su modelo. Esto se puede hacer calculando violaciones de potenciales estadísticos o energías conformacionales basadas en la física (o usando métodos más avanzados como métodos de regresión multivariante ). Como en todo modelado, este es realmente un paso crucial porque la predicción con un modelo deficiente es engañosa y completamente inútil.

Si no encuentra ninguna plantilla, puede recurrir al apasionante campo de la predicción estructural de proteínas De novo , donde el objetivo es predecir la estructura a partir de la secuencia de aminoácidos únicamente. No estoy muy familiarizado con sus métodos, pero la predicción de novo es difícil (!). No recuerdo ningún número exacto, pero el número de conformaciones en una proteína de tamaño normal es astronómicamente grande, lo que genera grandes desafíos algorítmicos y computacionales. Además, sin ninguna secuencia de referencia, los supuestos del modelo son mayores que los del modelo de homología. Aunque, he oído que el campo ha estado haciendo un gran progreso en los últimos años.


Editar: me llamó la atención que también podría estar preguntando sobre el reconocimiento de pliegues de proteínas. Existe una gran cantidad de herramientas y métodos diferentes para reconocer y localizar dominios de proteínas utilizando la secuencia de aminoácidos como entrada. Muchos de ellos están disponibles como servidores web. Por ejemplo, phyre , que utiliza el perfil de aminoácidos y las estructuras secundarias predichas para buscar bibliotecas de estructuras. Métodos basados ​​en subprocesos como MUSTER . También existe un número basado en modelos ocultos de Markov (HMM). Por ejemplo, FISH , que utiliza HMM anclados a la estructura.