Me gustaría asegurarme de que mi razonamiento es correcto. Suponiendo que conozco la secuencia de aminoácidos de la proteína de interés. No puedo decir nada sobre la estructura mirando solo la secuencia de aminoácidos de esta proteína. Pero si conozco esta proteína de otro organismo y se conoce la estructura de esta proteína, entonces puedo comparar ambas secuencias y concluir algo, ¿verdad? lo que quiero decir es que no hay una secuencia específica correspondiente a, por ejemplo, el motivo hélice-dos-vueltas-hélice, y que puedo tomar esta secuencia, verificar si mi proteína la tiene y decir que hay hélice-dos-vueltas. -motivo de hélice o no. Puedo hacer esto solo en comparación con la proteína cuya estructura ya se conoce, ¿verdad?
Me parece que estás preguntando sobre el modelado de homología. En ese caso, sí, debe comparar su proteína de interés con una proteína (o proteínas) de estructura conocida. El modelado de homología en pocas palabras incluye tres (¿cuatro?) pasos: identificación de plantilla/alineación de plantilla, modelado, evaluación de calidad.
Empiece por encontrar una plantilla para su modelado. Esto generalmente se hace mediante la alineación de secuencias, por ejemplo, BLASTing. Preferiblemente, utiliza la alineación de secuencias múltiples que alinea con mayor sensibilidad las regiones conservadas. Entonces desea una plantilla con la mayor identidad de secuencia posible (más del 50 % generalmente produce modelos con aproximadamente 1 Å RMSE [ 1 ] en los átomos de la cadena principal. Evite menos del 30 % donde los errores de modelado aumentan rápidamente).
Hay entonces una serie de diferentes estrategias de modelado ( wikipedia ). Pero básicamente, todos apuntan a predecir la estructura del núcleo de proteína conservado lo mejor posible (que generalmente es lo que realmente le interesa). Los aminoácidos periféricos son más dinámicos y más propensos a la evolución y, por lo tanto, son más difíciles de predecir. Luego, lo más importante, evalúa la calidad de su modelo. Esto se puede hacer calculando violaciones de potenciales estadísticos o energías conformacionales basadas en la física (o usando métodos más avanzados como métodos de regresión multivariante ). Como en todo modelado, este es realmente un paso crucial porque la predicción con un modelo deficiente es engañosa y completamente inútil.
Si no encuentra ninguna plantilla, puede recurrir al apasionante campo de la predicción estructural de proteínas De novo , donde el objetivo es predecir la estructura a partir de la secuencia de aminoácidos únicamente. No estoy muy familiarizado con sus métodos, pero la predicción de novo es difícil (!). No recuerdo ningún número exacto, pero el número de conformaciones en una proteína de tamaño normal es astronómicamente grande, lo que genera grandes desafíos algorítmicos y computacionales. Además, sin ninguna secuencia de referencia, los supuestos del modelo son mayores que los del modelo de homología. Aunque, he oído que el campo ha estado haciendo un gran progreso en los últimos años.
Editar: me llamó la atención que también podría estar preguntando sobre el reconocimiento de pliegues de proteínas. Existe una gran cantidad de herramientas y métodos diferentes para reconocer y localizar dominios de proteínas utilizando la secuencia de aminoácidos como entrada. Muchos de ellos están disponibles como servidores web. Por ejemplo, phyre , que utiliza el perfil de aminoácidos y las estructuras secundarias predichas para buscar bibliotecas de estructuras. Métodos basados en subprocesos como MUSTER . También existe un número basado en modelos ocultos de Markov (HMM). Por ejemplo, FISH , que utiliza HMM anclados a la estructura.
cris
ala
cris