¿Cuál es el tamaño de marco óptimo para los métodos de predicción de estructuras secundarias de proteínas?

toda la pregunta es

¿Cuál es el tamaño de marco óptimo para los métodos de predicción de estructuras secundarias de proteínas de segunda y tercera generación? Justifica tu respuesta.

Recuerdo que tiene algo que ver con la longitud promedio de la hélice alfa. Más específicamente, 3 en ambos lados de un sitio. Entonces, en total, la longitud del marco debería ser 7. Pero no recuerdo el motivo detrás del argumento.

¿Qué piensas?


Según lo que dijo mi profesor en clase, la reconstrucción de la estructura secundaria de proteínas de segunda y tercera generación se basa en datos estadísticos de varios residuos consecutivos. Supongo que lo que quiso decir con "tamaño de fotograma" es cuántos residuos adyacentes debemos tener en cuenta en el algoritmo.

Respuestas (3)

Por tamaño de marco, ¿te refieres a ventana corredera?

Sé que si desea predecir una estructura secundaria de una proteína transmembrana, entonces el tamaño de su ventana debe ser de 20 aminoácidos (esta es la longitud promedio de 1 hélice alfa transmembrana que se extiende a través de la membrana).

Encontré este artículo de Chen, Kurgan y Ruan [1] .

Básicamente dice que el tamaño de la ventana depende del tipo de patrón que esté buscando, pero en general, 19 residuos deberían ser óptimos.

Además, los predictores de estructuras secundarias se basan en muchas características como la hidrofobicidad, las coordenadas faltantes en las estructuras de rayos X, los factores B, los motivos, etc.


  1. Chen K, Kurgan L, Ruan J. 2006. Optimización del tamaño de la ventana deslizante para la predicción de la estructura de proteínas. CIBCB '06: Simposio IEEE de 2006 sobre inteligencia computacional y bioinformática y biología computacional, pp.1-7, 28-29, doi:10.1109/CIBCB.2006.330959.
Ese es el problema de la biología computacional: a veces es difícil encontrar qué significa exactamente un término. Pero creo que mi profesor pidió una predicción general de la estructura secundaria de la proteína, no una proteína transmembrana.

Bien, entonces 2 respuestas, cada una con respecto a diferentes segmentos de proteínas de diferentes tipos/funciones/estructuras, pero no una respuesta que realmente llegue al corazón de la pregunta. Debido a la etiqueta de tarea, estoy tentado a no responder; esto es algo que el estudiante debe lograr por su cuenta. Entonces, daré una respuesta general para que empieces a pensar. Básicamente, dicho valor, ya sea 7 o 20 para TM o 13, se determina empíricamente.

Descubrí que 13 funcionaba mejor para las redes neuronales y el rendimiento de SVM de la información de la estructura secundaria cuando ejecuté esto en R.

¿Alguna razón detrás de esto?