Parámetros de estructura de proteínas

Me pregunto sobre el conjunto mínimo de parámetros necesarios para definir la estructura de una proteína. Según tengo entendido, la geometría de la columna vertebral está definida por los ángulos phi y psi (ángulos de torsión), y luego, a partir de esta plantilla, se definen los rotámeros de la cadena lateral. ¿Es esto suficiente para producir una estructura geométrica, o hay otros factores involucrados?

En una nota relacionada, ¿cómo se comparan exactamente dos estructuras de proteínas? A menudo veo referencias al porcentaje de similitud, pero ¿qué significa esto realmente? En el Banco de datos de proteínas, se dan las coordenadas atómicas, pero mi intuición es que las coordenadas solo son importantes en relación con todos los demás aminoácidos de la cadena. En otras palabras, la comparación de coordenadas absolutas parecería no ser informativa.

Si busca una longitud de datos mínima, también debe considerar las estructuras que ocurren comúnmente: piense en la codificación Huffman . Las hélices alfa y las láminas plegadas beta, por ejemplo, son una gran cantidad de datos que probablemente se puedan comprimir con bastante facilidad. También se me ocurre que uno podría definir parámetros muy aproximados que dan muchas configuraciones posibles, pero solo una estable, entre otros atajos.
Ah, punto interesante que no había considerado (codificación). Creo que voy más por parámetros geométricos. Quizás otra forma de decirlo: ¿los ángulos de torsión y los rotámeros de cadena lateral son suficientes para determinar completamente la estructura de una proteína?
¿Por "estructura de la proteína" te refieres a la posición de los átomos en una proteína en un punto particular en el tiempo?
@LuboAntonov Sí, exactamente, específicamente el estado plegado.
Tu porcentaje de similitud es identidad de secuencia.

Respuestas (2)

Depende de cuán precisa quieras que sea la descripción. Normalmente se suponen longitudes de enlace ideales, por lo que la estructura se puede describir usando ángulos φ, ψ, ω (para la columna vertebral) y χ1-χ5 (para la cadena lateral). Esto es lo que se usa en la mayoría de los casos. Sin embargo, las posiciones de los hidrógenos en las cadenas laterales no están definidas únicamente por esta descripción. Esto tampoco describe los enlaces de hidrógeno y los puentes disulfuro, pero podrían deducirse de las posiciones relativas.

Puede obtener más información aquí: http://kinemage.biochem.duke.edu/teaching/anatax/html/anatax.1b.html

Sin embargo, esta descripción debería ser suficiente para la mayoría de las aplicaciones.

Comparación de estructuras de proteínas

Hay una serie de cosas que puede observar, como la desviación cuadrática media. Este método compara las coordenadas de dos estructuras superponiéndolas una encima de la otra.

  • RMSD : esto se implementa en el Modelador de modelado o se puede usar en USCF Chimera
    • RMSD proporcionará un número en angstroms al cuadrado, donde los valores más altos indican diferencias estructurales. Un RMSD de 0,0 indicaría que las estructuras son idénticas. Hay diferentes tipos de cálculos RMSD, como C-alfa, columna vertebral y todos los átomos. C-alfa RMSD solo observará los átomos de C-alfa para calcular el RMSD. Backbone RMSD observará solo la columna vertebral y all-atom tendrá en cuenta todos los átomos para calcular el RMSD.

Otras cosas para mirar

  • Suponiendo que la estructura la haya creado usted mismo, ¿se minimizó la estructura? ¿Para eliminar los enfrentamientos?

  • Además de los ángulos phi, psi y los mencionados anteriormente, ¿ha verificado si hay choques en su estructura? Los conflictos se pueden comprobar en la quimera de USCF, que comprueba si hay conflictos con un valor predeterminado de 0,6 Angstrom van der Wall radios superpuestos.