¿Hay algún ejemplo de proteínas sin o con una identidad de secuencia mínima, pero con una estructura muy similar?

¿Qué son y comparten un ancestro común? ¿Cuánto tiempo atrás en el tiempo evolutivo debemos ir para encontrarlos?

Si no se conoce ninguno, ¿qué herramientas computacionales podrían usarse para buscar tales ejemplos?

Su pregunta actual ("¿Hay algún ejemplo de proteínas sin o con una identidad de secuencia mínima, pero con una alta homología estructural?") Usa el término "homología" de manera incorrecta: la homología se refiere a un ancestro común. Entonces, la "homología" es binaria (como estar embarazada), y no existe la "homología estructural" (o "alta homología", etc.). Una pregunta más exacta sería: "¿Hay proteínas con poca similitud de secuencia pero una estructura muy similar (y comparten un ancestro común)?"
Dios mío, tienes razón. Disculpas por el descuido, y la pregunta se editó en consecuencia. ¡Gracias!

Respuestas (4)

La respuesta es que los pliegues comunes se descubren en secuencias que son completamente divergentes donde esencialmente no se puede encontrar alineación por medios convencionales.

El grupo de David Eisenberg creó perfiles basados ​​en alineaciones de estructuras conocidas que eran más sensibles para descubrir si una secuencia de proteína dada estaba relacionada con una estructura dada, resolviendo lo que él llamó el ' problema de plegamiento inverso '. Más recientemente , se han utilizado HMM a partir de secuencias alineadas sin procesar que son incluso más sensibles para predecir si una familia estructural de proteínas dada se puede encontrar en una secuencia de consulta. PsiBlast también merece una mención como método que construye dicho perfil sobre la marcha. Puede volver con secuencias que son tan divergentes que probablemente no estén realmente relacionadas (experiencia personal).

Un ejemplo clásico de esto es la hexocinasa, una enzima que fosforila azúcares, que aparece en eucariotas unicelulares y en todos los animales. Cuando se resolvió la estructura de la actina, se demostró que tenía el mismo pliegue central que la hexoquinasa. La actina es una de las proteínas más venerables conocidas en eurcariotas, por lo que ahora se denomina pliegue de actina. Ninguno de los programas mencionados anteriormente detectaría esta relación. (Acabo de verificar esto con psiblast).

Probablemente no sea cierto todo el tiempo, pero probablemente suceda mucho que las secuencias con el mismo plegamiento de proteína sean tan diferentes que no puedan detectarse por ninguno de estos medios. La mayoría de los genomas que se secuencian tienen docenas o cientos de 'nuevos genes': el 40% de E. coli aún no está caracterizado. O hay nuevos pliegues que aparecen espontáneamente en períodos de tiempo evolutivos cortos o las posibles secuencias para muchos pliegues de proteínas son bastante grandes. Mi expectativa es que una nueva secuencia de proteína pueda surgir con el mismo pliegue con bastante rapidez, especialmente en bacterias.

Todas estas son respuestas útiles, pero creo que esta es la más completa. ¡Gracias!

Este artículo publicado el año pasado, aborda la respuesta a su pregunta, sobre métodos computacionales, menciona 3 algoritmos principales para la alineación estructural de proteínas:

  • Alineación estructural directamente al nivel de los átomos de C.
  • La segunda clase de algoritmos utiliza primero los SSE (Elementos de Estructura Secundaria) para realizar un alineamiento aproximado y luego utiliza los átomos de C.
  • La clase final de algoritmos utiliza hashing geométrico.

Y, finalmente, podría encontrar útil este documento para un ejemplo de este tipo de análisis con análisis estructurales de familias metabólicas.

Referencias:

El grupo de Andrei Lupas estudia esto. Argumenta que la gran mayoría de los pliegues surgieron una sola vez, por lo que las proteínas que comparten un pliegue son homólogas, incluso si sus secuencias han divergido. Véase, por ejemplo, este artículo: " Relaciones evolutivas de las preniltransferasas aromáticas microbianas ", donde muestran que existen sutiles similitudes de secuencia entre dos familias de proteínas del mismo pliegue, lo que sugiere un ancestro común.

Un ejemplo que posiblemente valga la pena echarle un vistazo es la glicoproteína de superficie variable de la forma del torrente sanguíneo de Trypanosoma brucei .

Los tripanosomas son el agente causante de la enfermedad del sueño, y toda la superficie celular está cubierta por una sola glicoproteína llamada glicoproteína de superficie variable o VSG. (ver aquí para más información)

Estos protozoos parásitos tienen la capacidad de 'engañar' la respuesta inmune mediante la variación antigénica. En cualquier momento, solo se expresa un solo VSG en la superficie, pero (muy raramente) un tripanosoma puede expresar un producto del gen VSG diferente. Por lo tanto, si la respuesta inmune logra eliminar todos los tripanosomas que expresan VSG-A, pero existe en la población un solo parásito que ha cambiado de capa, esta variante poliferará ya que efectivamente presenta un antígeno diferente a las defensas del huésped (y una segunda respuesta inmune). resultará).

Hay poca identidad de secuencia entre diferentes VSG pero son homólogos (descienden de un ancestro común).

Se ha resuelto la estructura cristalina del dominio N-terminal de dos VSG diferentes (MITat1.2 e ILTat1.24) ( Blum et al. 1993; Freymann et al ., 1993). A pesar de la baja identidad de secuencia (~16%), las estructuras son casi idénticas .

Otra propiedad muy interesante de todos los VSG es que están anclados covalentemente a la membrana plasmática a través de un ancla de glicosilfosfatidilinositol (terminal C) (o ancla GPI).

Referencias

  • Blum, ML, Down, JA, Gurnett, AM, Carrington, M., Turner, MJ y Wiley, DC (1993) Nature 362 , 603-609 [ pubmed ]

  • Freymann, D., Down, J., Carrington, M., Roditi, I., Turner, M. y Wiley, D. (1990) 2.9 Una estructura de resolución del dominio N-terminal de una glicoproteína de superficie variante de Trypanosoma brucei _ J. Mol. Biol . 216 , 141-160 [ Publicado ]

La siguiente referencia contiene mucha información básica útil y es gratuita para todos.

  • Chattopadhyay, A, Jones, NG, Nietlispach,D, Nielsen, PR, Voorheis, HP, Mott HR, Carrington, M. (2005) Estructura del dominio C-terminal de la glicoproteína de superficie variante de Trypanosoma brucei MITat1.2. J. Biol. química , 280 , 7228-7235 [ Pubmed ] [ pdf ]