¿Qué tan difícil es determinar una estructura 3D de una proteína?

Veo decenas de miles de archivos PDB en Internet. Tengo muchas ganas de determinar una estructura 3D de mi proteína de interés. Escuché que la determinación de la estructura 3D es un procedimiento complejo, costoso y especializado que puede llevar meses o años y es difícil de realizar de forma rutinaria o incluso comprar comercialmente.

¿Podría explicar por qué y qué tan difícil es? ¿Cuáles son los requisitos y el presupuesto que normalmente se necesita para realizar este tipo de experimento?

Realmente depende de la proteína. ¿Qué proteína te interesa? O si quieres mantener ese secreto al menos dinos qué tipo de proteína es... ¿es una proteína integral de membrana o está asociada a la membrana? En caso afirmativo, su experimento será difícil, pero no necesariamente imposible. Si desea hablar sobre el tema, envíeme un correo electrónico a (jan@mbg.au.dk) e intentaré ayudarlo. Soy un biólogo estructural capacitado con experiencia significativa en cristalografía de proteínas.
Por experiencia personal, si su proteína no está asociada a la membrana y generalmente es estable en solución, por lo general se necesitarán entre 5 y 10 mg para encontrar las posibles condiciones de cristalización. Recomiendo comenzar con pantallas comerciales y optimizar a partir de ellas. Tenga en cuenta que puede observar cristales que no son cristales de proteína en ciertas condiciones. Si quieres ayuda envíame un correo electrónico al correo electrónico en mi primer comentario.
@JeppeNielsen ¡Hola, Jeppe! Gracias por su entusiasta y amable respuesta. En un futuro cercano, estoy planeando diseñar una proteína (actualmente una proteína sin membrana) y solo quiero ver el resultado final de la estructura en 3D. Me comunicaré con usted más tarde si necesito su ayuda. ¡Muchos gracias!
Una advertencia antes de entrar de cabeza es que, por supuesto, la cristalografía solo es posible si la proteína es capaz de cristalizar. Si desea saber más sobre la cristalografía biomolecular, lea el libro con el título de cristalografía biomolecular de Bernhard Rupp, es más o menos la fuente de referencia para todos los cristalógrafos de proteínas.
@JeppeNielsen ¡Muchas gracias! Leeré ese libro. ¡Eres tan amable!
Puedo atestiguar por experiencia, ¡la respuesta es "muy"!

Respuestas (2)

La determinación experimental de la estructura de la proteína es difícil: el método más común es la cristalografía de rayos X, que se puede hacer en unos pocos meses si tiene suerte y puede llevar años si no la tiene. El problema con la cristalografía de rayos X es que se necesitan buenos cristales de proteínas y, en la mayoría de los casos, las proteínas no cristalizan muy bien, por lo que se necesita mucho tiempo (y mucha proteína purificada) para obtener el cristal adecuado. (En la sección de comentarios, Cody agregó algunos buenos enlaces con cristalografía de rayos X más detallada para la determinación de la estructura relacionada con la ATP sintasa).

El costo se basa principalmente en los materiales y la mano de obra que necesita para esto, y necesita probar muchas soluciones diferentes para cristalizar su proteína, que no son muy baratas. Si no tiene acceso a equipos especializados para hacer los cristales (principalmente robots de pipeteo) o la medición (línea de rayos X), esto será muy costoso.

La cristalografía requiere cristales de proteínas, que a veces son demasiado difíciles de obtener. Otros métodos que no requieren cristales, como NMR y cryoEM, son aún más difíciles de realizar, aunque dependen menos de la suerte. Estas técnicas se basan en equipos muy costosos y, a menudo, no pueden resolver la estructura con tanta precisión como la cristalografía de proteínas. Entonces, a menos que pueda encontrar una de las pocas personas que tienen experiencia con estos métodos, se encontrará con muchos problemas adicionales.

También existe la predicción de estructura computacional, que solo necesita una computadora poderosa. Sin embargo, a menos que su proteína sea muy similar a una con una estructura conocida , probablemente no funcionará de manera confiable. Como se menciona en los comentarios, hay servidores web para los métodos establecidos y el progreso se realiza constantemente en algoritmos nuevos, por lo que, dependiendo de sus necesidades, definitivamente vale la pena intentar la predicción de la estructura computacional.

Por lo que vale, hay muchos servidores web para el modelado de homología, por lo que todo lo que necesita es una secuencia de proteínas y un navegador.
Tenga en cuenta que la previsibilidad computacional recientemente dio un gran paso adelante y parece funcionar bastante bien (requiere principalmente secuencias de ADN de muchas especies en lugar de similitud con la estructura de proteínas conocida o simulaciones de plegamiento computacional) science.sciencemag.org/content/355/6322/294
Dos artículos interesantes y relevantes que muestran cómo se usa la cristalografía de rayos X para determinar la estructura de la proteína son: Estructura de la ATP sintasa de Paracoccus denitrificans determinada por cristalografía de rayos X a una resolución de 4,0 Å , y una revisión, La ATP sintasa: lo entendido, lo incierto y lo desconocido . Lo que es particularmente bueno de estos es que se ocupan de un complejo de proteínas con el que prácticamente todo el mundo está familiarizado, pero ha sido muy difícil de caracterizar utilizando nuestras técnicas estándar.
De hecho, el enfoque informático es tan difícil (este es un problema combinatorio en el que no es factible explorar todas las posibilidades), que algunos científicos han diseñado Fold It! , un juego donde los jugadores deben encontrar el mejor plegamiento de proteínas. Existe un campo de trabajo en el que los científicos analizan las estrategias de los mejores jugadores para diseñar sus propias heurísticas.

Me ocuparé de la RMN para la determinación de la estructura. Es el método menos común, solo ~ 10% de las estructuras de proteínas se determinan de esta manera, aunque tiene, por ejemplo, ventajas para los ácidos nucleicos y más de un tercio de ellos se resolvieron mediante RMN. Tome cualquier número aquí como estimaciones muy aproximadas, hay muchos factores que influyen en la dificultad y el costo.

Para RMN, el factor más importante es el tamaño. Una proteína estable y de buen comportamiento de 10-20 kD es prácticamente rutinaria. Las proteínas grandes son muy difíciles de medir o directamente imposibles mediante RMN.

Necesita grandes cantidades de proteína para rayos X y RMN, pero en el caso de la RMN también la necesita marcada con isótopos. El etiquetado uniforme de proteínas 15N/13C no es tan costoso si puede expresar su proteína en E. coli en un medio mínimo (alrededor de $ 100 por litro de medio, principalmente en glucosa 13C), pero puede volverse realmente costoso muy rápido si necesita medio completo o algo elegante.

Su proteína debe ser estable en solución durante al menos unos días, un solo experimento 3D puede tardar varios días en medirse. Si su proteína apenas es lo suficientemente estable, también tiene que producir mucha más proteína porque necesita usar muchas muestras para realizar todos los experimentos necesarios. Una complicación aquí es que no se puede agregar mucha sal a una muestra de RMN sin reducir drásticamente la sensibilidad de los experimentos de RMN. Pero algunas proteínas son difíciles de estabilizar en un ambiente bajo en sal.

Necesita algo así como unas pocas semanas de tiempo de medición en un espectrómetro de RMN de alto campo, aunque esto depende mucho del tamaño de la proteína y la concentración que puede lograr en su muestra y la dificultad general de asignar las resonancias de proteínas. Este tipo de espectrómetro puede costar unos cuantos millones y es necesario suministrar nitrógeno líquido y helio líquido para que sigan funcionando. Algo así como un tiempo de medición de $ 1000 por día es un número que he oído sobre el costo, pero hay muchos factores que intervienen en esto y no puedo decir qué tan preciso es este número.

Luego, debe asignar las resonancias en su proteína, lo que lleva a una sola persona varios meses. Esto nuevamente varía mucho dependiendo de la dificultad.

Luego, debe calcular la estructura y, por lo general, esto requiere varias rondas para refinar la asignación y el análisis y rehacer los cálculos. No es realmente costoso en términos de potencia de la computadora, pero requiere bastante trabajo por parte de la persona que ejecuta los cálculos y los verifica.

un artículo de 2007 dice: "La estructura de proteína monomérica más grande resuelta por RMN hasta la fecha es la de la malato sintasa G (MSG), una enzima de 81,4 kDa" ncbi.nlm.nih.gov/pmc/articles/PMC2596980
@DavePhD La letra pequeña es importante aquí, resolvieron el pliegue global de la proteína, esa no es una estructura completa. E incluso para eso tuvieron que sacar bastantes trucos con etiquetado y deuteración específicos. Si no eres Lewis Kay, tratar de resolver la estructura de proteínas tan grandes mediante RMN probablemente no sea una buena idea.