¿Cómo se aislaron los primeros genes de bibliotecas genómicas o de ADNc sin conocer una sonda de hibridación?

Retrocedamos en el tiempo hasta alrededor de 1975. Tengo entendido que en ese momento (o al menos al final de la década), se habían creado bibliotecas genómicas y de cDNA para algunos organismos, por ejemplo, conejos. Estoy interesado en la lógica de las técnicas que primero usaron estas bibliotecas para aislar genes que codifican proteínas particulares. Nota: no estoy interesado en cómo aislaríamos un gen hoy; Quiero entender la historia.

Primero, considere el siguiente experimento mental. Digamos que es alrededor de 1975. La única tarea para mi clase de biología de Cal Tech es increíble: dice lo siguiente. El instructor (¿Tom Maniastis?) me entrega una proteína junto con las células de las que se aisló la proteína, así como bibliotecas genómicas y de ADNc del organismo que produce la proteína; el desafío es aislar el gen que codifica la proteína. No sé nada sobre la proteína excepto que el producto que me han dado es puro.

Por supuesto, la idea básica es simple: aislar el gen examinando las bibliotecas con una sonda de ácido nucleico radiactivo y usando un ensayo de hibridación. Pero, por desgracia, no tengo una sonda complementaria: ¡todo lo que tengo es la proteína! ¿Qué debo hacer?

Aquí hay una solución que puedo imaginar. (No sé si fue posible alrededor de 1975, y mucho menos si realmente sucedió). Podría intentar aislar el ARNm que codifica para mi proteína (pero, ¿cómo hacerlo ? ), luego radiomarcarlo y usar el ARNm radiomarcado. como sonda en un ensayo de hibridación en la biblioteca de ADNc (no en la biblioteca genómica, ya que el ADN sin procesar podría tener regiones no codificantes).

  1. ¿Esto habría funcionado?
  2. ¿Alguien realmente hizo esto?
  3. Si la respuesta a (1) o (2) es sí, ¿cómo se podría averiguar qué ARNm codifica para la proteína?

La pregunta, en esencia, es cómo llegar al ADN, dada solo una proteína, alrededor de 1975.

Tengo curiosidad por saber por qué publicaste aquí. Si realmente está en Caltech y solo quiere saber la respuesta, debe ser lo suficientemente inteligente como para hacer una búsqueda bibliográfica y encontrar la respuesta. Sin embargo, nuevamente, si estás en Caltech, presumiblemente eres lo suficientemente inteligente como para querer resolverlo por ti mismo, por lo que no querrás que aquellos de nosotros (yo) que estuvimos en 1975 te dimos la respuesta (que no lo haré) . Como usted mismo admite, su propuesta es defectuosa ("¿cómo aislar el ARNm?"). ¿Quieres una pista o una discusión? Eso no es para lo que es SE Biology. Dime por qué no debería votar para cerrar.
@David: No estoy en Cal Tech. Soy un estudiante graduado en matemáticas en historia y filosofía de la ciencia. Dije explícitamente que es un experimento mental. No sé cómo encontrar el resultado en la literatura. Si desea una forma diferente de hacer la pregunta: dígame cómo Maniatis et al 76 y 78 obtuvieron sondas de insulina de conejo de ARNm. No estoy tratando de iniciar una discusión: quiero la respuesta. Encuentro cínico e innecesario que asumas que no quería la respuesta.
Otra posible solución: obtener la secuencia de aminoácidos de la proteína (utilizando la técnica de Sanger), luego sintetizar muchas sondas de ARN o ADN compatibles con ella (habrá un gran número, gracias a la degeneración del código genético). Pero, ¿era posible entonces la síntesis? No sé lo suficiente de la historia para saber cuál de estos métodos podría haberse hecho a finales de los 70.
No estaba siendo sincronizado, solo estaba tratando de encontrar el contexto de su pregunta (a la que nadie más había respondido). Su última sugerencia es un uso más lógico de la idea de proteína pura. Podría pensar qué más puede hacer con una proteína pura y también, como mencionó las células, por qué las proteínas como la insulina y la globina eran "frutas maduras". Estoy un poco ocupado en este momento, pero responderé a su debido tiempo si nadie más lo hace.
Gracias. Supongo que nadie respondió porque otros no saben la respuesta: es un problema no trivial, no se puede buscar en Google ni se puede buscar fácilmente. Sé que la insulina y la globina fueron producidas en exceso por los insulinomas y los glóbulos rojos, por lo que sus ARNm eran abundantes. Pero, ¿cómo aislar el ARNm responsable de la insulina, digamos, en particular?
Este artículo parece ser el primero en aislar el gen de la insulina de rata. Lo convertiré en una respuesta más tarde si encuentro el tiempo.
Muchos genes responsables de un fenotipo dado fueron descubiertos mediante pantallas directas usando transposones marcados o mapeo de complementación. También podría imaginar un escenario en el que la secuencia de la proteína se usa para crear un oligonucleótido degenerado para sondear una biblioteca de cDNA o gDNA.
@canadianer: gracias por tus comentarios. No sé qué son las "pantallas de avance que usan transposones marcados" y el "mapeo de complementación". tal vez podría buscarlos en Google, pero una descripción sucinta de alto nivel de la idea podría funcionar muy bien como respuesta. Mientras tanto, leeré el artículo sobre ratas de Ullrich et al.
La oración clave en el artículo de Ullrich está en la segunda página: " Parecía probable que los fragmentos de Hae III se derivaran del ADNc de la insulina debido a su importancia en la preparación total del ADNc". Entonces, la respuesta a mi pregunta es que los investigadores explotaron la sobreproducción de insulina en las células B para recolectar todo el ARNm, revertir la transcriptasa a ADNc, digerir por restricción y luego hacer una conjetura fundamentada de que los fragmentos más prominentes contenían el gen de la insulina, debido a la Alta expresión de insulina.
Puedes leer esta página de Wikipedia para empezar. En este caso, no comienza con una proteína particular de interés, sino que muta aleatoriamente el genoma y busca fenotipos alterados. Luego busca la mutación que causó el nuevo fenotipo. Si usó transposones para la mutagénesis, puede incluir algún tipo de marcador que le permita identificar rápidamente los clones que contienen el ADN mutado.
@canadianer: si esta pregunta no se quita del tema, deberíamos proporcionar las respuestas adecuadas. Encontré una sección del capítulo de un libro que escribí el siglo pasado sobre el tema, pero me llevará tiempo condensarlo. No antes de la próxima semana.
@David De acuerdo, escribiré algo pronto, con suerte. Espero su respuesta.
@David: ¿puedes señalarme el capítulo de tu libro? Por supuesto, puede responder aquí, cuando tenga la oportunidad, para cerrar la pregunta. Pero estoy muy interesado en saber que escribiste un capítulo entero sobre esto.

Respuestas (2)

Lo siguiente se basa en un capítulo sobre la clonación del ADN en la décima edición de The Biochemistry of the Nucleic Acids (RLP Adams et al. ) publicado por Chapman & Hall en 1986. (Esto es probablemente más pertinente que la undécima y última edición, que fue publicado en 1992 y tuvo un tratamiento más contemporáneo.) Disculpas por el hecho de que será difícil de encontrar. Debería estar disponible en algunas bibliotecas universitarias ya través de sistemas de préstamo interbibliotecario en ciertos países. La Sección A.7.3 da una idea de la metodología utilizada en ese momento.

Propiedades de las proteínas que podrían utilizarse como base de una estrategia de clonación

Al intentar clonar el ADN de una proteína en particular para la que no había clones preexistentes para usar como sondas de hibridación, había que considerar las propiedades de la proteína que se podía explotar. Estos pueden incluir:

  • Secuencia de aminoácidos
  • Anticuerpos a la proteína
  • Actividad biológica
  • Propiedades físicas particulares, como el tamaño.

(Claramente, si uno no tuviera ese 'manejo' de la proteína, no estaría en posición de tratar de clonar su ADNc o gen).

Tres enfoques generales

Parecía haber tres enfoques generales:

  • Sin expresión
  • expresión indirecta
  • Expresión directa

El enfoque que uno podría tomar también se rige por si la proteína es particularmente abundante en un tejido específico, cuando uno podría esperar que enfoques menos sofisticados y más laboriosos tengan posibilidades de éxito.

Otro punto a destacar es que, al menos con los eucariotas, primero se buscaría un clon de cDNA, y sólo se intentaría un clon genómico después de haberlo empleado como sonda de hibridación.

1. Enfoques 'sin expresión'

En los enfoques sin expresión, uno se basó en la secuencia de aminoácidos para identificar el ADN clonado. Uno de estos enfoques fue usar sondas de hibridación contra tramos de aminoácidos, cuyos codones tenían una redundancia limitada (Met y Trp tienen un solo codón y algunos otros aminoácidos solo dos) usando condiciones de hibridación de baja rigurosidad. Esto requería suerte. Alternativamente, se podrían secuenciar clones aleatorios y esperar encontrar uno que se correlacionara con la secuencia de aminoácidos. En ese momento, la secuenciación del ADN era lenta y laboriosa, por lo que solo era aplicable a las proteínas que eran relativamente abundantes en el tejido a partir del cual se preparó la biblioteca.

2. Enfoques de expresión directa

La expresión directa implicaba generalmente el uso de un vector de expresión bacteriano que producía una fusión de una proteína bacteriana con una parte de la proteína eucariótica. (Estadísticamente, solo uno de cada seis clones tendría el marco de lectura correcto en una proteína de fusión). Este enfoque se vio favorecido si uno tenía un anticuerpo, que no requería una proteína completa.

3. Enfoques de expresión indirecta

Por expresión indirecta se entiende el uso de ADNc clonado inmovilizado para seleccionar los ARNm correspondientes ("selección híbrida") que podrían expresarse en un sistema libre de células. Esto era apropiado si la característica distintiva requería una proteína de longitud completa, como en el caso de la actividad biológica o el tamaño.

Específico para el gen de la insulina, el siguiente artículo es, por lo que sé, el primero en aislarlo:

Ullrich A, Shine J, Chirgwin J, Pictet R, Tischer E, Rutter WJ, Goodman HM. 1977. Genes de insulina de rata: construcción de plásmidos que contienen las secuencias de codificación. Ciencia 196:1313-1319.

Aprovecharon el hecho de que la insulina es producida por las células β en el páncreas y, por lo tanto, están enriquecidas en ARNm de insulina. Después de aislar el ARN poli(A) y realizar la transcripción inversa, se esperaba que la banda principal observada en la electroforesis del ADNc resultante perteneciera al gen de la insulina:

Parecía probable que los fragmentos [principales] se derivaran del cDNA de insulina debido a su prominencia en la preparación total de cDNA. Por lo tanto, estos fragmentos, así como las preparaciones completas de ADNc, se usaron en los experimentos de clonación.

Así clonaron este ADNc, lo secuenciaron y descubrieron que contenía la secuencia codificante de proinsulina completa:

Dado que el ARNm contiene una secuencia poli(A) terminal, la hebra de ADN [clonada] que contiene poli(dA) terminal 3' tiene el mismo sentido. Esta hebra determina una secuencia de aminoácidos que corresponde exactamente a la región codificante completa para la proinsulina I de rata y 13 de los 23 aminoácidos de la secuencia prepeptídica.

Con esta secuencia determinada y debido a su alto grado de conservación, el gen humano homólogo podría aislarse hibridando con ADNc de insulina de rata:

Bell GI, Swain WF, Pictet R, Cordell B, Goodman HM, Rutter WJ. 1979. Secuencia de nucleótidos de un clon de ADNc que codifica preproinsulina humana. Naturaleza 282:525-527.