¿Cuál es la relación entre el genoma de una cepa "principal" y su genoma variante en las arqueas?

Voy a analizar datos de secuenciación de ADN para tratar de extrapolar alguna información sobre la estrategia de supervivencia de Pyrococcus Furiosus a la radiación gamma, como quizás ya sepas por todas las preguntas anteriores que publiqué.

En particular, entre mis publicaciones anteriores estaba la titulada ¿ Qué significa cepa genéticamente tratable? en el que pregunté el significado de cepa genéticamente manejable porque estaba leyendo el artículo sobre Genome Sequencing of a Genetically Tractable Pyrococcus furiosus Strain Reveals a Highly Dynamic Genome en el que comparan la secuencia del genoma de referencia de Pyrococcus Furiosus (la que se secuenció por primera vez en el año 2000) con la secuencia de una variante en una población de cepas de laboratorio, designada COM1 y que es la cepa genéticamente tratable que ha sufrido una alteración genética específica del gen pyrF (he aclarado el significado de este proceso aquí ¿Qué es una alteración genética específica ? ).

Ahora, lo que todavía no puedo entender es por qué comparan la secuencia del genoma "modificado" de la variante con la secuencia del genoma de referencia. Habría alineado la secuencia del genoma "modificado" de la variante con su secuencia antes de la interrupción del gen objetivo . Entonces, por supuesto, tendría todas las propiedades de la variante y no de la cepa "principal" (el genoma de referencia de Pyrococcus Furiosus).

En cambio, en el artículo comparan primero la secuencia del genoma de referencia con la de su variante manipulada y luego comparan también las secuencias de algunos genes en particular, obteniendo algunas propiedades como si se tratara de un mismo genoma. Por ejemplo:

los productos proteicos de 102 del total de 2134 genes en la secuencia de referencia NCBI están interrumpidos en COM1 a nivel de traducción a través de mutaciones no sinónimas. Estos dan como resultado cambios de aminoácidos, inserciones y eliminaciones que introducen codones de parada prematuros y cambios de marco que producen productos más largos o más cortos con secuencias de codificación alternativas. Estos se subdividieron en 36 cambios principales (Tabla 4) y 66 cambios menores (consulte la Tabla S1 en el material complementario) en función de la identidad de alineación global de Needleman-Wunsch en comparación con las secuencias de proteínas en la secuencia de referencia NCBI .

Este y muchos otros extractos muestran que comparan la referencia y la variante como si fueran, respectivamente, el "control" y la muestra que ha sido tratada, ignorando el hecho de que en realidad eran genomas distintos.

En el post ¿Qué significa cepa genéticamente tratable? , la respuesta a la pregunta "¿por qué hacen esta comparación?" fue esencialmente que los resultados obtenidos por la manipulación de la cepa tratable pueden informar su comprensión de la forma de referencia. Pero, ¿por qué se nos permite tratarlos como si fueran el mismo genoma? Entonces, ¿podemos considerar las propiedades referidas al COM1 válidas también para la referencia Pyrococcus Furiosus y para todas sus variantes existentes? Por ejemplo, aquí dicen:

varios genes involucrados en la reparación del ADN, incluida una proteína de dominio RadA no caracterizada (PF0872), helicasa de reparación de ADN Rad3 (PF0933), exonucleasa 5' a 3' NurA (PF1168 [23]) y helicasa de reparación de ADN (PF1902) , podrían estar potencialmente inactivos en COM1, ya que entran en la categoría de diferencias menores en el nivel de proteínas (consulte la Tabla S1 en el material complementario). Sin embargo, COM1, Parent y DSMZ no mostraron diferencias significativas en su capacidad para recuperarse de la exposición a la radiación UV o gamma en condiciones previamente reportadas para P. furiosus (14).

¿Puedo decir que esto también podría ser válido para la referencia Pyrococcus Furiosus, en el sentido de que si el conjunto mencionado de genes de reparación del ADN está inactivo, no mostrará diferencias significativas en su capacidad para recuperarse de la exposición a la radiación ultravioleta o gamma?

Mi conclusión, hace meses, fue que se puede considerar una variante como si fuera la cepa principal ya que la definición que leí en Wikipedia es:

En microbiología y virología, el término variante o "variante genética" se utiliza para describir un subtipo de un microorganismo que es genéticamente distinto de una cepa principal, pero no lo suficientemente diferente como para ser denominado una cepa distinta.

Ahora bien, esta conclusión ya no me satisface y me gustaría entender realmente la razón de esta comparación y cómo interpretar las relaciones entre los genomas. ¿Podemos considerar la cepa principal y su variante simplemente iguales ya que la última no es "suficientemente diferente para ser denominada una cepa distinta"? ¿Son válidas también todas las propiedades fenotípicas observadas para la variante COM1 (como, por ejemplo, el hecho de que, aunque un conjunto de genes de reparación del ADN están inactivos, la capacidad de recuperarse de la exposición a la radiación UV o gamma, bajo ciertas condiciones, sigue siendo la misma)? para la cepa "principal" (que es el genoma de referencia NCBI)?

Gracias de antemano.

Respuestas (1)

... Estaba leyendo el artículo sobre la secuenciación del genoma de una cepa de Pyrococcus furiosus tratable genéticamente revela un genoma altamente dinámico en el que comparan la secuencia del genoma de referencia de Pyrococcus Furiosus ... con la secuencia de una variante en una población de cepas de laboratorio, denominada COM1 y esa es la cepa genéticamente tratable que ha sufrido una alteración genética específica .

En cambio, en el artículo comparan primero la secuencia del genoma de referencia con la de su variante manipulada y luego comparan también las secuencias de algunos genes en particular, obteniendo algunas propiedades como si se tratara de un mismo genoma.

Creo que aquí es donde se origina tu confusión. Según mi lectura, el artículo que vincula es un artículo de genómica comparativa, y los autores no realizan ninguna manipulación genética de la cepa COM1 tratable. Todas las menciones de genes "perturbados" se refieren a los efectos de secuencias de inserción naturales o mutaciones no sinónimas. "Natural", aquí, lo que significa que no se interrumpe a propósito. Según la comparación con las cepas Parent y DSMZ, parece que COM1 acumuló sus diversas interrupciones y reordenamientos mientras se propagaba como una cepa de laboratorio de tipo salvaje.

Para obtener más información sobre cómo se "descubrió" la cepa COM1, sugiero leer el artículo original en el que se describe.

Gracias por tu respuesta @acvill pero no entiendo muchas cosas: 1. ¿Dónde está el término "natural" que mencionas? 2. Entonces, llegando a la pregunta principal: ¿por qué hacen esta comparación? ¿Es sólo para describir la diferencia entre los dos genomas?
@Manuela (1) "natural" se refiere a mi uso de "naturalmente" en la oración anterior. Quería evitar confusiones sobre el origen de las mutaciones COM1. Escribiré en cursiva para enfatizar. (2) Sí, están describiendo las diferencias entre el genoma COM1 y el genoma de referencia, así como las variantes estructurales en los genomas Parent y DSMZ.
Ok @acvill de hecho tiene sentido, gracias. Pero todavía estoy confundido porque en la parte del artículo que publiqué, cuando alinean el COM1 con la referencia dicen algo así como "estas proteínas en COM1 podrían estar inactivas porque las secuencias de proteínas son diferentes con respecto a las secuencias de proteínas del referencia". ¿Por qué esperaban ser iguales?
Continuemos esta discusión en el chat .
Finalmente, no entiendo muy bien la utilidad de lo que hacen (tanto el paper original como el más reciente).
3. @acvill Además, cuando dije "la secuencia de una variante en una población de cepas de laboratorio, designada COM1 y esa es la cepa genéticamente tratable que ha sufrido una alteración genética específica ". Quería decir que la cepa COM1 se obtuvo por interrupción del gen del locus pyrF (PF1114) utilizando un plásmido diseñado para la recombinación de doble cruzamiento (37) que son palabras escritas en el artículo. No quería decir que "perturbaron" los genes a propósito...
Luego encontré esta definición en Springer sobre la interrupción de genes dirigidos que dice que es el reemplazo experimental de un gen endógeno por una versión mutada (no funcional) dentro del genoma que de otro modo no cambiaría se llama interrupción de genes dirigidos . Así que dije que hicieron manipulaciones genéticas. Pero, sinceramente, ahora no entiendo si esto fue hecho por los autores del artículo original que vinculaste o si ocurrió de forma natural. El artículo original es demasiado complicado para mí :/