¿Cuánta variación genómica se suele encontrar dentro de una especie bacteriana dada?

Si encuentro la posición inicial exacta (por ejemplo, 1152471) de la secuencia de codificación de un gen dado en el genoma de una bacteria, ¿es el genoma de la bacteria en general lo suficientemente estable como para esperar encontrar la misma posición en un miembro diferente? de la misma especie?

Si está utilizando la secuencia de referencia de una base de datos, entonces no es necesariamente el caso de que tendrá una réplica de base por base para una celda seleccionada al azar. Si tuviera que seleccionar dos células clonales de una colonia de bacterias, todas esas células habrían surgido de un solo progenitor, por lo que habría un alto grado de homología entre las dos células, pero probablemente no serían exactamente iguales para todas. base en todo el genoma.
¡Ten cuidado! Como los genomas bacterianos son circulares y tenemos que escribir su secuencia de nucleótidos como lineal, el "punto de ruptura" del círculo no necesariamente tiene que estar exactamente en el mismo punto para dos genomas en la base de datos (ya que se basa en el ensamblaje donde estaría una ruptura, a menos que logres terminar con un genoma completamente circular y puedas decidir). Por lo tanto, mientras que la secuencia en cuestión podría no haber cambiado, el nucleótido en cuestión aún podría estar en una "posición" diferente. Y por lo demás: eso depende. Algunos genomas son más estables que otros. Algunos genes también lo son.
Hay bacterias con cromosoma lineal. microbewiki.kenyon.edu/index.php/…
Sí, pero ¿son esas las especies con las que estás trabajando?

Respuestas (3)

La variación genética dentro de las especies bacterianas puede ser mucho mayor de lo que cabría esperar.

Primero, esta puede ser una pregunta difícil de responder cuantitativamente porque incluso probar si dos cepas son parte de la misma especie bacteriana es difícil: el método "estándar de oro" es en realidad experimental e involucra la hibridación ADN-ADN del genoma completo (con un punto de corte de 70% de parentesco). Los enfoques de secuenciación modernos han demostrado que esto generalmente corresponde a alrededor del 95 % de identidad de nucleótidos promedio (ANI) (ver aquí ).

Sin embargo, un ANI del 95% en realidad no significa que los genomas sean idénticos en un 95%: significa que de las secuencias compartidas , se espera que el 95% de los nucleótidos sean iguales. El porcentaje de secuencias que en realidad se comparten en primer lugar puede ser mucho, mucho menor. Por ejemplo, este documento comparó 61 cepas secuenciadas de E. coli . De los ~15K genes observados en al menos una secuencia del genoma, solo se observó el 6% de los genes en todas las cepas. Los genes presentes de forma variable constituían alrededor del 80 % de un genoma típico de E. coli . Este es un alto nivel de variabilidad, pero no escandaloso: un análisis de solo nueve P. putidalos genomas, por ejemplo, mostraron un núcleo de como máximo el 33% ( ref ).

Entonces, si un gen está realmente presente en dos cepas de la misma especie bacteriana, entonces es probable que esté altamente conservado. Pero también hay pocas garantías de encontrar exactamente el mismo conjunto de genes en dos cepas de la misma especie. Esto significa que no puede tomar ingenuamente las coordenadas cromosómicas de una cepa y aplicarlas a otra: necesita averiguar qué secuencias se corresponden entre sí en sus genomas.

Si todas sus muestras son, por ejemplo, E.coli K12 MG1655, habrá muy poca diferencia entre la secuencia publicada y la que tiene. Si tiene otra cepa de E.coli, no puede contar con que no haya indeles entre las dos cepas.

Las ubicaciones de un gen en un cromosoma bacteriano se determinan arbitrariamente, por lo que no esperaría que las secuencias de codificación tengan necesariamente los mismos valores numéricos. Recuerde que la maquinaria de transcripción de la bacteria utilizará promotores en la secuencia genética para determinar dónde comenzar la transcripción, por lo que la ubicación de inicio real realmente no importa: ¡es bastante fácil que las mutaciones aleatorias agreguen o eliminen algunos pares de bases entre varios genes!

En su lugar, buscaría la secuencia genética del gen que le interesaba en el genoma de una especie estrechamente relacionada. Dado que muchos genomas se anotan mediante la identificación de genes de especies estrechamente relacionadas, es posible que dos genomas estrechamente relacionados comiencen exactamente en el mismo lugar, pero definitivamente no debe suponer que siempre será así.

no es cierto... los genes en las bacterias experimentan cierto grado de conservación posicional