¿Cuál es el rRNA 16S de referencia?

Recientemente, me he topado con un hecho que no me ha molestado durante muchos años. El hecho es que todos los cebadores 16S universales se escriben como "[FR][0-9]+" (en notación regex), es decir, tienen una posición con respecto a una referencia. He leído muchos artículos en los que se introdujeron estos cebadores, y la mayoría de las veces los autores no dicen nada más que "E. coli 16S". De todos modos, en un caso he encontrado que en realidad es la referencia K12 E. coli. Pero el problema es que tiene 7 operones de ARNr distintos: rrnA, rrnB, rrnC, rrnD, rrnE, rrnF, rrnG. ¿Tiene una referencia que muestre un operón particular utilizado para la notación de posición 16S?

Editar ingrese la descripción de la imagen aquí

Figura 2. Regiones hipervariables dentro del gen 16S rRNA en Pseudomonas. La línea trazada refleja las fluctuaciones en la variabilidad entre las secuencias del gen 16S rRNA alineadas de 79 cepas de tipo Pseudomonas... ( Bodilis et al., 2012 )

¿Estás seguro de que difieren en la secuencia en el cebador? Las secuencias de las partes estructurales de los genes son aparentemente casi idénticas. ¿Has consultado GenBank?
@David No lo he comprobado yo mismo, pero aquí hay una referencia relevante ... or the same strain may have multiple copies of the 16S rRNA gene that differ by 5% for some regions (such as Escherichia coli K12 [12])... (Nguyen et al., 2016)
@David, si bien los cebadores están ubicados en regiones conservadoras cortas entre regiones hipervariables, estas últimas son extremadamente variables. Agregué una figura que representa esta variación en varias cepas de Pseudomonas . Por lo tanto, no importa si los cebadores están ubicados en regiones conservativas o no, lo importante es que se dirijan a regiones que pueden variar tanto en secuencia como en longitud.

Respuestas (1)

Como señala correctamente, diseñar un par de cebadores óptimo para la secuenciación de 16S-rRNA es un asunto complicado porque incluso las regiones menos variables no son las mismas entre diferentes cepas y especies. Sambo et al (2018) incluso han desarrollado un software de bioinformática para el diseño óptimo de cebadores para la secuenciación de 16S-rRNA para múltiples bacterias.

Proponemos aquí un método computacional para optimizar la elección de conjuntos de cebadores, basado en la optimización multiobjetivo, que simultáneamente: 1) maximiza la eficiencia y la especificidad de la amplificación objetivo; 2) maximiza el número de secuencias 16S bacterianas diferentes emparejadas por al menos un cebador ; 3) minimiza las diferencias en el número de cebadores que coinciden con cada secuencia bacteriana 16S. Nuestro algoritmo se puede aplicar a cualquier longitud de amplicón deseada sin afectar el rendimiento computacional.

Existe diversidad en los genes 16S-rRNA dentro de la misma especie, es decir, las diferentes copias no son duplicados exactos ( Větrovský & Baldrian, 2013 ).

ingrese la descripción de la imagen aquí Vetrovský y Baldrian (2013)

Curiosamente, los diferentes operones de ARNr en E.coli tienen diferentes promotores e incluso se expresan de manera diferencial durante condiciones de estrés ( Kurylo et al., 2018 ).

Sin embargo, Kitahara et al. (2012) encontraron que los genes 16S-rRNA aislados de muestras de suelo, en lugar del gen original de E.coli , podrían apoyar su crecimiento. En otras palabras , E.coli es muy resistente a las mutaciones en su 16S-rRNA.

Después de la contraselección, se obtuvieron ~200 clones de derivados de KT103 (que portaban pRB103 cuyo gen 16S rRNA fue sustituido por genes extraños), a partir de los cuales se identificaron 33 genes 16S rRNA no redundantes (A01–H03). A través de la alineación múltiple de E. coli 16S rRNA y nuestras secuencias de 16S rRNA recuperadas metagenómicamente, se encontró que al menos 628 (40,7%) de los 1542 nucleótidos eran variables, lo que indica una marcada robustez mutacional del 16S rRNA. Sorprendentemente, las secuencias funcionales de ARNr 16S (excepto A10 y F02, que eran 99,0 % idénticas al ARNr 16S de E. coli) obtenidas en este estudio mostraron solo un 80,9–89,3 % de identidad con el ARNr 16S de E. coli, que estaba muy por debajo del valor informado. hasta el momento (Proteus vulgaris 16S rRNA, 94 % de identidad con E. coli 16S rRNA)


para tu pregunta

Pero el problema es que tiene 7 operones de ARNr distintos: rrnA, rrnB, rrnC, rrnD, rrnE, rrnF, rrnG. ¿Tiene una referencia que muestre un operón particular utilizado para la notación de posición 16S?

No creo que ninguno de ellos sea considerado la referencia. La secuencia completa de E.coli 16S-rRNA informada en NCBI parece considerar un "consenso" de diferentes secuencias informadas:

[5], [7] contienen datos de secuencia actualizados para el trabajo original del mismo laboratorio [4]. Había demasiadas discrepancias entre [4] y [5], [7] para enumerar cada revisión en nuestra tabla de sitios. La secuencia mostrada es de [7]. [4], [5], [7] apuntan a una serie de heterogeneidades de cistrones. Sin embargo, existe incertidumbre con respecto a la asignación de estas diversas heterogeneidades a cistrones específicos. El método de ARN utilizado por [4], [5], [7] da el promedio de todos los cistrones presentes en la célula [7]. Las heterogeneidades se clasifican por sus proporciones relativas en especies mayores, menores e indeterminadas. La secuencia mostrada corresponde a las especies principales. Las heterogeneidades se anotaron como variaciones en la tabla de sitios. No se sabe cuál de los residuos 'c' (base 633) o 'a' (base 641) sufre una deleción, dando lugar al componente menor 'atctg'. [7] sugiere la existencia de uno o dos cistrones mutados entre los siete cistrones conocidos de ARN ribosomal.Con la excepción de una deleción de una sola base, esta secuencia es idéntica a la secuencia actual de rDNA 16S para el gen rRNB de E.coli.

La página del NCBI también enumera diferentes polimorfismos y modificaciones de bases en el 16S-rRNA dentro y entre diferentes cepas/"especies".

NCBI también tiene varias secuencias parciales. Cuando busqué P.aeruginosa y B.subtilis , solo pude encontrar una o dos secuencias completas (el resto eran parciales). Además, cada entrada indicaba la cepa de la que se obtuvo. Por lo tanto, supongo que no hay una secuencia de referencia única.

Supongo que las personas consideran las diferentes variantes al hacer un análisis filogenético (o simplemente buscan secuencias de "firma" conservadas para una especie determinada). Estoy seguro de que existen algoritmos computacionales para hacer la clasificación de manera óptima (ver Chatellier et al., 2014 ). Dado que no tengo experiencia en esta área, no puedo decir nada concluyente sobre la práctica de rutina. De hecho, todavía hay investigaciones en curso para mejorar el análisis (por ejemplo, Yang et al., 2016 y Sambo et al., 2018 ).

Si bien no tengo acceso al artículo original de Ehresmann et al. (1972) que parece ser la fuente de esa secuencia, la vista previa sugiere que su metodología solo puede producir una secuencia de consenso.