Predicción e identificación de secuencias de ADN de microbios y enzimas con predicción metabólica

Actualmente estoy trabajando en la metagenómica de la biometenización del carbón por consorcio bacteriano.

Tengo el resultado de la secuencia (Illumina). La secuencia es enorme y no puedo predecir nada de la secuencia. He revisado diferentes bases de datos como Metacyc, Biocyc, etc. Por favor, ayúdenme, ¿cómo puedo hacer una inferencia sobre las enzimas metabólicas que están involucradas en la biometanización del carbón?

Respuestas (2)

El primer paso después de la secuenciación es encontrar genes probables. Después de eso, los genes y sus proteínas pueden clasificarse para pertenecer a clases de proteínas. Esto es lo máximo que puedes hacer con genes completamente desconocidos. Hoy en día es posible predecir la estructura final utilizando mapas de contacto (si no se conoce una estructura homóloga), pero en muchos casos esto seguirá sin tener claro los ligandos. Entonces, el paso final es aclarar la función con métodos de laboratorio bioquímicos.

Entonces, si está atascado con una secuencia enorme, primero intente encontrar los genes en ella.

http://en.wikipedia.org/wiki/Gene_prediction

Para la anotación/clasificación posterior, recomiendo InterPro y PROSITE.

http://www.ebi.ac.uk/Tools/pfa/iprscan/

http://prosite.expassy.org/scanprosite/

Bueno, en primer lugar, no sabemos cómo secuenciaste los datos. ¿Qué secuenciaste realmente? ¿Observó la actividad transcripcional usando RNA-seq o hizo una secuenciación completa del genoma? ¿Hubo lecturas emparejadas? ¿Cómo creaste tu biblioteca? ¿Enriqueció el consorcio bacteriano para la actividad de biometanización?

¿Dónde lee el mapa? El consorcio complica las cosas, pero es probable que necesite crear una biblioteca contig de calidad antes de hacer cualquier otra cosa. Sin duda, gran parte de su biblioteca no se asignará a nada interesante, pero aún debe anotar la biblioteca al ver dónde se asignan las lecturas. La identificación de los ORF será útil.

Probablemente, tendrá un conjunto de genes que estarán involucrados con la biometanización. Deberías BLAST the bejesus de tu biblioteca de contig para obtener resultados. ¿Coinciden con alguno de sus ORF? Yendo al revés, ¿sus ORF coinciden con alguno de los genes en EcoCyc o BioCyc? ¿Necesita utilizar una base de datos más grande?