¿Es posible identificar una secuencia de genes en particular a partir de técnicas de secuenciación de próxima generación (especialmente RNA-seq)?

Tengo que comprobar la expresión de un gen en un pez cuya secuencia no se conoce en el pez en cuestión. Se conoce la secuencia en otro pez (pez cebra) pero el gen tiene 10 isoformas. El genoma de los peces en cuestión no está secuenciado, sin embargo, los datos de RNA-seq están disponibles. No tengo conocimiento del análisis de datos de RNA seq. ¿Es posible conocer la secuencia del gen de interés a partir de esta información de RNA-seq?

Respuestas (2)

Bien, ¿entonces tiene RNASeq, pero no tiene un genoma de referencia para su pez? ¿Solo transcribir la secuencia del pez cebra? ¿Está tratando de ver si este gen se expresa o necesita una visión más global para compararlo?

Si solo desea ver si el gen se expresa, lo más fácil es hacer una referencia compuesta solo por transcripciones de pez cebra, alinéelo. Si hay demasiadas diferencias entre tu pez y el pez cebra, eso no funcionará.

En cuyo caso, lo siguiente que podría intentar es el ensamblaje de novo de sus datos de RNAseq, luego use blast para comparar las transcripciones de pez cebra con sus transcripciones ensambladas. Blast hará alineaciones donde un alineador de lectura corto podría no hacerlo.

Sí, es posible, si el gen se expresó en las células de donde se extrajo el ARN.

Con RNA seq básicamente secuencias el ARN de algunas células, por lo general es ARNm lo que secuencias, lo que significa que la secuencia que estás buscando no es una copia simple de la secuencia del gen de ADN que tienes. Principalmente porque resulta del empalme y otros procesos posteriores a la transcripción. Sin embargo, si conoce la secuencia de ADN del gen y tiene datos de secuencia de ARN (y si ese gen en particular se expresó en las células de las que proviene el ARN), puede detectar los exones del gen en los datos. Si el gen se expresa en pez cebra, puede encontrar en ENSEMBL toda la información sobre las transcripciones de ese gen y buscarlas en sus datos de secuenciación de ARN (usando BLAST, por ejemplo) para confirmar la presencia del gen expresado.