Análisis de miARN solo usando BLAST contra mirbase.org

Tengo datos de secuenciación (Illumina). La preparación de la biblioteca se centró en los ncRNA cortos. Me gustaría identificar miRNAs humanos. ¿Cree que es factible simplemente BLASTcontra una versión actual de mirBase y filtrar la salida para miRNAs humanos maduros sin usar bowtie/tophatcontra hg19primero?

Gracias

Respuestas (1)

No necesita usar TopHat, pero es mejor usar bowtieen lugar de BLAST. En primer lugar, debe deshacerse de las secuencias del adaptador (junto con otros pasos de procesamiento antes de la alineación).

Ahora hay dos aspectos aquí:

  • cuantificación de miARN
  • descubrimiento de miARN

El primero es relativamente sencillo, mientras que el segundo requiere que realice pruebas adicionales, como la predicción de bucles de tallo, etc. Hay software publicado que puede manejar ambos aspectos ( mirDeep, miRScanetc.). Consulte esta revisión para obtener detalles sobre los diferentes buscadores de genes de miARN. He usado miRdeepy usa bowtie-1para alinear.

BLASTfuncionaría, pero debe establecer parámetros que sean adecuados para secuencias pequeñas (aumentar el límite del valor E, reducir el tamaño de la palabra, etc.). Además, BLASTno tiene una opción de corte para el número de desajustes y la longitud de la alineación (solo tiene un filtro posterior a la alineación para el porcentaje de identidad).

Personalmente también lo prefiero bowtieporque tiene algo llamado n-modo de alineación. En este modo, toda la lectura se divide en seedy non-seedregiones. Puede especificar la longitud de la región inicial y el límite de desajuste. Dado que para los miARN la región semilla (bases 2-8) es crítica para su función, generalmente establezco el seedlímite de desajuste en cero mientras permito uno o dos desajustes en la región non-seed(tenga en cuenta que siempre comienza en 1).bowtieseed

En general, le aconsejaría que elija en miRdeeplugar de BLAST. Sin embargo, miRdeepno realiza inmediatamente una alineación contra las secuencias maduras. Mapea la ubicación de las secuencias maduras en las secuencias de pre-miARN (bucles de tallo) y luego alinea las lecturas con las secuencias de pre-miARN. Si la ubicación de las lecturas tiene una superposición significativa con la región madura (puede ajustar la ventana), la lectura se considera un miARN válido.

Muchas gracias. Yo le daría una oportunidad al corbatín primero. Entonces configuré -N en 0. ¿Qué valor recomienda para -L (longitud de las subcadenas de semillas para alinear durante la alineación de semillas múltiples)?
@twckr puede configurarlo en 10; Uso 10. Configuré -e80. Sin embargo, esto es para el fastaarchivo de las lecturas. La eopción es para el límite máximo de calidad para discrepancias. Para fastalos archivos, la calidad predeterminada es 40; entonces 80 significa 2 desajustes. Esto no sería cierto si usa fastqarchivos
Creo que se podrían tolerar algunos desajustes en la semilla de miARN con respecto a la función de miARN, dependiendo de su posición.
@bli Seed es bastante importante. Los miARN se clasifican en familias según las secuencias de semillas. Entonces, si su semilla es diferente, técnicamente se convierte en un miARN diferente. Sin embargo, dependiendo de las condiciones y el contexto, se pueden tolerar desajustes de semillas (no más de dos).
Usando bowtieobtengo resultados bastante diferentes en comparación con BLAST. Incluso configurando la opción -L en 22 (lo que debería evitar cualquier desajuste por lo que entendí) encuentro diferencias significativas en los resultados de ambos programas. ¿Tiene una explicación para este hallazgo?
@twckr Debe mostrarme los archivos; de lo contrario, no puedo dar una explicación. Si los archivos son enormes, simplemente pegue una sección que muestre la diferencia.