¿Cómo se encuentran los pre-miARN a partir de la salida de miARN maduro de Blast?

En resumen, hice un blastn con un blast independiente utilizando todos los miARN conocidos contra las secuencias EST en un genoma (longitud de palabra 7 y valor e 0,01). Ahora, para confirmar, uno de los siguientes pasos sería obtener la secuencia de pre-miRNA de cada hit y hacer un mFOLD para la confirmación estructural. Cada artículo que leo siempre menciona obtener una ventana deslizante (de 70 a 100 nt de longitud), pero ¿cómo se obtiene esta ventana deslizante de la salida BLASTN? ¿Tiene que codificar algo usted mismo o hay una manera más fácil de hacerlo? Gracias.

miRNAs en EST: soy un poco escéptico sobre esto ...
lo siento por la respuesta tardía ... No estoy seguro de si todavía lo necesita ahora.

Respuestas (2)

DESCARGO DE RESPONSABILIDAD: Nunca he trabajado con miRNAs.

Sin embargo, por lo poco que sé, el miARN maduro se produce modificando el pre-miARN. Esto significa que debería poder inferir el pre-miARN asignando su miARN al genoma usando una herramienta como BLAT . Dado que ya tiene un EST que representa una secuencia transcrita, puede mapear su EST al genoma. Puede simplificar esto usando una herramienta como exonerateesa que también modela el empalme.

Un BLASTN funcionaría para mapear el miARN maduro, pero debe corregir algunos parámetros.

El valor E está bien, pero aumenta la longitud de la palabra. Manténgalo cerca de 17 porque le interesan las coincidencias perfectas. Con miRNA, los pequeños desajustes pueden significar un miRNA completamente diferente. También se ejecuta solo para alineaciones más/más. (Puedes ver esta publicación en biostar para obtener detalles sobre cómo hacerlo)

Lo que también puede hacer es usar bowtie(a veces BLAST es muy lento y, aunque BLAST permite varios subprocesos, no hay opción para utilizar varios núcleos, es decir, paralelización real). Nuevamente use la opción --norcpara evitar alineaciones más-menos.

Úselo bowtie-builden sus secuencias EST para hacer un índice.

Sin embargo, hay un problema más; es poco probable que obtenga secuencias de pre-miARN en su colección de EST. Esto se debe a que la forma estable es un miARN maduro y, por lo general, el pre tiene una vida demasiado corta para ser secuenciado correctamente sin las medidas selectivas apropiadas.

La captura de ARN pequeños mediante secuenciación tampoco es tan sencilla. Necesita el fraccionamiento del tamaño del ARN y la posterior preparación de la biblioteca a partir de la pequeña fracción de ARN. Así que supongo que no descubrirás miRNAs de ESTs.

Si tiene secuencias de ARN pequeñas, puede alinearlas con el genoma y luego seleccionar el ± 70 nt para encontrar la horquilla. De hecho, hay un algoritmo llamado mirdeep que hace eso; puedes usarlo y evitar escribir tus propios códigos. Si es bueno con perl, puede modificarlo para adaptarlo a sus necesidades específicas, si las hubiere.

nunca usé corbatín. Estoy tratando de trabajar en blastn con el número de desajustes establecido en 2 en este momento. ¿Qué sugeriría usted es un buen programa de agrupamiento para eliminar secuencias duplicadas
fastx_collapser colapsará las secuencias redundantes. BLAST puede volverse muy lento para estas cosas. Es mejor usar un alineador de lectura corto como corbatín.
thx.. tendrá que probar bowtie tal vez la próxima vez. Demasiado lejos con el proyecto actual para dar marcha atrás.