En resumen, hice un blastn con un blast independiente utilizando todos los miARN conocidos contra las secuencias EST en un genoma (longitud de palabra 7 y valor e 0,01). Ahora, para confirmar, uno de los siguientes pasos sería obtener la secuencia de pre-miRNA de cada hit y hacer un mFOLD para la confirmación estructural. Cada artículo que leo siempre menciona obtener una ventana deslizante (de 70 a 100 nt de longitud), pero ¿cómo se obtiene esta ventana deslizante de la salida BLASTN? ¿Tiene que codificar algo usted mismo o hay una manera más fácil de hacerlo? Gracias.
DESCARGO DE RESPONSABILIDAD: Nunca he trabajado con miRNAs.
Sin embargo, por lo poco que sé, el miARN maduro se produce modificando el pre-miARN. Esto significa que debería poder inferir el pre-miARN asignando su miARN al genoma usando una herramienta como BLAT . Dado que ya tiene un EST que representa una secuencia transcrita, puede mapear su EST al genoma. Puede simplificar esto usando una herramienta como exonerate
esa que también modela el empalme.
Un BLASTN funcionaría para mapear el miARN maduro, pero debe corregir algunos parámetros.
El valor E está bien, pero aumenta la longitud de la palabra. Manténgalo cerca de 17 porque le interesan las coincidencias perfectas. Con miRNA, los pequeños desajustes pueden significar un miRNA completamente diferente. También se ejecuta solo para alineaciones más/más. (Puedes ver esta publicación en biostar para obtener detalles sobre cómo hacerlo)
Lo que también puede hacer es usar bowtie
(a veces BLAST es muy lento y, aunque BLAST permite varios subprocesos, no hay opción para utilizar varios núcleos, es decir, paralelización real). Nuevamente use la opción --norc
para evitar alineaciones más-menos.
Úselo bowtie-build
en sus secuencias EST para hacer un índice.
Sin embargo, hay un problema más; es poco probable que obtenga secuencias de pre-miARN en su colección de EST. Esto se debe a que la forma estable es un miARN maduro y, por lo general, el pre tiene una vida demasiado corta para ser secuenciado correctamente sin las medidas selectivas apropiadas.
La captura de ARN pequeños mediante secuenciación tampoco es tan sencilla. Necesita el fraccionamiento del tamaño del ARN y la posterior preparación de la biblioteca a partir de la pequeña fracción de ARN. Así que supongo que no descubrirás miRNAs de ESTs.
Si tiene secuencias de ARN pequeñas, puede alinearlas con el genoma y luego seleccionar el nt para encontrar la horquilla. De hecho, hay un algoritmo llamado mirdeep que hace eso; puedes usarlo y evitar escribir tus propios códigos. Si es bueno con perl, puede modificarlo para adaptarlo a sus necesidades específicas, si las hubiere.
WYSIWYG
WYSIWYG