¿Cómo se encuentran los pre-miARN a partir de la salida de miARN maduro de Blast?

Question

¿Cómo se encuentran los pre-miARN a partir de la salida de miARN maduro de Blast?

explosión
Biología
bioinformática

La última palabra

En resumen, hice un blastn con un blast independiente utilizando todos los miARN conocidos contra las secuencias EST en un genoma (longitud de palabra 7 y valor e 0,01). Ahora, para confirmar, uno de los siguientes pasos sería obtener la secuencia de pre-miRNA de cada hit y hacer un mFOLD para la confirmación estructural. Cada artículo que leo siempre menciona obtener una ventana deslizante (de 70 a 100 nt de longitud), pero ¿cómo se obtiene esta ventana deslizante de la salida BLASTN? ¿Tiene que codificar algo usted mismo o hay una manera más fácil de hacerlo? Gracias.

WYSIWYG

miRNAs en EST: soy un poco escéptico sobre esto ...

WYSIWYG

lo siento por la respuesta tardía ... No estoy seguro de si todavía lo necesita ahora.

Respuestas (2)

¿Cómo se encuentran los pre-miARN a partir de la salida de miARN maduro de Blast?

lo siento por la respuesta tardía ... No estoy seguro de si todavía lo necesita ahora.

terdón · Answer 1

DESCARGO DE RESPONSABILIDAD: Nunca he trabajado con miRNAs.

Sin embargo, por lo poco que sé, el miARN maduro se produce modificando el pre-miARN. Esto significa que debería poder inferir el pre-miARN asignando su miARN al genoma usando una herramienta como BLAT . Dado que ya tiene un EST que representa una secuencia transcrita, puede mapear su EST al genoma. Puede simplificar esto usando una herramienta como exonerateesa que también modela el empalme.

WYSIWYG · Answer 2

Un BLASTN funcionaría para mapear el miARN maduro, pero debe corregir algunos parámetros.

El valor E está bien, pero aumenta la longitud de la palabra. Manténgalo cerca de 17 porque le interesan las coincidencias perfectas. Con miRNA, los pequeños desajustes pueden significar un miRNA completamente diferente. También se ejecuta solo para alineaciones más/más. (Puedes ver esta publicación en biostar para obtener detalles sobre cómo hacerlo)

Lo que también puede hacer es usar bowtie(a veces BLAST es muy lento y, aunque BLAST permite varios subprocesos, no hay opción para utilizar varios núcleos, es decir, paralelización real). Nuevamente use la opción --norcpara evitar alineaciones más-menos.

Úselo bowtie-builden sus secuencias EST para hacer un índice.

Sin embargo, hay un problema más; es poco probable que obtenga secuencias de pre-miARN en su colección de EST. Esto se debe a que la forma estable es un miARN maduro y, por lo general, el pre tiene una vida demasiado corta para ser secuenciado correctamente sin las medidas selectivas apropiadas.

La captura de ARN pequeños mediante secuenciación tampoco es tan sencilla. Necesita el fraccionamiento del tamaño del ARN y la posterior preparación de la biblioteca a partir de la pequeña fracción de ARN. Así que supongo que no descubrirás miRNAs de ESTs.

Si tiene secuencias de ARN pequeñas, puede alinearlas con el genoma y luego seleccionar el $\pm 70$ nt para encontrar la horquilla. De hecho, hay un algoritmo llamado mirdeep que hace eso; puedes usarlo y evitar escribir tus propios códigos. Si es bueno con perl, puede modificarlo para adaptarlo a sus necesidades específicas, si las hubiere.

nunca usé corbatín. Estoy tratando de trabajar en blastn con el número de desajustes establecido en 2 en este momento. ¿Qué sugeriría usted es un buen programa de agrupamiento para eliminar secuencias duplicadas
fastx_collapser colapsará las secuencias redundantes. BLAST puede volverse muy lento para estas cosas. Es mejor usar un alineador de lectura corto como corbatín.
thx.. tendrá que probar bowtie tal vez la próxima vez. Demasiado lejos con el proyecto actual para dar marcha atrás.

¿Cómo se encuentran los pre-miARN a partir de la salida de miARN maduro de Blast?

La última palabra

WYSIWYG

WYSIWYG

Respuestas (2)

terdón

WYSIWYG

La última palabra

WYSIWYG

La última palabra

Número de copia BLAST local por acierto

Explosión de bases de datos

Términos GO para organismos no modelo

cuál es el mejor valor de corte de E en la búsqueda de homología de miARN

¿Múltiples transcritos que coinciden con el mismo gen en los datos de secuenciación de ARN ensamblados de novo, pero los valores de FPKM varían?

¿Por qué se toman diferentes longitudes de nucleótidos para la predicción de la estructura de un área de coincidencia de miARN después del análisis BLAST?

¿Cómo determinar cuál es la secuencia de nucleótidos de un gen?

Encuentre homólogos de proteínas con BLASTp

Herramientas BLASTn frente a ORF

blastn: ¿Qué matriz de sustitución se utiliza?