cuál es el mejor valor de corte de E en la búsqueda de homología de miARN

Estoy tratando de usar la base de datos miRBase para anotar algunas secuencias de microARN con una longitud de 22-24 pb. Agradezco mucho que alguien me diga si debo hacer este BLAST contra miARN maduro o una base de datos de secuencias de bucle de tallo. y la otra pregunta principal es qué número de valor E se acepta razonablemente como el valor E más bajo en los resultados de miRNA BLAST. Además, ¿qué herramienta sugiere para realizar análisis de enriquecimiento de miARN? por ejemplo, podemos usar DAVID para el análisis de enriquecimiento de genes (secuencia de codificación). Usando dicho análisis, podemos asignar funciones probables y roles biológicos a un grupo de miARN (no solo a un miARN). Cualquier comentario e idea es bienvenida.

Respuestas (1)

Si está utilizando BLAST para búsquedas cortas de nucleótidos, debe reducir el tamaño de la palabra a <=7. Es mejor alinear con secuencias maduras.

El valor E depende del tamaño de la base de datos. Si su base de datos de destino es enorme, debe aumentar el límite del valor electrónico. Si miRBase (para algunos organismos) es su base de datos, entonces tampoco es necesario ejecutar BLAST. Simplemente puede ejecutar SSEARCH (algoritmo de alineación local de Smith-Waterman).

Si está ejecutando BLAST contra miRbase, puede establecer el límite de valor e en 10. Esto está bien porque hay muchos miARN de aspecto similar con funciones diferentes. Si reduce el valor límite de e-value, puede perderlos.

Hay algunos otros criterios para la conservación de miARN, por ejemplo, debe haber una similitud muy alta (casi exacta) en la región de la semilla. Después de BLAST, asegúrese de que se conserve la región semilla.

¿Podemos usar DAVID para el análisis funcional de miARN?

No creo que DAVID se pueda usar directamente (los miARN deben anotarse en su base de datos). Lo que puede hacer es predecir los objetivos de su miARN y luego pasárselos a DAVID. DAVID no hará las predicciones pero hay otros programas (ver este post). También puede probar BioMart (proporcionado por ENSEMBL) para obtener detalles de GO. Incluso BioMart no proporciona una anotación funcional para los miARN (solo lo intenté para verificar). Así que lo mejor es comprobar los objetivos.

Gracias por tus comentarios. Quiero usar miRBase para hacer esta explosión que su tamaño de palabra predeterminado es 4, es bueno para la búsqueda de homología de secuencia corta, pero el límite de valor E es 10 por defecto que parece un poco alto para miRNA (secuencia corta) en mi opinión desde la probabilidad de tener una buena alineación por casualidad aumenta a medida que disminuye la longitud de la secuencia, ¿es correcto o no?
Sí, eso es verdad. Además, esa probabilidad aumenta cuando aumenta el tamaño de la base de datos. Si encuentra la respuesta adecuada, puede aceptarla (una marca de verificación a la izquierda).
De acuerdo. Con respecto a lo que discutimos, ¿podría sugerirme cuál es el mejor límite de valor E en el caso de la búsqueda de homología de miARN? Estoy un poco confundido acerca de la selección de este parámetro.
Estimado amigo, como dijiste, DAVID no se puede usar directamente para el análisis de miARN. Además, el análisis de objetivos de miARN con esta herramienta es una historia diferente. por el momento, mi atención se centra en los miARN, no en sus objetivos.
@Mary- editó la respuesta. No, no puede anotar directamente miARN. Necesitas encontrar sus objetivos primero. El valor E de 10 está bien (no vaya por debajo de esto).
¡Muchas gracias por estar conmigo! ¡Qué pasa con la base de datos de secuencias de bucle de tallo y miARN maduros, ambas disponibles en miRBase! ¿Cuál debo elegir como base de datos? mi inquietud sobre este tema es que debo confirmar el mejor acierto de la voladura con lo que busco en el laboratorio.
Mencioné en la respuesta: alinear contra maduro. Otras regiones no están tan bien conservadas.
10? ¿En realidad? No he trabajado con miRs pero 10 parece extremadamente alto. De hecho, trabajando en secuencias de nucleótidos cortas, no recomendaría usar el evalue en absoluto. En su lugar, optaría por una cobertura simple de %id y %.
@terdon 10 es seguro. Creo que el BLAST en línea solicita un corte de valor. Asigna 10 por defecto para búsquedas cortas de nucleótidos. Pero para miRNA, creo que se deben definir más parámetros. Creo que la penalización de inicio de brecha debería ser alta (la región de 5` debería coincidir perfectamente). Usar un alineador de lectura corto como corbatín tampoco es una mala idea. Le permite establecer una secuencia semilla y le permite definir discrepancias permitidas en regiones semilla y no semilla por separado.
Absolutamente. Tus parámetros suenan bien. Simplemente no usaría un valor de 10 como forma de determinar si un resultado fue interesante. Lo dejaría en 10 o más para asegurarme de obtener todo y luego ignorarlo y filtrar otras cosas como sugieres.