¿Los puntajes BLAST tienen alguna relación entre ellos?

Question

¿Los puntajes BLAST tienen alguna relación entre ellos?

explosión
Biología
bioinformática
alineación de secuencias

mehsan

¿Existe alguna relación entre las puntuaciones de BLAST (valor E, similitud, identidad, brecha, puntuación de bits)? ¿La puntuación del valor-e para una alineación es proporcional a otras puntuaciones, como la puntuación de similitud (es decir, cuanto menor sea el valor-e, mayor será la similitud)?

¡Gracias!

RAM

Esta respuesta podría ser útil: biology.stackexchange.com/a/40862/16651

Respuestas (1)

¿Los puntajes BLAST tienen alguna relación entre ellos?

Esta respuesta podría ser útil: biology.stackexchange.com/a/40862/16651

WYSIWYG · Answer 1

Sí, existe una relación entre ellos, pero es posible que no pueda observar la correlación entre algunos de ellos.

El número de coincidencias y la puntuación son definitivamente proporcionales, sin embargo, una mayor similitud se traduciría en una puntuación más alta solo si la longitud de los pares de puntuación es la misma. Gap tendría un efecto negativo en el puntaje, pero depende totalmente de cuáles sean sus puntajes/penalizaciones ( consulte la ayuda y la documentación de BLAST ).

El valor E es básicamente la probabilidad de que dos secuencias aleatorias tengan una cierta puntuación de coincidencia de una base de datos dada. Entonces, si es bajo o no para un acierto depende de la distribución de puntajes de la base de datos. Un valor E más bajo no significa una similitud más alta. Significa que un acierto de esta puntuación tiene una baja probabilidad de ser encontrado por casualidad. La distribución de puntajes generalmente está sesgada hacia puntajes bajos y, por lo tanto, los puntajes altos generalmente tienen un valor E bajo, pero el puntaje "alto" depende totalmente de sus consultas y, por lo tanto, esta afirmación no se puede generalizar.

De los documentos BLAST :

$mi = k . metro . norte . {mi}^{- λ . S}$ $E=K.m.n.e^{-\lambda.S}$

Esta fórmula tiene un sentido eminentemente intuitivo. Duplicar la longitud de cualquiera de las secuencias debería duplicar el número de HSP que obtienen una puntuación determinada. Además, para que un HSP alcance la puntuación 2x, debe obtener la puntuación x dos veces seguidas, por lo que se espera que E disminuya exponencialmente con la puntuación. Los parámetros K y lambda pueden considerarse simplemente como escalas naturales para el tamaño del espacio de búsqueda y el sistema de puntuación, respectivamente.

¿Los puntajes BLAST tienen alguna relación entre ellos?

mehsan

RAM

Respuestas (1)

WYSIWYG

blastn: ¿Qué matriz de sustitución se utiliza?

Alineación de múltiples secuencias en un grupo heterogéneo

¿Cómo interpretar la matriz de identidad porcentual creada por Clustal Omega?

Número de copia BLAST local por acierto

¿Cuál es la diferencia entre las alineaciones de secuencias locales y globales?

¿Cómo comparar las implementaciones del algoritmo Smith-Waterman?

¿Cómo puedo alinear más de 2 secuencias localmente?

Explosión de bases de datos

Términos GO para organismos no modelo

constitución de la región de lectura y gen (IGV)