¿Los puntajes BLAST tienen alguna relación entre ellos?

¿Existe alguna relación entre las puntuaciones de BLAST (valor E, similitud, identidad, brecha, puntuación de bits)? ¿La puntuación del valor-e para una alineación es proporcional a otras puntuaciones, como la puntuación de similitud (es decir, cuanto menor sea el valor-e, mayor será la similitud)?

¡Gracias!

Esta respuesta podría ser útil: biology.stackexchange.com/a/40862/16651

Respuestas (1)

Sí, existe una relación entre ellos, pero es posible que no pueda observar la correlación entre algunos de ellos.

El número de coincidencias y la puntuación son definitivamente proporcionales, sin embargo, una mayor similitud se traduciría en una puntuación más alta solo si la longitud de los pares de puntuación es la misma. Gap tendría un efecto negativo en el puntaje, pero depende totalmente de cuáles sean sus puntajes/penalizaciones ( consulte la ayuda y la documentación de BLAST ).

El valor E es básicamente la probabilidad de que dos secuencias aleatorias tengan una cierta puntuación de coincidencia de una base de datos dada. Entonces, si es bajo o no para un acierto depende de la distribución de puntajes de la base de datos. Un valor E más bajo no significa una similitud más alta. Significa que un acierto de esta puntuación tiene una baja probabilidad de ser encontrado por casualidad. La distribución de puntajes generalmente está sesgada hacia puntajes bajos y, por lo tanto, los puntajes altos generalmente tienen un valor E bajo, pero el puntaje "alto" depende totalmente de sus consultas y, por lo tanto, esta afirmación no se puede generalizar.

De los documentos BLAST :

mi = k . metro . norte . mi λ . S

Esta fórmula tiene un sentido eminentemente intuitivo. Duplicar la longitud de cualquiera de las secuencias debería duplicar el número de HSP que obtienen una puntuación determinada. Además, para que un HSP alcance la puntuación 2x, debe obtener la puntuación x dos veces seguidas, por lo que se espera que E disminuya exponencialmente con la puntuación. Los parámetros K y lambda pueden considerarse simplemente como escalas naturales para el tamaño del espacio de búsqueda y el sistema de puntuación, respectivamente.