Parámetros del algoritmo del sitio web PSI-BLAST

http://blast.ncbi.nlm.nih.gov/Blast.cgi

En este sitio web, cuando quiero aplicar el algoritmo psi-blast en una secuencia, en la sección de parámetros del algoritmo, ¿qué significa el umbral PSI-BLAST? El signo de interrogación dice que significa que:

Establezca el umbral de significancia estadística para incluir una secuencia en el modelo utilizado por PSI-BLAST para crear el PSSM en la siguiente iteración.

Otro parámetro está allí llamado pseudocount. No entendí eso también. No pude entender lo que esto significa, alguien por favor explíquelo en un lenguaje simple.

Respuestas (1)

PSI-BLAST es un algoritmo iterativo. Cada ciclo utiliza un modelo (la matriz de puntuación específica de la posición, o PSSM ) para buscar secuencias que coincidan con el modelo, luego actualiza el modelo con las secuencias encontradas y luego ejecuta la búsqueda nuevamente con el modelo actualizado. Ese valor P controla cuál de las secuencias encontradas en cada iteración debe incluirse en el nuevo modelo (es decir, solo incluye aquellas secuencias que satisfacen el valor P).

Con respecto a los pseudoconteos , este es un valor que debe agregarse a cada columna en el PSSM. El motivo es evitar entradas de conteo cero, lo que puede dar problemas más adelante. Pero como sugiere la ayuda:

Parámetro de pseudoconteo. Si se especifica cero, el parámetro se determina automáticamente a través de un principio de descripción de longitud mínima (PMID 19088134). Se sugiere un valor de 30 para obtener el comportamiento aproximado antes de implementar el principio de longitud mínima.

Probablemente esté bien dejar la opción predeterminada a menos que tenga alguna razón para cambiarla.