¿Cómo interpretar la matriz de identidad porcentual creada por Clustal Omega?

Hice una alineación de secuencias múltiples usando Clustal omega. se comprobó la similitud de 3 secuencias de proteínas: aspartil aminopeptidasa [Homo sapiens], aminopeptidasa P (APP) [Plasmodium falciparum 3D7], aminopeptidasa de levadura (S000001586) APE1. Obtuve la matriz de identidad porcentual como

Matriz de porcentaje de identidad: creada por Clustal2.1

 1: PF3D7_1454400              100.00   16.18   20.35
 2: gi|5902181|gb|AAD01211.2|   16.18  100.00   29.66
 3: S000001586                  20.35   29.66  100.00 

Mis dudas:

  1. Me gustaría saber cómo interpretar este resultado de la matriz.
  2. Volviendo a los resultados de las alineaciones de secuencias, cuando hago clic en "Mostrar colores", el resumen de la alineación se colorea en 4 colores: rojo, verde, azul y rosa. ¿Alguien puede ayudarme a descifrar la referencia de color del resumen de alineación?

Gracias

Respuestas (1)

        Gene-1   Gene-2    Gene-3
Gene-1  100.00    16.18     20.35
Gene-2  16.18    100.00     29.66
Gene-3  20.35     29.66    100.00 

Gene-1 y Gene-1 tienen una similitud del 100% (y todos los demás elementos diagonales). Gene-1 y Gene-2 ​​tienen una similitud del 16,15 %, y así sucesivamente. Por lo tanto la matriz es simétrica M(i,j) = M(j,i).

También puede mostrar solo la parte triangular superior de esta matriz y eso sería suficiente.

        Gene-1   Gene-2    Gene-3
Gene-1  100.00    16.18     20.35
Gene-2           100.00     29.66
Gene-3                     100.00

Los colores básicamente denotan el tipo (naturaleza molecular) del residuo. Echa un vistazo a esto y esto .