¿Cómo hacer la alineación de secuencias múltiples?

Tengo una secuencia de ADN que produce la proteína 1. pero ahora he pedido:

  1. comparar la secuencia de aminoácidos de la proteína 1 con nueve proteínas homólogas y realizar un alineamiento multisecuencial (MSA) de las secuencias.

  2. Determinar una secuencia de consenso para las proteínas sobre la base de la MSA.

  3. Encuentre partes específicas de las proteínas que se conservan, luego explique por qué se conservan estas partes.

Un buen comienzo sería cargar su secuencia en una herramienta/software de alineación. Sugeriría usar MUSCLE ( drive5.com/muscle ). Es relativamente fácil de usar.

Respuestas (1)

Herramientas MSA

compare la secuencia de aminoácidos de la proteína 1 con nueve proteínas homólogas y realice una alineación múltiple de las secuencias.

EBI tiene un portal para muchas herramientas de MSA y también hay otras herramientas de MSA disponibles en otros lugares.

En la investigación, es una buena práctica usar varias técnicas de alineación y ver cuál genera indels sensibles . Por lo general, este es el número más bajo de eventos indel.

Clustal Omega es probablemente la herramienta MSA más sofisticada alojada en el sitio de EBI; sin embargo, es relativamente nueva y no está tan establecida como T-coffee o MUSCLE .

Tenga en cuenta que estas herramientas se actualizan con bastante regularidad. Esta pregunta y la respuesta principal sobre las herramientas MSA "de vanguardia" de 2014 se refieren a un documento de 2011 que intenta comparar las herramientas de MSA. Como puede imaginar, las herramientas de última generación cambian rápidamente (por ejemplo, se lanzó clustal-w2 y ahora clustal omega desde ese documento de evaluación comparativa). Sin embargo, para la mayoría de los investigadores, es una preferencia personal, y las diferentes herramientas de MSA son "mejores" para diferentes situaciones (velocidad de cálculo, número de alineaciones, similitud de secuencias, complejidad de la estructura secundaria, alineaciones locales frente a globales, etc.) .

Secuencia de consenso

Determinar una secuencia de consenso para las proteínas en función de la alineación múltiple.

Esto depende completamente de la información de su alineación.

Una forma común de hacer una secuencia de consenso es simplemente tomar el residuo más abundante en cada posición en el MSA. No me gusta este enfoque porque realza la importancia de los residuos abundantes y disminuye la apariencia de los residuos menos abundantes. Esto distorsiona la bioquímica y puede conducir fácilmente a secuencias que serían imposibles o inútiles en biología. Siempre preferiría ver una alineación en bruto.

Conservación entre alineaciones

Encuentre partes específicas de las proteínas que se conservan, luego explique por qué se conservan estas partes.

La conservación generalmente implica una función y, con suerte, tendrá un homólogo que tenga una función categorizada. Quizás en su caso se podría atribuir esta función a una secuencia conservada en los otros homólogos.

Una herramienta brillante se llama consurf .

imagen de alineaciones estructurales y secuenciales coloreadas según la conservación

Puede cargar su archivo MSA en él y codificará por colores las regiones de conservación de púrpura a azul. Una región morada implica una selección evolutiva para no cambiar esa región, lo que implica que es una región "funcional".

Consurf funciona mejor con más secuencias, por lo que quizás no sea apropiado para este proyecto. En su lugar, intente cargar la alineación en Jalview y muestre "conservación de secuencia".

Imagen de gráfico de barras que muestra diferentes puntajes de conservación en diferentes posiciones de secuencia

Precaución.

Al realizar un MSA, recuerde que el algoritmo asume que la secuencia es homóloga y esa suposición puede producir errores. Si se ve mal, ¡probablemente lo sea!