Significado de 'motivo' en biología molecular

Me gustaría entender el significado del término motivo tal como se usa en biología molecular.

En un artículo en Nature Biotechnology , Patrik D'haeseleer afirma:

Los motivos de secuencia son patrones breves y recurrentes en el ADN que se supone que tienen una función biológica. A menudo indican sitios de unión específicos de secuencia para proteínas como nucleasas y factores de transcripción (TF).

¿Significa esto que en la secuencia de ADN de un gen hay patrones/subsecuencias recurrentes de ADN que se supone que tienen una función biológica? Si es así, ¿es posible encontrar esos motivos simplemente usando un software que detecta subcadenas recurrentes en una cadena?

En relación con la función biológica de tales motivos, me gustaría aclarar este extracto de un artículo de Williams et al. :

P. furiosus ORF PF1193 mostró un aumento de hasta 12 veces en el nivel de ARNm a los 20 minutos después de la irradiación (Tabla S1). PF1193 contiene un motivo de dihierro similar a la ferritina que se encuentra en proteínas y bacterioferritinas similares a la ferritina y Dps y se descubrió que pertenece a una nueva subclase de la superfamilia de carboxilatos de dihierro similar a la ferritina (Ramsay et al. 2006; Tatur et al. 2005).

Por "motivo", ¿quieren decir los autores que el gen PF1193 tiene una subsecuencia que se encuentra muchas veces en la secuencia de ADN del gen que codifica proteínas similares a ferritina y Dps, y que esto puede indicar que ellos (genes y las proteínas relacionadas) proteínas codificadas) tienen características/propiedades similares?

¿Cómo se relaciona esto con la oración en el extracto del artículo de Nature Biotechnology ?

A menudo indican sitios de unión específicos de secuencia para proteínas como nucleasas y factores de transcripción (TF).

Ciertamente significan una alineación no tan mala, debe explotar (el AA de) su proteína o algunas partes de ella para ver qué tan buena es.
En el extracto de su artículo vinculado, "motivo" se refiere a un patrón de secuencia de proteínas en lugar de un patrón de secuencia de ADN.
@reuns ¿AA significa Amino Acids? He "explotado" la proteína y he encontrado algunas similitudes con la proteína similar a la ferritina de Pleurocapsa (y otra proteína de protección del ADN de otras bacterias). Luego alineé la secuencia de ADN del gen PF1193 y la secuencia de ADN del gen que codifica la proteína similar a la ferritina de Pleurocapsa y también encontré similitudes...
He editado su pregunta para que se ajuste al estilo científico inglés. He cambiado la biología por biología molecular, ya que los ornitólogos entenderían algo muy diferente por motivo. Simplifiqué la última parte porque no pude entender lo que estabas tratando de decir. Verás como la pregunta ahora es más compacta y legible. Tenga en cuenta que al referirse a artículos publicados, las declaraciones en ellos deben atribuirse a los autores y no a la revista. Solo atribuya opiniones a las revistas cuando aparezcan en editoriales.
@David gracias.
@David muchas gracias! Realmente me gustaría entender completamente las preguntas de mi publicación que ha puesto en cursiva.

Respuestas (2)

Significado de motivo en biología molecular

En inglés, la palabra motivo (tomada del francés) tiene una variedad de significados en diferentes áreas. El que se toma prestado en biología molecular es el de patrón junto con una insinuación, tal vez, de emblema o insignia.

La palabra patrón indica tanto la repetición como un molde maestro a partir del cual se hacen las copias. En biología molecular esto indica que esto no es único, ocurre repetidamente. La palabra emblema sugiere un medio para identificar el grupo al que pertenece algo. En biología molecular se asocia con una función compartida por los miembros del grupo.

Tipos de motivo en biología molecular

Aquí la palabra motivo se aplica principalmente a las tres macromoléculas relacionadas, ADN, ARN y proteína. Todos estos son cadenas lineales de variedades restringidas de componentes definidos (cuatro nucleótidos, 20 aminoácidos) dispuestos en formas definidas a las que nos referimos con la secuencia de la macromolécula. Dentro de la secuencia general puede haber subsecuencias que, si se repiten, representan patrones y que pueden tener un significado funcional. Nos referimos a patrones como:

  • Motivos de secuencia de ADN
  • Motivos de secuencia de ARN
  • Motivos de secuencia de proteínas (o aminoácidos)

El primero de ellos es a lo que se refiere D'haeseleer. Cabe señalar que estos motivos de secuencia pueden ser absolutos o consistir en secuencias de consenso , como la del sitio de unión de ROX 1 en el artículo citado: Sin embargo, los nucleótidos o los aminoácidos no son los únicos componentes de las macromoléculas. que puede producir un patrón. Los motivos en biología molecular pueden estar compuestos por componentes estructurales. Esto se expresa en la siguiente definición de motivo proteico :
Secuencia de consenso del sitio de unión de ROX

Los motivos de proteína son pequeñas regiones de estructura tridimensional de proteína o secuencia de aminoácidos compartida entre diferentes proteínas. Son regiones reconocibles de la estructura de la proteína que pueden (o no) estar definidas por una función química o biológica única.

Y una definición similar que considera solo motivos estructurales en proteínas agrega: “Un ejemplo… es un motivo hélice-giro-hélice. Este es un motivo en ciertas proteínas que se unen al ADN.

Identificación de motivos de secuencia por computadora

El límite del enfoque sugerido es que, estadísticamente, uno esperaría que cualquier patrón de secuencia pequeña se repitiera en el ADN, y el problema es cómo saber qué patrones recurrentes tienen importancia biológica. Debe tenerse en cuenta que no es solo el motivo de la secuencia lo que lo hace funcional, sino el contexto en el que se encuentra. Así, se descubrió una caja TATA u otros motivos de ADN que actúan como sitios de unión para los factores de transcripción (y se diferencian de otras ocurrencias aleatorias o no funcionales en el genoma) por su proximidad a las posiciones donde se inicia la transcripción. Su función se confirmó experimentalmente, por ejemplo, mediante la unión de la ARN polimerasa al ADN. (Espero que esto responda a la última pregunta sobre la función de los motivos como sitios de unión a proteínas).

Entonces, en general, no. Aunque admito que personalmente he usado enfoques computacionales para descubrir nuevos motivos pequeños de proteínas con enlaces de hidrógeno (un área algo especializada).

El motivo di-hierro similar a la ferritina

Este no es un motivo de secuencia de ADN. Ni siquiera es un motivo de secuencia de proteína, sino un motivo de proteína estructural. La definición se puede encontrar en InterPro :

Esta entrada representa un grupo de proteínas que contienen un dominio similar a la ferritina, que es un dominio de alrededor de 145 residuos formado por un haz de cuatro hélices que rodea un sitio de dihierro con puente oxo que no es hemo ni azufre. El sitio de dihierro está contenido dentro de un haz de cuatro hélices torcidas hacia la izquierda constituido por dos pares de hélices antiparalelas conectadas a través de una conexión cruzada hacia la izquierda.

Se muestra aquí con las hélices de color amarillo y las esferas rojas de los átomos de hierro:

El motivo di-hierro similar a la ferritina

[De deMare et al. (1996) ]

notas al pie

  1. La hélice-giro-hélice también se conoce como dominio . La distinción entre motivo y dominio es de tamaño (nótese lo pequeño en la definición de motivo proteico). Sin embargo, InterPro se refiere al patrón de dihierro similar a la ferritina como un motivo, por lo que puede considerarse un uso aceptable.

  2. Se podría argumentar que como la secuencia y la estructura de las proteínas se especifican en el ADN, el motivo también debería estar en el ADN. Esto es una falacia. La información está ahí, pero en forma críptica. La redundancia del código genético significa que las secuencias de proteínas están mucho más conservadas que las secuencias de ADN correspondientes, y los patrones estructurales tridimensionales no son evidentes al inspeccionar las secuencias de aminoácidos.

Muchas gracias @David. La situación es más complicada de lo que pensaba. Pero, ¿existen algunos softwares que descubren motivos? Como si doy como entrada la secuencia de ADN del gen y me los da... Leí sobre el localizador "SSR" en este foro biology.stackexchange.com/questions/38913/…
Algún software que tenga implementado el contexto biológico que necesitas y las evidencias experimentales (por lo que es una especie de "base de datos" de motivos).
Finalmente, solo para aclarar definitivamente este punto importante: cuando dice La palabra emblema sugiere un medio para identificar el grupo al que pertenece algo. En biología molecular se asocia con una función compartida por los miembros del grupo. ¿Significa que si dos genes tienen un motivo de secuencia de ADN común, comparten la función biológica relativa a este motivo?
Los motivos de la secuencia de ADN de @Manuella generalmente se relacionan con el reconocimiento por parte de las proteínas, para la unión y quizás la escisión o la modificación química. Por lo general, no hablamos sobre la función de la función biológica de un motivo de ADN y, como traté de insinuar, tales motivos pueden ser necesarios, pero no suficientes para iniciar la transcripción. Este tema se trata en muchas revisiones de transcripción, algunas de las cuales, sin duda, tendrán tablas de motivos.
@Manuella El ángulo de predicción está más en primer plano en las proteínas, donde los motivos de secuencia específicos pueden sugerir que una proteína está etiquetada para el transporte a un orgánulo en particular. Por lo tanto, sitios como SwissProt tienen bases de datos de motivos de proteínas particulares y le permiten ingresar una secuencia de proteínas para averiguar qué motivos contiene. La estructura 3D es algo diferente. Ha habido una serie de proyectos que determinan la estructura de proteínas desconocidas. Una función putativa a menudo se basa en los motivos estructurales revelados, generalmente utilizando experiencia, aunque existe un software de comparación de estructuras 3D.
Vale, muchas gracias. Entonces, los motivos de la secuencia de ADN generalmente se relacionan con el reconocimiento por parte de las proteínas... por lo tanto, creo que mi idea inicial estaba completamente equivocada. Entonces, una última pregunta @David para confirmar oficialmente que mis suposiciones lamentablemente no tenían sentido.
Por función biológica simplemente quise decir que si dos genes tienen un motivo de secuencia de ADN en común, tal vez sus proteínas codificadas podrían tener algunas propiedades "funcionales" en común... por ejemplo, si considero el gen que codifica la proteína ferritina, sé que la proteína Ferritina tiene la capacidad de evitar la producción de radicales libres hidroxilo, que pueden catalizar el daño oxidativo de las biomoléculas, porque pueden almacenar Hierro y evitar la reacción de Fenton.
Entonces, si considero otro gen que tiene una subsecuencia en su secuencia genética de ADN que es un motivo para el gen que codifica la proteína ferritina, ¿puedo decir que este último gen podría codificar una proteína que tiene la misma propiedad agradable de la proteína ferritina de almacenar Hierro y evitar la producción de radicales libres de hidroxilo ?
Un punto que no enfaticé en mi respuesta (que puedo incluir en una revisión posterior): la mayoría de los motivos de la secuencia de ADN quedan fuera de la región de un gen que especifica la secuencia de aminoácidos. Entonces, si dos genes tienen un motivo de este tipo en común, implica algún tipo de similitud en el control de su expresión en lugar de sus productos proteicos. No soy un experto en transcripción, pero, por ejemplo, muchos genes se transcriben en respuesta al interferón y comparten motivos: elementos de respuesta sensibles al interferón. Sin embargo, los genes codifican muchos tipos diferentes de proteínas que se necesitan para combatir los virus.
De acuerdo ! @David Ese era el punto que quería en pocas palabras... si estos motivos se encuentran en el CDS (cuya secuencia determina la secuencia de aminoácidos en una proteína), qué sucede. ¿Son las proteínas codificadas similares en sus funciones? Esta discusión me dejó claro que quiero saber esto.
@Manuela: consulte la nota al pie 2. Entonces, es mejor observar las secuencias de aminoácidos. Los motivos de secuencia en las proteínas pueden indicar la función, como en las proteínas quinasas, pero también pueden ser etiquetas de transporte. SwissProt generalmente se lo dirá.

Re:

Cuando dicen "motivo", ¿quieren decir que el gen PF1193 tiene una subsecuencia que se encuentra muchas veces en la secuencia de ADN del gen que codifica proteínas similares a ferritina y Dps? ¿Y esto puede implicar que tengan características/propiedades similares?

Sí, aunque las secuencias de motivos pueden no ser exactamente idénticas, ya que lo que realmente importa es la estructura tridimensional producida y, por lo tanto, su función (ya sea de unión, enzimática o lo que sea). Puede pensar en ellos como unidades funcionales reconocibles, a menudo, pero no siempre, autosuficientes. Por ejemplo, una secuencia promotora en el ADN se consideraría un motivo, como lo sería un dedo de zinc en una proteína, como lo sería una cola poli-A en un ARNm.

Un problema en el uso de secuencias de motivos para identificar genes de función relacionada es que durante la evolución, las secuencias pueden haber cambiado incluso cuando la estructura tridimensional (y la función) siguen siendo similares. Aquí hay un documento que trabaja en ese problema de hace aproximadamente una década:

J Biol Chem. 8 de junio de 2012; 287(24): 20565–20575. Publicado en línea el 25 de abril de 2012. doi: 10.1074/jbc.M112.367458 PMCID: PMC3370241 PMID: 22535960 "Uso de redes filogenéticas estructurales para la clasificación de la superfamilia similar a la ferritina"

¡Explota la proteína y observa si los primeros resultados son similares a los de la ferritina!
Gracias @Arman! Sí, también leí en ncbi que los motivos se usan como base de clasificación de proteínas. Pero entonces, dado que ha confirmado lo que escribí (el extracto que informó) al menos conceptualmente, como estimación aproximada, ¿puedo encontrar motivos con un código de Python que encuentre subcadenas recurrentes en una cadena? (donde la cadena es la secuencia de ADN del gen)
Esta respuesta es incorrecta con respecto al motivo de dihierro similar a la ferritina citado en la pregunta. Este es un motivo de estructura de proteína, no un motivo de ADN. La identificación de familias de genes a partir de secuencias de ADN es, por supuesto, importante, pero se hace sobre la base de la similitud general de la secuencia, no generalmente sobre la base de motivos particulares, y no creo que esto sea lo que preguntaba el cartel en términos de análisis por computadora. Interpreto su pregunta como el uso de computadoras para descubrir motivos, en lugar de identificarlos en secuencias de ADN.
@David, en realidad, estaba particularmente interesado en identificar motivos en secuencias de ADN ... pero sí, a la respuesta le faltaban algunas cosas.