Me gustaría entender el significado del término motivo tal como se usa en biología molecular.
En un artículo en Nature Biotechnology , Patrik D'haeseleer afirma:
Los motivos de secuencia son patrones breves y recurrentes en el ADN que se supone que tienen una función biológica. A menudo indican sitios de unión específicos de secuencia para proteínas como nucleasas y factores de transcripción (TF).
¿Significa esto que en la secuencia de ADN de un gen hay patrones/subsecuencias recurrentes de ADN que se supone que tienen una función biológica? Si es así, ¿es posible encontrar esos motivos simplemente usando un software que detecta subcadenas recurrentes en una cadena?
En relación con la función biológica de tales motivos, me gustaría aclarar este extracto de un artículo de Williams et al. :
P. furiosus ORF PF1193 mostró un aumento de hasta 12 veces en el nivel de ARNm a los 20 minutos después de la irradiación (Tabla S1). PF1193 contiene un motivo de dihierro similar a la ferritina que se encuentra en proteínas y bacterioferritinas similares a la ferritina y Dps y se descubrió que pertenece a una nueva subclase de la superfamilia de carboxilatos de dihierro similar a la ferritina (Ramsay et al. 2006; Tatur et al. 2005).
Por "motivo", ¿quieren decir los autores que el gen PF1193 tiene una subsecuencia que se encuentra muchas veces en la secuencia de ADN del gen que codifica proteínas similares a ferritina y Dps, y que esto puede indicar que ellos (genes y las proteínas relacionadas) proteínas codificadas) tienen características/propiedades similares?
¿Cómo se relaciona esto con la oración en el extracto del artículo de Nature Biotechnology ?
A menudo indican sitios de unión específicos de secuencia para proteínas como nucleasas y factores de transcripción (TF).
Significado de motivo en biología molecular
En inglés, la palabra motivo (tomada del francés) tiene una variedad de significados en diferentes áreas. El que se toma prestado en biología molecular es el de patrón junto con una insinuación, tal vez, de emblema o insignia.
La palabra patrón indica tanto la repetición como un molde maestro a partir del cual se hacen las copias. En biología molecular esto indica que esto no es único, ocurre repetidamente. La palabra emblema sugiere un medio para identificar el grupo al que pertenece algo. En biología molecular se asocia con una función compartida por los miembros del grupo.
Tipos de motivo en biología molecular
Aquí la palabra motivo se aplica principalmente a las tres macromoléculas relacionadas, ADN, ARN y proteína. Todos estos son cadenas lineales de variedades restringidas de componentes definidos (cuatro nucleótidos, 20 aminoácidos) dispuestos en formas definidas a las que nos referimos con la secuencia de la macromolécula. Dentro de la secuencia general puede haber subsecuencias que, si se repiten, representan patrones y que pueden tener un significado funcional. Nos referimos a patrones como:
El primero de ellos es a lo que se refiere D'haeseleer. Cabe señalar que estos motivos de secuencia pueden ser absolutos o consistir en secuencias de consenso , como la del sitio de unión de ROX 1 en el artículo citado: Sin embargo, los nucleótidos o los aminoácidos no son los únicos componentes de las macromoléculas. que puede producir un patrón. Los motivos en biología molecular pueden estar compuestos por componentes estructurales. Esto se expresa en la siguiente definición de motivo proteico :
Los motivos de proteína son pequeñas regiones de estructura tridimensional de proteína o secuencia de aminoácidos compartida entre diferentes proteínas. Son regiones reconocibles de la estructura de la proteína que pueden (o no) estar definidas por una función química o biológica única.
Y una definición similar que considera solo motivos estructurales en proteínas agrega: “Un ejemplo… es un motivo hélice-giro-hélice. Este es un motivo en ciertas proteínas que se unen al ADN.
Identificación de motivos de secuencia por computadora
El límite del enfoque sugerido es que, estadísticamente, uno esperaría que cualquier patrón de secuencia pequeña se repitiera en el ADN, y el problema es cómo saber qué patrones recurrentes tienen importancia biológica. Debe tenerse en cuenta que no es solo el motivo de la secuencia lo que lo hace funcional, sino el contexto en el que se encuentra. Así, se descubrió una caja TATA u otros motivos de ADN que actúan como sitios de unión para los factores de transcripción (y se diferencian de otras ocurrencias aleatorias o no funcionales en el genoma) por su proximidad a las posiciones donde se inicia la transcripción. Su función se confirmó experimentalmente, por ejemplo, mediante la unión de la ARN polimerasa al ADN. (Espero que esto responda a la última pregunta sobre la función de los motivos como sitios de unión a proteínas).
Entonces, en general, no. Aunque admito que personalmente he usado enfoques computacionales para descubrir nuevos motivos pequeños de proteínas con enlaces de hidrógeno (un área algo especializada).
El motivo di-hierro similar a la ferritina
Este no es un motivo de secuencia de ADN. Ni siquiera es un motivo de secuencia de proteína, sino un motivo de proteína estructural. La definición se puede encontrar en InterPro :
Esta entrada representa un grupo de proteínas que contienen un dominio similar a la ferritina, que es un dominio de alrededor de 145 residuos formado por un haz de cuatro hélices que rodea un sitio de dihierro con puente oxo que no es hemo ni azufre. El sitio de dihierro está contenido dentro de un haz de cuatro hélices torcidas hacia la izquierda constituido por dos pares de hélices antiparalelas conectadas a través de una conexión cruzada hacia la izquierda.
Se muestra aquí con las hélices de color amarillo y las esferas rojas de los átomos de hierro:
[De deMare et al. (1996) ]
notas al pie
La hélice-giro-hélice también se conoce como dominio . La distinción entre motivo y dominio es de tamaño (nótese lo pequeño en la definición de motivo proteico). Sin embargo, InterPro se refiere al patrón de dihierro similar a la ferritina como un motivo, por lo que puede considerarse un uso aceptable.
Se podría argumentar que como la secuencia y la estructura de las proteínas se especifican en el ADN, el motivo también debería estar en el ADN. Esto es una falacia. La información está ahí, pero en forma críptica. La redundancia del código genético significa que las secuencias de proteínas están mucho más conservadas que las secuencias de ADN correspondientes, y los patrones estructurales tridimensionales no son evidentes al inspeccionar las secuencias de aminoácidos.
Re:
Cuando dicen "motivo", ¿quieren decir que el gen PF1193 tiene una subsecuencia que se encuentra muchas veces en la secuencia de ADN del gen que codifica proteínas similares a ferritina y Dps? ¿Y esto puede implicar que tengan características/propiedades similares?
Sí, aunque las secuencias de motivos pueden no ser exactamente idénticas, ya que lo que realmente importa es la estructura tridimensional producida y, por lo tanto, su función (ya sea de unión, enzimática o lo que sea). Puede pensar en ellos como unidades funcionales reconocibles, a menudo, pero no siempre, autosuficientes. Por ejemplo, una secuencia promotora en el ADN se consideraría un motivo, como lo sería un dedo de zinc en una proteína, como lo sería una cola poli-A en un ARNm.
Un problema en el uso de secuencias de motivos para identificar genes de función relacionada es que durante la evolución, las secuencias pueden haber cambiado incluso cuando la estructura tridimensional (y la función) siguen siendo similares. Aquí hay un documento que trabaja en ese problema de hace aproximadamente una década:
J Biol Chem. 8 de junio de 2012; 287(24): 20565–20575. Publicado en línea el 25 de abril de 2012. doi: 10.1074/jbc.M112.367458 PMCID: PMC3370241 PMID: 22535960 "Uso de redes filogenéticas estructurales para la clasificación de la superfamilia similar a la ferritina"
reencuentros
ACVILL
Manuela
David
Manuela
Manuela