¿Cómo recuperar la expresión lógica (basada en KO) para las reacciones de KEGG?

Si un módulo está completo o no, se puede verificar fácilmente evaluando la Definitionentrada asociada con el módulo; por ejemplo, en el módulo M00010 , viene dado por

Definition  K01647 (K01681,K01682) (K00031,K00030)

que se puede traducir a

K01647 AND (K01681 OR K01682) AND (K00031 OR K00030)

Si esta expresión se evalúa como TRUE, el módulo está completo.

Ahora me pregunto si existe información análoga para una sola reacción. Entonces, por ejemplo, para R00352 , se encuentra la siguiente información sobre Orthology:

ingrese la descripción de la imagen aquí

Pero, ¿cómo sé ahora en qué relación lógica están los KO?

Entonces podría ser

K01648 AND K15230 AND K15231 

o

K01648 OR (K15230 AND K15231)

etcétera.

¿Se puede recuperar esta información de KEGG y, de ser así, cómo?

EDITAR:

En el ejemplo anterior, la expresión correcta sería:

K01648 OR (K15230 AND K15231)

Uno necesita K01648o las otras dos subunidades juntas. Entonces, desafortunadamente, no es tan fácil como lo describe @aretaon en su respuesta, ya que solo una de las dos subunidades no sería suficiente. Por lo tanto, uno no puede simplemente conectar los KO asociados a una reacción usando un lógico OR.

Respuestas (1)

Para reformular lo que ya mencionó en su pregunta: para que se complete un módulo KEGG (para que un organismo pueda realizar una determinada función), necesita un determinado conjunto de unidades funcionales o enzimas. Entonces, para evaluar las habilidades de un organismo, verificaría su genoma en busca de las secuencias de genes relacionadas con el módulo realizando la operación lógica que mencionó anteriormente.

Un módulo se compone de productos químicos (C) y reacciones (R), como puede ver en su ejemplo dado . Para explicar las diferencias entre módulos y reacciones, eche un vistazo a la última reacción, Isocitrate to 2-Oxoglutarate. Hay tres reacciones en caja (una de ellas es una combinación de dos) que conducen al Oxoglutarato. Cuando observa la Ortología (las enzimas involucradas) para las reacciones en el primer cuadro ( R01899+R00268 ) y el segundo cuadro ( R00267 ), verá que es la misma enzima (K0030) realizando reacciones diferentes. El tercer cuadro ahora contiene una reacción ( R00709) realizada por una segunda enzima (K0031), que conduce de la misma manera (se diferencia en utilizar NAD+ en lugar de NADP+ como aceptor de electrones). Entonces, para completar el módulo, puede usar cualquiera de los dos (esa es la razón del operador OR en la operación lógica).

Si ahora desea evaluar si un determinado tipo de reacción ocurre en un organismo dado, es suficiente con tener una de las posibles enzimas que catalizan esta reacción. Entonces:

K01648 OR K15230 OR K15231 
Gracias por su respuesta. Desafortunadamente, no es tan simple (ver mi EDICIÓN), pero me gustaría que lo fuera... ;)
Traté de encontrar otra manera, pero creo que no hay ninguna. La sintaxis lógica que describe se define solo para módulos, y los módulos cubren solo partes seleccionadas de todas las rutas. Entonces, para estar seguro, si la enzima en una reacción es solo una parte de un complejo de múltiples enzimas (como en su ejemplo), ni siquiera puede volver a las vías porque las partes requeridas tampoco están definidas allí.
Sí. Traté de deducirlo de la estructura del módulo y la lista de reacciones, pero eso tampoco funciona, ya que es inconsistente entre los módulos, desafortunadamente... Lástima que no haya una solución para este problema, parece.