Si un módulo está completo o no, se puede verificar fácilmente evaluando la Definition
entrada asociada con el módulo; por ejemplo, en el módulo M00010 , viene dado por
Definition K01647 (K01681,K01682) (K00031,K00030)
que se puede traducir a
K01647 AND (K01681 OR K01682) AND (K00031 OR K00030)
Si esta expresión se evalúa como TRUE
, el módulo está completo.
Ahora me pregunto si existe información análoga para una sola reacción. Entonces, por ejemplo, para R00352 , se encuentra la siguiente información sobre Orthology:
Pero, ¿cómo sé ahora en qué relación lógica están los KO?
Entonces podría ser
K01648 AND K15230 AND K15231
o
K01648 OR (K15230 AND K15231)
etcétera.
¿Se puede recuperar esta información de KEGG y, de ser así, cómo?
EDITAR:
En el ejemplo anterior, la expresión correcta sería:
K01648 OR (K15230 AND K15231)
Uno necesita K01648
o las otras dos subunidades juntas. Entonces, desafortunadamente, no es tan fácil como lo describe @aretaon en su respuesta, ya que solo una de las dos subunidades no sería suficiente. Por lo tanto, uno no puede simplemente conectar los KO asociados a una reacción usando un lógico OR
.
Para reformular lo que ya mencionó en su pregunta: para que se complete un módulo KEGG (para que un organismo pueda realizar una determinada función), necesita un determinado conjunto de unidades funcionales o enzimas. Entonces, para evaluar las habilidades de un organismo, verificaría su genoma en busca de las secuencias de genes relacionadas con el módulo realizando la operación lógica que mencionó anteriormente.
Un módulo se compone de productos químicos (C) y reacciones (R), como puede ver en su ejemplo dado . Para explicar las diferencias entre módulos y reacciones, eche un vistazo a la última reacción, Isocitrate to 2-Oxoglutarate. Hay tres reacciones en caja (una de ellas es una combinación de dos) que conducen al Oxoglutarato. Cuando observa la Ortología (las enzimas involucradas) para las reacciones en el primer cuadro ( R01899+R00268 ) y el segundo cuadro ( R00267 ), verá que es la misma enzima (K0030) realizando reacciones diferentes. El tercer cuadro ahora contiene una reacción ( R00709) realizada por una segunda enzima (K0031), que conduce de la misma manera (se diferencia en utilizar NAD+ en lugar de NADP+ como aceptor de electrones). Entonces, para completar el módulo, puede usar cualquiera de los dos (esa es la razón del operador OR en la operación lógica).
Si ahora desea evaluar si un determinado tipo de reacción ocurre en un organismo dado, es suficiente con tener una de las posibles enzimas que catalizan esta reacción. Entonces:
K01648 OR K15230 OR K15231
clave
aretaón
clave