Explicar una red de genes a un estudiante de primer año

Tengo una matriz de adyacencia con una lista de genes conectados entre sí que significa la red de genes. ¿Cómo obtienes esta información de que un gen está conectado a otro en primer lugar? ¿Es que haces un análisis de microarreglos y encuentras genes que están regulados al alza y a la baja y asumes que todos los genes que están regulados al alza se regulan entre sí? Explique amablemente.

PS El ejemplo de microarray es lo que asumí. No significa que deba ser la forma en que se deduce una red de genes. Mi red es una no dirigida.

En cuanto a las redes no supervisadas, podría comenzar explicando algunos métodos de inferencia de red rudimentarios. Aquí hay una buena revisión ncbi.nlm.nih.gov/pmc/articles/PMC3956069 .

Respuestas (1)

No hay una respuesta única, porque las redes (o gráficos , como se les llama en matemáticas discretas) son herramientas flexibles que se pueden usar para modelar todo tipo de relaciones entre genes, transcripciones, proteínas u otras entidades en biología. (Y las redes también son modelos útiles en muchas otras disciplinas, como la sociología ). Según el tipo de red que esté considerando, existen varios métodos experimentales para determinar las conexiones. Doy sólo un par de ejemplos a continuación. Para obtener información general sobre las redes como modelos abstractos, consulte la teoría de grafos .

Redes reguladoras de genes

Una red reguladora de genes es un gráfico dirigido donde un gen (A) regula a otro (B). En este caso, las conexiones entre genes son direccionales y se pueden representar con flechas A B. Dependiendo exactamente de cómo defina "regulación", una conexión A B puede significar cosas diferentes, por ejemplo:

  • El gen A codifica un factor de transcripción que se une al gen B. En este caso, la evidencia de A B proviene de ensayos de proteínas que se unen al ADN, como la inmunoprecipitación de cromatina (ChIP). Grandes colecciones de tales datos están disponibles en bases de datos como Transfac .
  • La expresión del gen A provoca la regulación del gen B, por cualquier mecanismo (posiblemente indirectamente). En este caso, los datos de una interacción pueden provenir de experimentos en los que se induce (expresa por la fuerza) o se suprime/elimina el gen A y se miden los cambios resultantes en otros genes, por ejemplo, mediante micromatrices o secuenciación de ARN. Un famoso ejemplo temprano de esto es el conjunto de datos "Rosetta" sobre mutantes de eliminación de levadura.

La inferencia de redes reguladoras de genes es un tema amplio y complicado que no puedo cubrir aquí. Depende de muchos factores, como la forma en que modela la dimensión del tiempo (si tiene datos de estado estable o transitorios) y cómo parametriza la red para modelar los datos de expresión cuantitativamente. La revisión sugerida por @CMosychuk parece un buen lugar para comenzar.

Redes de coexpresión

Este tipo de red representa la coexpresión entre genes (o más exactamente, entre mRNAs o proteínas). Esta es típicamente una representación de correlaciones por pares entre genes a través de un conjunto de condiciones, por lo que la fuente de datos puede ser cualquier colección de datos de expresión de nivel de proteína o ARNm. (Aquí hay un ejemplo ). Debido a que las correlaciones son simétricas, las conexiones en este tipo de red no tienen dirección y se pueden representar simplemente como un enlace A B (no una flecha). Las correlaciones parciales a veces se utilizan para filtrar asociaciones indirectas, pero estas redes aún no contienen información de causalidad y no deben confundirse con el tipo dirigido.

Redes de interacción proteína-proteína

Estos son modelos de red no dirigida donde un enlace A B significa que dos proteínas interactúan físicamente. Los datos que respaldan tales conexiones provienen de varios ensayos bioquímicos para la interacción de proteínas, como el ensayo de dos híbridos o la inmunoprecipitación . Hay grandes bases de datos que recopilan datos de interacción proteína-proteína que se pueden usar para construir estos modelos de red, por ejemplo, BioGRID .

Hay muchos otros tipos de redes, pero esta ya es una respuesta larga :) Como puede ver, es importante tener claro con qué tipo de red está trabajando. A menudo, los datos que tiene disponibles determinarán qué modelo de red es adecuado; por ejemplo, si solo tiene una colección de perfiles de transcriptomas no relacionados y no tiene información de causalidad, una red de coexpresión podría ser el mejor modelo.