¿Genes parálogos en estudios de asociación de todo el genoma?

¿Alguien ha probado si los genes parálogos están sobrerrepresentados entre los genes identificados por los estudios de asociación del genoma completo (GWAS)?

Por ejemplo, si un estudio GWAS encuentra 200 genes asociados con la enfermedad/rasgo, y un número X de ellos puede clasificarse como perteneciente a Y familias de genes diferentes, ¿existe una prueba para ver si X e Y son más grandes de lo esperado, dado? el número total de genes y parálogas de genes en un genoma? Aquí estoy hablando de copias establecidas desde hace mucho tiempo dentro de una especie, no de CNV en diferentes individuos de la misma especie.

Estoy pensando que hay una pregunta interesante detrás de esto: si un gen se ha duplicado durante la evolución de un genoma, y ​​las diferentes copias de genes han asumido roles especializados, pero relacionados, un análisis imparcial como GWAS debería poder encontrar casos donde diferentes las copias parálogas se asocian a diferentes subenfermedades/subrasgos dentro de la misma enfermedad/rasgo global.

Hola. ¿Podría ayudar aclarando su pregunta? ¿Quiere saber si los genes/regiones parálogos están sobrerrepresentados en los aciertos de GWAS? Es una hipótesis interesante. ¿Tiene alguna idea/referencia de por qué este puede ser el caso? Siempre es mejor dar una pregunta tan completa y clara como sea posible. Gracias
Esa es una pregunta interesante (gracias por la expansión). Si los genes parálogos todavía estuvieran funcionalmente relacionados, es probable que haya redundancia entre ellos, por lo que es posible que un SNP en una de las copias no se manifieste en absoluto. Un SNP que afecta un rasgo específico de una de las copias necesitaría tener un efecto masivo (o el estudio requeriría un tamaño de muestra fenomenal) para encontrarlo (a menos que fuera un estudio dirigido solo a genes parálogos que se sabe que son enfermedades ). ¿relacionado?). No conozco ningún estudio, ¡pero me interesarán las respuestas de otros!
¿Es la prueba exacta de Fisher (una prueba de chi-cuadrado con suposiciones más relajadas) algo que ha considerado?
En realidad no entiendo cuál es la hipótesis. Primero, hay toneladas de factores de confusión para controlar; por ejemplo, es más probable que las familias de genes reguladores se expandan que las familias de genes estructurales, por lo que debe tener en cuenta eso (y mucho más). Su última pregunta sobre la subfuncionalización parece no tener nada que ver con la pregunta original sobre la sobrerrepresentación.
¿No se supone que los parálogos tienen una función divergente? Esperaría que estuvieran subrepresentados.
También puede probarlo contando parálogos solo en los hits, luego elija, por ejemplo. 200 genes aleatorios (dependiendo de cuántos aciertos capturó su GWAS) y cuente en ellos.
Creo que depende de cuán relacionados estén los parálogos. Si divergieron hace mucho tiempo, entonces podemos suponer que los SNP que aparecen en su GWAS hipotético están asociados de manera independiente con la enfermedad. Sin embargo, no es estrictamente posible que el mismo SNP ocurra en otro gen, es por definición un SNP diferente. Como los métodos GWAS generan correlaciones, no causalidades, si esos SNP iguales pero diferentes están asociados con la enfermedad, ese es el final de la historia. Se requiere una inspección más profunda para aprender más.
Este es un artículo en el que separaron los parálogos de los ortólogos e hicieron estudios de conservación de la interacción proteína-proteína entre especies. Los métodos que usaron podrían ser útiles para realizar estudios similares. ncbi.nlm.nih.gov/pmc/articles/PMC3447968

Respuestas (1)

No hay ningún informe de la literatura que diga tal cosa. Sin embargo, hice una revisión superficial del estudio GWAS sobre neuroblastoma .

  • SNP seleccionados con valor p > 0,05
  • Valores de p convertidos en una puntuación:
    -log 10 (valor p)
  • Mapeó los SNP a los genes mientras calculaba la puntuación acumulada para un gen

Simplemente clasifiqué los genes según sus nombres, asumiendo que muchos parálogos tienen nombres similares. Sé que no es la manera correcta de hacerlo. Sin embargo, encontré muchos grupos con nombres similares en la lista.

Ahora, el siguiente paso es encontrar parálogos reales y obtener la puntuación acumulada para un grupo de parálogos. Esta es una pequeña tarea:

  • Obtener secuencias de los genes.
  • Ejecute una búsqueda BLAST para encontrar parálogos
  • Asigne genes a grupos y encuentre puntajes

Puedo compartir el archivo con genes y puntajes. Sin embargo, continuaría solo si alguien está realmente interesado en continuar con esto; este podría ser un trabajo de investigación.

PD: si desea el archivo, simplemente comente su identificación de correo electrónico. Algún administrador de TI idiota ha bloqueado rapidshare/4shared, etc.