Base de datos de SNP médicamente validados

Estoy buscando todas las fuentes posibles de SNP humanos probados clínicamente. Hay un puñado de bases de datos que almacenan SNP (como dbSNP), pero solo necesito aquellas que hayan validado la presencia/ausencia de efectos fenotípicos con algunos metadatos adicionales. Gracias de antemano.

¿Cualquier tipo de enfermedad, o solo un subconjunto?
@mdperry cualquier enfermedad mendeliana servirá.
@EliKorvigo ¿No encontró la información deseada en las bases de datos GWAS que mencioné a continuación?
@WYSIWYG Estoy luchando por encontrar verdaderos negativos. Sin embargo, ya he encontrado muchos aspectos positivos verdaderos. Gracias por su respuesta. Esperaré un par de días antes de aceptarlo en caso de que alguien más encuentre una forma válida de encontrar verdaderos negativos.
@EliKorvigo Creo que para eso es posible que deba consultar el estudio original y obtener las estadísticas.
@EliKorvigo: tenga cuidado con las estadísticas de los estudios GWAS. Clínicamente, no nos emocionamos demasiado con ellos porque la rentabilidad de hacer un estudio ha superado la capacidad de realizar un análisis estadístico apropiado: los tamaños de muestra son casi siempre demasiado pequeños, demasiado ruido para señalar, hay varias revisiones para discutir. esto, por ejemplo, [ ncbi.nlm.nih.gov/pubmed/18464043] (revisión)
@VanceAlbaugh Gracias por señalarlo. Sí, en este momento tenemos muchos datos, pero debemos tener cuidado antes de hacer inferencias. Ha habido mucha discusión sobre cómo hacer los análisis estadísticos correctos.
@VanceAlbaugh exactamente. Ese es el objetivo de esta pregunta: no puedo confiar en los estudios GWAS bioinformáticos disponibles para obtener un conjunto de SNP negativos verdaderos debido a problemas estadísticos. Por lo tanto, trato desesperadamente de encontrar algo que esté clínicamente validado.
@EliKorvigo - sí, buena suerte con eso - No conozco ningún estudio de GWAS que se haya reproducido externamente de manera estadísticamente sólida y que se haya publicado. Si alguien hiciera eso, sería un gran problema porque el análisis de los datos no se ha perfeccionado. Tenemos preguntas similares en metabolómica, proteómica y RNAseq. Demasiado ruido, poca señal.
He agregado algunas referencias a los datos que he logrado recopilar.

Respuestas (2)

Puede buscar por rasgos (principalmente enfermedades) para la asociación de todo el genoma, en estas bases de datos:

Solo para hacer que esta publicación sea un poco más útil, debo agregar que hay varias fuentes adicionales que he encontrado:

  • UniProt tiene un conjunto de datos abierto llamadohumsavar
  • Base de datos ClinVar
  • base de datos HGMD
  • OMIM
  • Un artículo con una base de datos recolectada manualmente basada en publicaciones recientes en Nature Genetics.

Diferentes conjuntos de datos se cruzan hasta cierto punto, pero en general obtienes más de 200k SNP algo validados.