No tengo experiencia en biología, soy científico de datos y me gustaría saber si tiene sentido, desde el punto de vista biológico, analizar datos (datos SNP) provenientes de un solo cromosoma, y no de los 22 cromosomas. , para predecir el riesgo de una determinada enfermedad.
¿Debo utilizar obligatoriamente datos de todos los cromosomas? ¿Por qué?
Muchas gracias. Y lo siento si es una pregunta muy básica, pero realmente me gustaría entender esto.
Puede analizar un solo cromosoma. Todas las herramientas bioinformáticas que conozco permiten eso. Considere solo las lecturas que se asignan al cromosoma deseado (o cualquier segmento del genoma). Sin embargo, la mayoría de los experimentos de secuenciación de próxima generación secuencian el genoma completo y no solo un cromosoma. Simplemente terminará perdiendo información al no considerar otros cromosomas.
Además de la respuesta de @WYSIWYG, suponga que desea analizar la producción de cierta proteína A producida por el gen A en algún cromosoma A. Sus datos serán, por ejemplo, los valores de luminosidad/fluorescencia que surgen al etiquetar esta proteína específica. Pero para predecir este efecto de producción (en qué período estos valores podrían ser más altos, como en un modelo de predicción), el gen/factor que podría estar activando el gen A podría estar en algún otro cromosoma B. Hasta que sepa la actividad de eso, no podrá predecir con precisión la producción de esto.
En un modelo de Regresión/Árbol , su será categórico/continuo mostrando la actividad de los genes efectivos (B) mientras que la actividad del gen A depende .
Espero que esto ayude.
mgvaldes
mgvaldes
WYSIWYG
mgvaldes