Se podría decir que soy un bioinformático aficionado o que intento convertirme en uno. Tengo un archivo BAM, del cual he logrado, usando UGENE , extraer datos de consenso en formato FASTA. Ahora veo una sola serie de nucleótidos y sus complementos para cada cromosoma. Lo que no veo son dos secuencias correspondientes. Los datos de SNP (p. ej., SNPedia ) citan (si lo entiendo correctamente) el SNP en el mismo sitio en cada cromosoma del par. No sé cómo determinar mi variación, ya que solo veo un nucleótido en un sitio dado, no el par.
Bastante seguro de que me estoy perdiendo algo fundamental aquí. ¡Gracias por cualquier ayuda para navegar en esta jungla!
Si está buscando consultas simples y únicas, podría ser mejor cargar el archivo BAM y un genoma de referencia relevante en un navegador como IGV y simplemente navegar a esa posición específica.
Para algunos datos que tenía, un SNP heterocigoto se vería como en la imagen a continuación, ha habido un SNP de A a G y un SNP de C a T:
Para listas más largas de consultas, echaría un vistazo a BEDtools: https://bedtools.readthedocs.org/en/latest/content/bedtools-suite.html
Si esto no te ayuda, te recomiendo que hagas tu pregunta en https://www.biostars.org/ Ahí encontrarás ayuda de verdaderos bioinformáticos.
No necesariamente esperaría que las regiones de heterocigosidad fueran evidentes a partir de un ayuno de consenso. Me gustaría saber si conoce algunos sitios potenciales o ejecutar su .bam a través de algo que llamará SNP.
terdón
Bagazo