Secuenciación del genoma completo y recuento de cromosomas

En general, ¿las técnicas estándar de secuenciación del genoma completo se basan más en los recuentos de cromosomas conocidos, llegan de forma independiente a los recuentos de cromosomas y/o no abordan directamente problemas como el número de bases, la aneuploidía y la poliploidía?

Por ejemplo, ¿las técnicas normales de secuenciación del genoma completo habrían detectado que los humanos tienen 46 cromosomas en lugar de 48?

Tal vez una mejor manera de plantear esta pregunta sería la siguiente:

Dada la secuencia del genoma completo para los humanos y la creencia de que el chimpancé tenía 46 cromosomas, la secuenciación del genoma completo del chimpancé probablemente diría

1) Aquí están las secuencias de esos 46 y por cierto sobró material.

2) Esta es la mejor representación de todo el ADN del chimpancé mapeado en 46 cromosomas.

3) Aquí están las secuencias de esos 46 y los chimpancés parecen tener 48 cromosomas.

Respuestas (3)

Estoy bastante seguro de que se basa en un genoma de referencia. Como en, desde la secuenciación del genoma humano original, la mayoría de las técnicas utilizadas hoy en día se basan en esa construcción original (con modificaciones).

Así es como la gente lo usa para detectar variaciones en el número de copias (CNV) y polimorfismos de un solo nucleótido (SNP) con estas técnicas de secuenciación (y también aneuploidía).

Las lecturas del experimento de secuenciación se comparan con el genoma de referencia y, si se observan diferencias estadísticamente significativas en el número de lecturas, se notan como diferencias en el genoma. Si hay ADN adicional sin mapear, entonces probablemente no sabrá dónde colocarlo y lo llamará "material adicional".

Así que #1.

Lo que dice Biomed_guy es básicamente la respuesta, solo quería aclarar un poco. Cuando secuencia el ADN, hace algo durante la preparación de su biblioteca de ADN para convertirlo en pequeños fragmentos si aún no lo está, como cortar el ADN. Esto le brinda fragmentos muy pequeños de ADN que aún deberían ser bastante únicos cuando se comparan con el genoma de referencia.

Pero como se respondió anteriormente, el factor determinante de cómo se mapea el ADN es el genoma de referencia que está utilizando. Entonces, la respuesta es lo que dice en 1 y 2. Cuando intenta averiguar qué ADN tiene, comienza con una secuencia de referencia que es todo el ADN genómico 'dispuesto' para que sus fragmentos puedan compararse con él. y emparejado con una región de mejor ajuste basada en la secuencia coincidente. Cualquier cosa que no coincida con el genoma ref se vuelca en un archivo de salida 'basura'.

Entonces, conceptualmente, muchas secuencias de genes están altamente conservadas entre humanos y chimpancés. Esto significaría que podría alinear con éxito sus fragmentos de secuencias con cualquiera de los genomas. Es importante destacar que este es el número de cromosomas agnóstico. Son los genes los que importan.

Imagine que si Ras, Myc y Erk están todos en el canal 12 humano en humanos, pero se dividen en chimpancés para que Ras esté en el canal 12, Myc en el canal 13 y Erk en el canal 24, esto no haría ninguna diferencia cuando mapea de vuelta al genoma suponiendo que los genes se conservan entre humanos y chimpancés. Si tiene un fragmento secuenciado de Myc humano que es igual a Chimp Myc, se alinearía con una ubicación en el canal 12 si usa ADN humano como referencia, o se alinearía con una ubicación en el canal 13 si usa Chimp como referencia. . ¿Tener sentido?

Entiendes, no es que los chimpancés tengan mucho ADN adicional que los humanos no tienen, tienen dos cromosomas que están fusionados en los humanos.

Teóricamente, podrían descubrirse discrepancias entre las lecturas y la referencia. En la práctica, con la tecnología actual de lectura corta, sería difícil resolver una discrepancia que involucraba una región del genoma que era repetitiva, que los telómeros del chimpancé 2A y 2B y las secuencias de tipo telomérico en las regiones donde se fusionaron en los humanos, serían.