Secuenciación de dos cadenas de ADN

Mi formación no es la genética. 2.No me interesa saber cómo se hace la secuenciación del ADN o el genotipado. 3. Solo me interesa la naturaleza de los resultados que se describen aquí .

Ahora, llegando a la pregunta: los humanos tienen dos conjuntos de cromosomas en cada célula. Entonces, si digo secuenciar el cromosoma 1, ¿qué significa eso realmente? ¿Cuál de los dos cromosomas se secuencia? Del genotipado, ¿tiene lugar la comparación entre dos+dos=cuatro cromosomas1? ¿O todo mi entendimiento es defectuoso?

¿Cuál es su propia investigación sobre esta pregunta? Para evitar el cierre como "pregunta de tarea" (que también se usa como sinónimo de preguntas de bajo esfuerzo), agregue esta información usando la función de edición.
De su pregunta deduzco que no tiene una comprensión básica de la secuenciación... La respuesta puede ser bastante larga... Sería ventajoso conocer sus antecedentes y, como Chris mencionó, conocer su investigación sobre el tema.
No, no lo hago. Mi experiencia es ingeniería electrónica. Pero estoy muy interesado en este tema y espero ansiosamente la respuesta. Explique en palabras simples cómo se hace y, lo que es más importante, cómo se secuencian los dos hilos.
genomanewsnetwork.org/resources/whats_a_genome/Chp2_2.shtml . Tengo una idea aproximada de que el ADN se corta en pedazos, se tiñe, etc. Lo que me preocupa no es el proceso, sino la naturaleza del resultado. ¿En qué orden se presentará la salida? ¿O es completamente aleatorio?

Respuestas (4)

Estoy interesado solo en la naturaleza de los resultados como se describe aquí.

Al alinear esta secuencia con todos los nucleótidos de todos los organismos, nos daríamos cuenta de que la secuencia dada (corta) ocurre en varios organismos además de los humanos. Por lo tanto, podría provenir de una especie con un solo cromosoma. ¡Vea NCBI Blast !

Por el bien del ejemplo, supongamos que la especie tiene varias instancias de cada cromosoma (por ejemplo, una de la madre humana y otra del padre humano) y miremos "los resultados como se describen aquí". Como no se dan detalles sobre el protocolo, supongamos además el escenario más común, es decir, que no hubo distinción o separación experimental de las instancias individuales de los cromosomas.

Al observar los resultados, nos daríamos cuenta de que no se trata de "secuenciación de próxima generación", sino de secuenciación de Sanger .

Ahora volvemos a mirar el esquema provisto (nota: estos no son datos experimentales reales): claramente, las bandas en el lado izquierdo solo ocurren para una letra/base, y en una posición dada de la secuencia, solo hay un pico muy claro en el lado derecho (a diferencia de la posibilidad de tener múltiples picos correspondientes a diferentes bases).

Tendríamos que concluir que cada instancia del cromosoma tiene una secuencia absolutamente idéntica . Por lo tanto, concluiríamos que no sería importante distinguir instancias individuales.

Pero espera, ¿no son diferentes los cromosomas maternos y paternos? Absolutamente, el ejemplo dado, sin embargo, solo observa 25 bases en lugar del cromosoma completo, y es muy posible que sean absolutamente idénticos. (nota: existen varias técnicas experimentales para seleccionar solo regiones específicas de ADN o ARN para el análisis).

Diría que su comprensión aquí no es necesariamente defectuosa; más bien, se le está jugando un pequeño truco.

La figura muestra los resultados típicos de la secuenciación de Sanger. Este tipo de secuenciación siempre requiere un llamado cebador, una secuencia corta de alrededor de 20 bases que se conocen. El código que sigue a esas 20 bases será secuenciado. Usando esta técnica sola, prácticamente no puede secuenciar un cromosoma completo; por lo general, solo es bueno para aproximadamente 700-1200 bases después del cebador.

Las bandas en el gráfico de la izquierda y los picos en el lado derecho corresponden a la base en la posición "primer + n" (siendo n el número de bandas/picos que comienzan a contarse en la parte inferior del gráfico).

Ahora considere que en la práctica, esta técnica se realiza en una muestra líquida que contiene, por supuesto, una gran cantidad de moléculas de ADN. En un escenario ideal, cada molécula es idéntica. En ese caso, la secuencia detrás de las 20 bases del cebador es idéntica y obtendrá bandas o picos claros como se muestra en el gráfico.

Cuando tomas una muestra de un organismo como un ser humano, habrá una variedad de moléculas de ADN en la mezcla.

¿Qué se secuencia? Simple, todo lo que se encuentra detrás de la cartilla que está usando para secuenciar. Si diferentes moléculas tienen diferentes secuencias allí, el resultado serán bandas en diferentes columnas en la misma posición en el gel (lado izquierdo del gráfico) o dos picos de diferentes colores en la misma ubicación en la cromatografía (lado derecho del gráfico) .

Ejemplo: genotipado

Consideramos el gen XYZ. Hay dos variantes de este gen en humanos, y la única diferencia está en la posición 167 del gen, donde una variante tiene una A y la otra una G. Gracias al proyecto del genoma humano, conozco la secuencia completa del gen XYZ. , así que diseño mi cartilla para abarcar las posiciones 50-70 de XYZ. Por lo tanto, el resultado de mi secuenciación debería producir el gen XYZ, comenzando en algún lugar alrededor de la posición 100 (incluso las reacciones de secuenciación de mayor calidad pierden algunas bases después del cebador). Si tomo una muestra de un ser humano que tiene la misma variante XYZ en ambos cromosomas hermanos, solo obtendré un único resultado de secuenciación, ya sea con A o G en la posición ~67 de mi secuenciación. Si mi muestra proviene de un ser humano que tiene una variante en un cromosoma y la otra variante en el otro, mi secuenciación será ambigua en la posición ~67, y luego de una inspección más cercana, secuencié dos variantes de esta muestra: una con una A y otra con una G en esta posición ambigua. De esta manera puedo determinar el genotipo de un humano para este gen: homocigoto XYZA/A , XYZ B/B o heterocigoto XYZ A/B .

PD: No permita que la naturaleza de doble cadena del ADN confunda su pensamiento aquí, la secuenciación de Sanger siempre secuencia solo una cadena (¡para la que diseñó el manual)! Entonces, dos cromosomas hermanos = dos cadenas dobles = cuatro cadenas simples, de las cuales dos se secuenciarán porque las otras dos contienen las secuencias complementarias.

PPS: la forma en que esto funciona puede causar grandes problemas si la imprimación no está diseñada correctamente. Con 20 bases, es posible que las mismas 20 bases aparezcan en otras partes del genoma y, de repente, las secuencias que siguen al cebador no solo sean diferentes en una o dos posiciones, sino en todas partes.

Esa es una imagen de la secuenciación de Sanger. Si esa secuenciación se hubiera realizado en una región donde un organismo diploide era heterocigoto para un SNP simple, el archivo de seguimiento, en lugar de tener picos limpios únicos, tendría en el punto del SNP dos picos de tamaño medio de dos colores para las dos letras. presentes en ese sitio. Si la diferencia entre los dos alelos fuera más compleja que un polimorfismo de un solo nucleótido, el archivo de rastreo podría tener un aspecto muy diferente.

Entonces, si digo secuenciar el cromosoma 1, ¿qué significa eso realmente?

La gente no suele secuenciar un cromosoma completo de esa manera, y casi nadie lo haría más con la tecnología de Sanger. Pero si estuviera secuenciando un organismo diploide no consanguíneo, esperaría obtener una mezcla de señales en los puntos de heterocigosidad.

Del genotipado, ¿tiene lugar la comparación entre dos+dos=cuatro cromosomas1?

Los organismos diploides tienen 2 copias de un cromosoma dado, no 4. Cada cromosoma tiene dos cadenas, pero la información sobre las cadenas complementarias es idéntica.

ACTUALIZAR


Antes de llegar a la secuenciación, debe tener en cuenta que no está secuenciando un solo cromosoma de una sola célula. Está secuenciando una muestra de ADN correspondiente a una población de células que contiene todos los cromosomas. No conozco un procedimiento para apuntar a un solo cromosoma, existen procedimientos dirigidos a regiones específicas en los genes que rodean el genoma .

¿O todo mi entendimiento es defectuoso?

Sí, diría que carece, no falla.

Dicho esto,

Entonces, si digo secuenciar el cromosoma 1, ¿qué significa eso realmente?

Hipotéticamente, eso significaría que está secuenciando el ADN del cromosoma 1 correspondiente a una población de células. Lo que significa que está recuperando la secuencia del cromosoma 1 para su uso en el análisis posterior mediante la polimerización de su secuencia de ADN complementaria aprovechando el procedimiento de replicación del ADN .

¿Cuál de los dos cromosomas se secuencia?

No hay forma de diferenciar entre dos cromosomas en los experimentos de secuenciación convencionales. La célula no tiene idea de qué cromosoma es cuál y tú tampoco, por lo que ambos cromosomas se secuencian al mismo tiempo. Tenga en cuenta que dije que no hay forma de diferenciar entre dos cromosomas en los experimentos de secuenciación convencionales

¿Tiene lugar la comparación entre dos+dos=cuatro cromosomas 1?

Esto tiene dos partes. ¿Qué quieres decir con cuatro? Si está insinuando que el cromosoma 1 tiene dos hebras y eso equivale a 4, entonces no, las dos hebras juntas forman un cromosoma. Su célula tiene 2n o dos cromosomas 1. Si está secuenciando una población de células (digamos 1000), tiene dos mil cromosomas 1 que se están secuenciando, todos los cuales están presentes en pares en 1000 células.

¿Se realizan comparaciones?

En los experimentos convencionales no comparamos. Dicho esto, existen métodos para diferenciar entre los dos cromosomas 1. El más antiguo que pude encontrar es un artículo de M Nagano sobre la secuenciación específica de alelos . En este caso, dado que sus padres contribuyen igualmente a su ADN, cada uno de ellos tiene algunas mutaciones específicas para su ADN. Usando esta característica podemos diferenciar entre el cromosoma 1 paterno y materno.

También hay secuenciación de una sola célula , en este caso estaría secuenciando los dos cromosomas 1 de una sola célula, en teoría, también puede hacer una secuenciación específica de alelo en una sola célula, lo que le permite diferenciar entre los dos cromosomas 1 presentes en la célula.

Finalmente, no hay forma de diferenciar las dos hebras, después de la secuenciación cuando alinea sus datos con el genoma de referencia, conocerá el grado de varamiento de los datos.

Respuesta a la vieja pregunta


Hoy en día, la palabra secuenciación es sinónimo de secuenciación de alto rendimiento, y el artículo al que se vinculó en el comentario también se relaciona con las técnicas de secuenciación de alto rendimiento (lo obtuve de un vistazo superficial).

Al secuenciar el ADN, ¿cuál de las dos cadenas se secuencia?

Ambos se secuencian.

¿En qué orden se proporcionan los resultados?

Aleatorio

durante la secuenciación, ¿cómo se secuencian estas dos hebras?

Si se trata de una secuenciación de un solo extremo, no sabemos qué hebra se secuenció primero. (Hay formas, pero por simplicidad no entremos allí)

Si se trata de secuenciación de extremos emparejados, una lectura se origina en la hebra sentido y la otra lectura se origina en la hebra opuesta.

Puedes ver un video de youtube aquí para descubrir cuál es la diferencia

¿Es que el resultado de una hebra se proporciona primero seguido de la otra o es que solo una de las dos hebras se secuencia?

Ambos están reportados.

La pregunta que ha hecho es muy amplia, puedo continuar por un puñado de páginas A4 y aún no terminar. En cuanto a su primera pregunta, dije que ambos se secuencian, porque no tenemos forma de saber mientras secuenciamos qué hebra se está secuenciando (hay técnicas de secuenciación hebra, pero debe digerir lo que se menciona/vincula aquí primero y luego con un poco más la investigación regresa con una pregunta sobre la secuenciación trenzada).

Después de la secuenciación, obtiene su resultado en orden aleatorio, porque lo que obtiene no es realmente un resultado, sino más archivos de datos sin procesar que se denominan archivos FASTQ . Lea un poco sobre FASTQ. Después de la secuenciación, en realidad no obtiene un FASTQ, sino un BCL o archivo de llamada base, que debe convertirse a FASTQ. Estos FASTQ deben filtrarse o no en función de la calidad y luego alinearse con un genoma de referencia . Aquí es donde puedes saber qué lectura provino de qué hebra.

Debe leer más sobre la secuenciación de un solo extremo y la secuenciación de extremos emparejados para comprender mejor cómo se secuencia el ADN. También echa un vistazo a este vídeo . Esta es la versión más simplificada que pude encontrar. Debería despertar tu curiosidad sin bombardearte con demasiada información.

Por último, en una secuenciación de un solo extremo no tiene forma de saber sin alineación qué hebra se secuenció, pero en un extremo emparejado (donde un fragmento de ADN se secuencia desde ambos extremos, generando dos lecturas emparejadas) generalmente, una pareja se alinea con el sentido hebra mientras que la otra se alinea con la hebra antisentido.

I do not know of a procedure to target a single chromosomeEcha un vistazo a la secuenciación de células individuales . Estoy más familiarizado con él en términos de RNA-Seq, pero también se puede realizar la secuenciación genómica de una sola célula.
Quise decir que no conozco ningún procedimiento hasta la fecha, que aísle un cromosoma completo para la secuenciación... hay protocolos específicos con seguridad... pero ¿apuntar a un cromosoma completo? Todavía tengo que encontrar un procedimiento que emplee el aislamiento de un cromosoma antes de la secuenciación.
Vale, entiendo. Dudo que tal cosa sea posible en las células somáticas, ya que no hay forma de diferenciar entre los cromosomas maternos y paternos. Sin embargo, no creo que haya una necesidad científica de hacerlo. Si desea saber de dónde proviene un SNP en particular u otra mutación, simplemente secuencie a los padres del sujeto (si es posible).
Este póster pregunta sobre la secuenciación de Sanger, no sobre la próxima generación. No hay archivos bcl en la secuenciación de Sanger, y no me queda claro si la devolución de datos de Sanger en formato FASTQ es estándar. No fue en los años que trabajé en la secuenciación de Sanger.