Preguntas básicas sobre el proyecto del genoma humano [cerrado]

El "genoma humano" fue secuenciado por el Proyecto Genoma Humano alrededor del año 2000. Pero no entiendo qué se hizo y cuál es su significado. Preguntas:

  1. ¿No se secuenció el genoma de una sola persona? Es decir, tenemos los 3.300 millones de pares de bases para algún individuo, ¿verdad? Entonces, ¿cómo me afecta eso, ya que indudablemente tengo alelos diferentes a los de esa persona?
  2. ¿No es la mayor parte de nuestro ADN el llamado "ADN basura"? ¿Distinguió el proyecto del genoma humano las porciones que codifican las proteínas de esta área basura?
  3. ¿Qué determina un "gen"? ¿Cómo sabemos dónde comienza y termina un gen, especialmente dado que un gen puede comprender hasta 2 millones de pares de bases?
  4. Supongamos que tengo los 3.300 millones de pares de bases para algún individuo. ¿Qué puedo hacer con esa información? ¿No necesito saber mucho más para hacer uso de esos datos?
Damos la bienvenida a los nuevos colaboradores de SE Biology, pero esperamos que verifiquen qué preguntas son apropiadas en este sitio, incluso si han usado otros sitios de SE. Esta sección de la ayuda debe dejar en claro que se espera que los carteles hagan preguntas específicas y muestren evidencia de haberlas investigado antes de publicarlas. El suyo es un conjunto de cuatro preguntas básicas, para las cuales no muestra evidencia de haber consultado la fuente obvia . Por lo tanto, he votado para cerrar.

Respuestas (1)

Bien, una respuesta rápida ya que no tengo tiempo para entrar en todos los detalles:

1) Como se mencionó correctamente en los comentarios, el proyecto del genoma humano tenía múltiples donantes de ADN , sin embargo, hasta el 70% del ensamblaje final del genoma provino de una sola persona. Con el fin de obtener una comprensión más profunda de la variación genómica en la población humana, ahora tenemos el proyecto 1000 genomas .

2) El hecho de que una parte tan grande del genoma humano no esté codificada por genes (el término ADN basura no es realmente correcto/engañoso ya que gran parte tiene funciones reguladoras o desconocidas) no se sabía realmente antes de la finalización. del proyecto del genoma humano - sólo después de conocer la secuencia completa del genoma esto se hizo evidente.

3) Los genes pueden detectarse experimentalmente mediante la secuenciación del transcriptoma y la comparación de las secuencias de ARN recuperadas con el genoma. Esto nos dice qué partes del genoma se transcriben de hecho (e incluye más que solo genes codificadores de proteínas). También es posible encontrar genes simplemente analizando la secuencia del genoma y buscando marcos de lectura abiertos (en exones), sitios de inicio de transcripción y otros elementos conocidos. Sin embargo, este método solo es bueno para encontrar genes que codifican proteínas; es probable que no se encuentren otros genes (es decir, miARN o lincARN).

4) Sí, la secuencia completa del genoma de un individuo por sí sola no te dice nada. Para obtener información interpretable / útil, debe compararla con otras fuentes de bases de datos, como la base de datos SNP .

La respuesta a 1. es incorrecta: el HGP secuenció a un pequeño número de personas de ascendencia europea. Sin hacerlo, no habrían podido encontrar diferencias entre diferentes alelos en los individuos. Celera, por otro lado, secuenció principalmente el ADN de Craig Venter.
@Chris — "La respuesta a 1…". Bastante. El cartel tiene cuatro preguntas. Eso es lo que hay que abordar en mi opinión. Cuando la respuesta es un capítulo de un libro, la gente aquí proporcionará "respuestas rápidas" de utilidad limitada.
@Chris Sí, no verifiqué las fuentes allí correctamente. Edito mi respuesta.