¿Qué significan rs id, alelo codificado 0 y alelo codificado 1?

Entonces, para un proyecto en el que he estado trabajando (una historia diferente), he estado mirando el Proyecto HapMap y sus archivos gratuitos en línea. En su archivo README, hablan sobre cómo para cada archivo de leyenda para cada cromosoma/región, hay un rs id, un alelo codificado 0, 1 y una posición de par de bases.

Ahora es bastante obvio después de mirar esto por un tiempo que la posición del par de bases significa dónde se encuentra cada nucleótido a lo largo de la secuencia genética... ¿es correcto?

¿Y qué significa rs id y las otras palabras? ¡Cualquier ayuda sería muy apreciada!

Aquí está el enlace al archivo README, en ese mismo directorio están los archivos sobre los participantes, solo incluye SNP (¡recortes!).

Enlace al archivo LÉAME del Proyecto HapMap

Enlace de datos de secuencia del proyecto HapMap (fase 2)

Respuestas (1)

rs id es el ID de clúster de SNP de referencia ; consulte aquí . Es básicamente un identificador único.

Esta tabla está tomada de su enlace:

rs              position        0       1
rs11089130      14431347        C       G  
rs738829        14432618        A       G  
rs915674        14433624        A       G

Los códigos de alelo son las columnas 3 y 4. Un SNP es un sitio donde se encuentra una base diferente en diferentes versiones del mismo gen (las diferentes versiones de los genes son alelos). Para un SNP dado, los diferentes alelos se denominan alelo 0 o 1 . Entonces, en la tabla, el primer SNP, rs11089130, tiene dos alelos: el alelo 0 tiene una C en la posición del SNP (14431347), mientras que el alelo 1 tiene una G en esa posición. El código del alelo no implica ningún significado biológico.

No estoy seguro de qué sucedería si hubiera tres alelos en un SNP, pero presumiblemente también habría un SNP codificado como 2 .

Editar: el alelo 0 es el residuo del genoma de referencia. El alelo 1 es el residuo que se estudia, el SNP.

entonces 0 es el alelo estándar y 1 es el alelo mutado?
@higgs241 0es el residuo que se encuentra en el genoma de referencia y 1es el residuo que se encuentra en otros. Por favor, no se refiera a la variación de "alelos mutados" es la norma...
@terdon ¿el genoma de referencia es el mismo para todos los SNP registrados? Quiero decir, si tomara el alelo 0 en cada SNP registrado con un rsID, ¿terminaría con el perfil genético de un individuo específico? Parece que no: leí en en.wikipedia.org/wiki/Reference_genome que "el genoma humano del Consorcio de Referencia del Genoma (compilación 37) se deriva de trece voluntarios anónimos de Buffalo, Nueva York". ¿Es ese el genoma utilizado como referencia para el etiquetado 0/1 de SNP? ¿Y qué hacer cuando hay polimorfismo en este grupo de personas? Tal vez podría hacer una nueva pregunta...
@bli Parece bastante claro en la página de WP a la que se vincula que el genoma de referencia es una construcción de curación y, por lo tanto, no corresponde a un individuo. de hecho, la página incluye esta oración: "El sistema de grupos sanguíneos ABO difiere entre humanos, pero el genoma de referencia humano contiene solo un alelo O (aunque los otros alelos están anotados)".
@Alan Boyd Sí, debería haber leído más la página. Entonces, existe este "genoma humano GRC (construcción 37)", que es una referencia haploide artificial. ¿Es esta la referencia para todos los SNP registrados? Puede ser pero no tengo certeza. Una de las razones de mis dudas es la siguiente: ¿Puede suceder que se identifique un nuevo SNP en una porción del genoma que aún no está presente en este genoma de referencia? Sospecho que esto se está volviendo raro, pero cuando esta referencia estaba en las primeras etapas de construcción, es posible que haya sucedido.