Entonces, para un proyecto en el que he estado trabajando (una historia diferente), he estado mirando el Proyecto HapMap y sus archivos gratuitos en línea. En su archivo README, hablan sobre cómo para cada archivo de leyenda para cada cromosoma/región, hay un rs id, un alelo codificado 0, 1 y una posición de par de bases.
Ahora es bastante obvio después de mirar esto por un tiempo que la posición del par de bases significa dónde se encuentra cada nucleótido a lo largo de la secuencia genética... ¿es correcto?
¿Y qué significa rs id y las otras palabras? ¡Cualquier ayuda sería muy apreciada!
Aquí está el enlace al archivo README, en ese mismo directorio están los archivos sobre los participantes, solo incluye SNP (¡recortes!).
rs id es el ID de clúster de SNP de referencia ; consulte aquí . Es básicamente un identificador único.
Esta tabla está tomada de su enlace:
rs position 0 1
rs11089130 14431347 C G
rs738829 14432618 A G
rs915674 14433624 A G
Los códigos de alelo son las columnas 3 y 4. Un SNP es un sitio donde se encuentra una base diferente en diferentes versiones del mismo gen (las diferentes versiones de los genes son alelos). Para un SNP dado, los diferentes alelos se denominan alelo 0 o 1 . Entonces, en la tabla, el primer SNP, rs11089130, tiene dos alelos: el alelo 0 tiene una C en la posición del SNP (14431347), mientras que el alelo 1 tiene una G en esa posición. El código del alelo no implica ningún significado biológico.
No estoy seguro de qué sucedería si hubiera tres alelos en un SNP, pero presumiblemente también habría un SNP codificado como 2 .
Editar: el alelo 0 es el residuo del genoma de referencia. El alelo 1 es el residuo que se estudia, el SNP.
higgs241
terdón
0
es el residuo que se encuentra en el genoma de referencia y1
es el residuo que se encuentra en otros. Por favor, no se refiera a la variación de "alelos mutados" es la norma...bli
alan boyd
bli