Pensé que estos eran solo formatos diferentes de los mismos datos.
Pero parece que no hay una forma de convertir datos SNP (polimorfismo de un solo nucleótido) en datos STR (repetición corta en tándem). ¿Tengo razón?
Según tengo entendido, los SNP son básicamente una "diferencia" entre el ADN humano base (partes que nunca cambian) y el ADN dado. Mientras que los STR son hebras de ADN que difieren entre individuos.
Pero si hay suficientes SNP (es decir, todos ellos), sería trivial deducir STR, ¿verdad?
Por ejemplo, actualmente 23andMe prueba todo el genoma mitocondrial. ¿Significa que uno puede deducir fácilmente los STR?
¡La solución está en el nombre!
SNP : polimorfismo de un solo nucleótido
El nombre nos dice que es un cambio que afecta a un solo nucleótido y que puede haber múltiples de estos (el polimorfismo podría reescribirse como formas múltiples )
De la página de Wikipedia de SNP :
[Un SNP] es una variación de la secuencia de ADN que ocurre cuando un solo nucleótido (A, T, C o G) en el genoma (u otra secuencia compartida) difiere entre los miembros de una especie biológica o los cromosomas emparejados en un ser humano.
Entonces, por ejemplo, si toma 8 individuos y secuencia su gen XYZ, puede encontrar, en un cierto locus (= posición) en el gen:
Individuo 1: AAGGTG C AGCAGTC
Individuo 2: AAGGTG T AGCAGTC
Individuo 3: AAGGTG T AGCAGTC
Individuo 4: AAGGTG T AGCAGTC
Individuo 5: AAGGTG C AGCAGTC
Individuo 6: AAGGTG C AGCAGTC
Individuo 7: AAGGTG T AGCAGTC
Individuo 8: AAGGTG T AGCAGTC
La posición resaltada en negrita es un SNP. En este caso, solo tenemos C o T (y esto produce 2 alelos diferentes para el gen XYZ).
Esta página de la Universidad de Utah tiene una animación muy clara sobre los SNP.
STR : repetición corta en tándem
Estas son secuencias repetidas cortas. Están en tándem , es decir, uno tras otro.
STR consta de unos pocos (2-6) nucleótidos que se repiten varias (5-100) veces.
Por ejemplo , esta página de la Universidad de Arizona da el ejemplo de D7S280, un STR con secuencia (GATA) n (es decir, GATA repetido n veces)
1 aatttttgta ttttttttag agacggggtt tcaccatgtt ggtcaggctg actatggagt
61 tattttaagg ttaatatata taaagggtat gatagaacac ttgtcatagt ttagaacgaa
121 ctaacgatag atagatagat agatagatag atagatagat agatagatag atagacagat
181 tgatagtttt tttttatctc actaaatagt ctatagtaaa catttaatta ccaatatttg
241 gtgcaattct gtcaatgagg ataaatgtgg aatcgttata attcttaaga atatatattc
301 cctctgagtt tttgatacct cagattttaa ggcc
En este caso, las variaciones entre individuos residen en el número de veces que se repite la secuencia.
CACT CACT CACT
(3 veces) y otro CACT CACT CACT CACT
(4 veces). Los SNP, son mutaciones en una sola base.
Amory
Científico loco
vanuano
Amory