No sé mucho de genética. Para un proyecto artístico estoy buscando un genoma humano.
Yo lei eso:
Solo alrededor del 0,1% del genoma es diferente entre los individuos, lo que equivale a alrededor de 3 millones de variantes (también conocidas como mutaciones) en el genoma humano promedio. Esto significa que podemos crear un "archivo de diferencias" solo de los lugares en los que un individuo dado difiere del genoma de "referencia" normal. En la práctica, esto generalmente se hace en un formato de archivo .VCF, que en su formato más simple se ve así:
chr20 14370 rs6054257 GA 29 APROBADO 0|0
Donde cada línea usa ~45 bytes, y lo multiplica por ~3 millones de variantes en un genoma dado, y obtiene un tamaño de archivo .VCF de aproximadamente 135,000,000 bytes o ~125 megabytes.
¿Es eso correcto?
¿Conoces una base de datos para descargar un archivo VCF o algo similar? ¡Sería increíble si pudiera proporcionar un enlace al archivo mencionado anteriormente!
¿Has probado a hurgar en el proyecto de los 1000 genomas?
Prueba este enlace
ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/pilot_data/release/2010_07/exon/snps/
RAM
Pulpo