Estoy tratando de extraer información sobre datos SNP del servidor FTP de NCBI. ¿Podría alguien explicarme cómo está organizado el directorio? Hay muchos archivos y carpetas y no puedo entender cuál contiene qué. ¿Hay algún archivo que explique correctamente la organización del sitio ftp? El manual de ayuda del NCBI no me ayudó mucho más allá de ayudarme a encontrar especies de interés.
En realidad, es simple descargar los datos del NCBI, si sigue el método proporcionado por las Preguntas frecuentes (como lo proporciona @WYSIWYG).
Paso 1:
Ir al FTP del organismo: ftp://ftp.ncbi.nlm.nih.gov/snp/organisms/
Paso 2
Abra la carpeta de su organismo requerido:
Desde aquí puede descargar cualquier archivo que desee. Si intenta estudiar todo el organismo, descargue cualquiera de las carpetas completas (ASN.1, rs_fasta, XML (recomendado)).
Ahora,
No se trata de descargar, se trata de comprender los archivos que se proporcionan.
tipos de archivos:
Todos ellos contienen casi los mismos datos, solo que en diferentes formatos. Depende de usted cómo funciona su secuencia de comandos (preferiblemente Python o Perl) para obtener la información de importación.
Otra forma de descargar desde NCBI FTP :
Siempre puedes usar filezilla:
WYSIWYG
shigeta