Acerca del sitio FTP del NCBI

Estoy tratando de extraer información sobre datos SNP del servidor FTP de NCBI. ¿Podría alguien explicarme cómo está organizado el directorio? Hay muchos archivos y carpetas y no puedo entender cuál contiene qué. ¿Hay algún archivo que explique correctamente la organización del sitio ftp? El manual de ayuda del NCBI no me ayudó mucho más allá de ayudarme a encontrar especies de interés.

¿Es esta la ayuda de la que hablas? Está perfectamente claro. ¿Qué no puedes descifrar?
solo un pensamiento: es mejor usar biopython o alguna otra biblioteca de scripts para obtener lo que desea, especialmente si está tratando de obtener más de un elemento.

Respuestas (1)

Obtener datos SNP del sitio FTP de NCBI SNP:

En realidad, es simple descargar los datos del NCBI, si sigue el método proporcionado por las Preguntas frecuentes (como lo proporciona @WYSIWYG).

Paso 1:

Ir al FTP del organismo: ftp://ftp.ncbi.nlm.nih.gov/snp/organisms/

ingrese la descripción de la imagen aquí

Paso 2

Abra la carpeta de su organismo requerido:

ingrese la descripción de la imagen aquí


Desde aquí puede descargar cualquier archivo que desee. Si intenta estudiar todo el organismo, descargue cualquiera de las carpetas completas (ASN.1, rs_fasta, XML (recomendado)).

Ahora,

No se trata de descargar, se trata de comprender los archivos que se proporcionan.

tipos de archivos:

Todos ellos contienen casi los mismos datos, solo que en diferentes formatos. Depende de usted cómo funciona su secuencia de comandos (preferiblemente Python o Perl) para obtener la información de importación.


Otra forma de descargar desde NCBI FTP :

Siempre puedes usar filezilla:

ingrese la descripción de la imagen aquí