¿Cómo recuperar la lista completa de nombres de genes y las identificaciones de genes de Entrez y otra información de anotación de la lista de nombres de genes de HUGO (en R o cualquiera)?

¿Cómo recuperar nombres completos de genes e ID de genes Entrez y otra información de anotación de la lista de nombres de genes HUGO (en R o en cualquier otro software o idioma)?

¿Es posible viceversa: tener nombres completos de genes o ID obtener nombres HUGO u otros datos de anotación?

Prueba con David. Tiene una opción de conversión de ID de genes. Hay muchos otros convertidores de Gene ID.
Voto para cerrar esta pregunta como fuera de tema porque no se trata de biología.

Respuestas (2)

Recomendaría simplemente descargar la base de datos, que HUGO le permite hacer de forma gratuita.

El sitio web de HUGO tiene una pestaña de "descargas" en la parte superior que lo lleva a la siguiente página

http://www.genenames.org/cgi-bin/estadísticas

Verá una tabla de estadísticas relacionadas con cuántos genes codificantes de proteínas o no codificantes hay catalogados, etc.

Debajo de las tablas hay una sección llamada Enlaces de descarga de conjuntos de datos completos : esta es la sección que desea (a menos que solo desee un subconjunto de los datos, pero ¿por qué no obtenerlos todos?)

Este archivo de texto sin formato (una vez descomprimido) se puede cargar en R (o en cualquier otro idioma) para analizarlo según sus requisitos.

Vale la pena actualizar la versión que descarga con bastante frecuencia, ya que actualizan la base de datos de HUGO con información nueva/actualizada con bastante frecuencia.

Instale bioconductor y use esta biblioteca: http://www.bioconductor.org/packages/release/bioc/html/biomaRt.html

Puede acceder a BioMart, que le permite traducir entre diferentes tipos de ID