¿Cómo recuperar nombres completos de genes e ID de genes Entrez y otra información de anotación de la lista de nombres de genes HUGO (en R o en cualquier otro software o idioma)?
¿Es posible viceversa: tener nombres completos de genes o ID obtener nombres HUGO u otros datos de anotación?
Recomendaría simplemente descargar la base de datos, que HUGO le permite hacer de forma gratuita.
El sitio web de HUGO tiene una pestaña de "descargas" en la parte superior que lo lleva a la siguiente página
http://www.genenames.org/cgi-bin/estadísticas
Verá una tabla de estadísticas relacionadas con cuántos genes codificantes de proteínas o no codificantes hay catalogados, etc.
Debajo de las tablas hay una sección llamada Enlaces de descarga de conjuntos de datos completos : esta es la sección que desea (a menos que solo desee un subconjunto de los datos, pero ¿por qué no obtenerlos todos?)
Este archivo de texto sin formato (una vez descomprimido) se puede cargar en R (o en cualquier otro idioma) para analizarlo según sus requisitos.
Vale la pena actualizar la versión que descarga con bastante frecuencia, ya que actualizan la base de datos de HUGO con información nueva/actualizada con bastante frecuencia.
Instale bioconductor y use esta biblioteca: http://www.bioconductor.org/packages/release/bioc/html/biomaRt.html
Puede acceder a BioMart, que le permite traducir entre diferentes tipos de ID
WYSIWYG
anongoodnurse