¿Cómo asignar el nombre del gen a su símbolo del gen?

Últimamente estoy aprendiendo sobre datos genéticos, así que me disculpo por las preguntas tontas de antemano. Leí un artículo sobre un cáncer en humanos que encontró algunos genes importantes. Por ejemplo, el documento enumeró uno de los genes en su nombre como

gene1:    chromosome 12 open reading frame 52

¿Puedo saber cómo puedo encontrar su símbolo genético correspondiente como

C12orf52

¿Hay alguna tabla de mapeo o herramienta que pueda usar?

Muchísimas gracias,

¿Qué especies te interesan?

Respuestas (3)

Desafortunadamente, el mapeo de nombres de proteínas y genes es uno de los problemas más molestos en la biología computacional moderna. No hay una manera segura de hacer esto. Especialmente de nombres de genes sin esperanza como el del artículo que cita. Sin embargo, aquí hay algunos servicios que puede probar:

  1. General, búsqueda de texto, útil si tiene una descripción del gen (como en el caso descrito en su pregunta):

  2. Servidores de mapeo, útiles si tiene un gen/símbolo de proteína/nombre real (por ejemplo, P53_HUMAN, AF240684, NP_001119585, etc.)

“uno de los mayores problemas” – eh.
@KonradRudolph, ¿no estás de acuerdo? Créame que lo es. No me refiero a problema en el sentido de un problema científico sino técnico. Cada base de datos suele utilizar sus propios identificadores, los identificadores cambian con el tiempo, al igual que la secuencia a medida que se corrigen los errores. Para la lista de ~15000 proteínas (UniProt) con las que estoy trabajando, en promedio 1-2 identificadores cambian POR SEMANA. Mapear correctamente los nombres entre las distintas bases de datos y otras fuentes de información que utilizo ha sido el gran quebradero de cabeza de mi Post-Doc.
Bueno, estoy de acuerdo en que es una molestia, pero tenemos identificadores estables (= no cambian) y servicios para traducir entre los diferentes. Es un problema resuelto (en el sentido de que aún puede requerir trabajo manual, pero no trabajo intelectual).
@Konrad, desafortunadamente, los identificadores estables solo son buenos si sus datos de entrada los están usando. Si tiene que combinar datos de interacción de 15 bases de datos, cada una de las cuales utiliza un esquema de identificación diferente (RefSeq, GI, UniProt, HUGO, Flybase, Wormbase, etc.), los identificadores se convierten en un problema muy real. Los servicios de traducción a menudo tienen errores (UniProt, por ejemplo, no estaba creando ID únicos para cada envío de trabajo, ¡y devolvía mis consultas mezcladas con las de otra persona!), Limitado a ciertas especies o tipos de ID. De hecho, puede que no sea un problema intelectual, pero es uno técnico muy real.

Si la fuente original usó la nomenclatura humana oficial, puede buscar en el sitio HGNC (Comité de nomenclatura genética de HUGO) .

Simplemente use una base de datos del genoma como Ensembl . Pegue el nombre de su gen en el cuadro de búsqueda y presione "Ir" . El primer resultado de la lista de resultados es lo que está buscando.

Funcionó. Pero todavía estoy configurando cómo ingresar una lista de nombres de genes, no solo uno a la vez.