Nomenclatura de genes y proteínas: N-Myc, c-Myc, et. Alabama

¿Alguien puede explicar (o indicarme una explicación de) exactamente qué significan todos los diferentes símbolos que veo que se usan para escribir genes y proteínas?

Creo que sé que para los genes, usamos una fuente en cursiva y para las proteínas, usamos una fuente normal.

Creo que también aprendí que para humanos, todas las letras están en mayúsculas (por ejemplo, SHH), mientras que para mouse, solo la primera letra está en mayúsculas y las letras restantes están en minúsculas (Shh). (De http://en.wikipedia.org/wiki/Gene_nomenclature )

Pero estoy perplejo con todas las otras "etiquetas" (entre comillas porque así es como parecen usarse y no sé de qué otra manera pensar en ellas) que veo flotando alrededor de los símbolos de genes y proteínas.

Por ejemplo, Myc (¿MYC?).

Veo estos tres artículos en uniprot.org:

http://www.uniprot.org/uniprot/Q99417 para C-Myc

http://www.uniprot.org/uniprot/P04198 para N-myc

http://www.uniprot.org/uniprot/P12524 para L-Myc

Estas proteínas están todas en humanos y, sin embargo, sus nombres recomendados no son todos en mayúsculas; ¿Que pasa con eso? Pero aún más confuso para mí son las letras "C-", "N-" y "L-" que les anteceden. ¿Qué demonios se supone que están indicando?

¿Son todas estas proteínas fundamentalmente diferentes (codificadas por diferentes genes), pero tal vez relacionadas entre sí de alguna manera (por lo tanto, las tres letras comunes, 'myc', incluso si no están todas en el mismo caso y no en mayúsculas como pensé que se suponía que debían ser el caso en humanos), y solo se les dan estas etiquetas "C-", "N-" y "L-" para distinguir una de la otra? ¿Una etiqueta indica un oncogén o un protooncogén? ¿Por qué a veces veo "c-Myc" y otras veces "C-Myc"? ¿Significa algo el caso de la "C-"? ¿Hay algún tipo de clave o leyenda que pueda consultar para obtener respuestas a todas estas preguntas? Encontré algunas explicaciones en el libro de texto de Biología del desarrollo de Scott Gilbert , pero todavía no me da todas las respuestas que busco aquí.

Solo quiero entender cómo se usan estas etiquetas y símbolos porque me parece que cuando leo artículos de investigación (de los cuales he leído muchos), diferentes autores los usan en diferentes artículos de maneras que no son consistentes con El uno al otro. O eso, o me estoy perdiendo algo muy básico, por eso estoy preguntando aquí.

Gracias de antemano por cualquier ayuda.

Respuestas (2)

Hay un conjunto útil de enlaces a pautas de nomenclatura para todos los principales sistemas genéticos en esta página de Wikipedia . Personalmente, creo que el sistema Saccharomyces cerevisiae funciona mejor: logra cubrir los alelos dominantes y recesivos de un gen, el nombre de la proteína, cómo referirse a un fenotipo relacionado y el uso de una convención paralela para la designación de ORF. .

Desafortunadamente, ahora no hay vuelta atrás: hay muchos sistemas diferentes y no hay esperanza de unificarlos. Cuando esta plétora de convenciones de nombres se combina con la renuencia de tantos científicos a apegarse a las pautas, tenemos una receta para casi la anarquía.

Editar: sobre el tema específico de la nomenclatura MYC:

Los prefijos v y c provienen de los primeros días de la investigación de oncogenes. Se descubrió que los oncogenes virales como myc y src estaban relacionados con (¿derivados de?) genes similares en células normales. Así, v- significa viral y c- significa celular.

Esto se puede ver si examina las entradas de HUGO para los cuatro miembros de la familia MYC codificados en el genoma humano (extractos a continuación). Todos tienen un nombre aprobado que los relaciona con un oncogén viral que se encuentra en el genoma del virus de la mielocitomatosis aviar. Este fue el miembro fundador de esta familia de genes. Por lo tanto, c-myc fue el primer gen relacionado con myc encontrado en el genoma humano y es el responsable del linfoma de Burkitt. Es cierto, como dice @Leonardo, que en los tumores la expresión de este gen myc en el tejido linfático cambia por reordenamientos cromosómicos, pero ese no es el origen de la designación c-myc.


Símbolo aprobado por MYC: Nombre
aprobado por MYC: homólogo del oncogén viral de mielocitomatosis v-myc (aviar)
Símbolos y nombres anteriores: "homólogo del oncogén viral de mielocitomatosis aviar v-myc"
Sinónimos: bHLHe39, c-Myc
Ubicación cromosómica: 8q24

Símbolo aprobado por MYCL1
: Nombre aprobado por MYCL1
: homólogo 1 del oncogén viral de mielocitomatosis v-myc, derivado de carcinoma de pulmón (aviar)
Símbolos y nombres anteriores: MYCL, "homólogo 1 del oncogén viral de mielocitomatosis aviar v-myc, derivado de carcinoma de pulmón"
Sinónimos: bHLHe38, " proteína l-myc", LMYC, "gen relacionado con myc del cáncer de pulmón", "oncogén lmyc"
Ubicación cromosómica: 1p34.3  

Símbolo aprobado por MYCL2
: Nombre aprobado por MYCL2
: homólogo 2 del oncogén viral de mielocitomatosis v-myc (aviar)
Símbolos y nombres anteriores: "homólogo 2 del oncogén viral de mielocitomatosis aviar v-myc"
Sinónimos: bHLHe38
Ubicación cromosómica: Xq22-q28


Símbolo aprobado por MYCN: Nombre
aprobado por MYCN: oncogén relacionado con el virus de la mielocitomatosis v-myc, derivado del neuroblastoma (aviar)
Símbolos y nombres anteriores: NMYC, "oncogén relacionado con el virus de la mielocitomatosis aviar v-myc, derivado del neuroblastoma"
Sinónimos: bHLHe37, N-myc
Ubicación cromosómica : 2p24.3  

Gracias. Ambas respuestas me ayudan mucho. Inicial anterior de viral (v-) o celular (c-). Eso tampoco lo sabía. Lamento que parezca que no puedo aceptar ambas respuestas, pero gracias a ambos.

Esa es una buena pregunta y, sinceramente, en la literatura científica se abusa un poco de la nomenclatura de los genes y sus proteínas codificadas. Por ejemplo, cuando se hace referencia a microbios (como E. coli), los nombres de los genes están todos en minúsculas (p. ej., lacZ). El problema de los nombres de las proteínas se complica cuando el nombre de la proteína es (a menudo) una abreviatura.

Con respecto a myc, puede referirse a la familia de proteínas del factor de transcripción MYC (de la cual son miembros c-Myc, L-myc y N-myc). Más comúnmente, myc se refiere a c-Myc, y es el nombre dado a un segmento de 10 aminoácidos del protooncogén humano myc (EQKLISEEDL) y es un epítopo común agregado al ADN recombinante para producir proteínas de fusión.

Por lo que recuerdo, la inicial que precede a myc (en este caso) se refiere a la forma de cáncer con la que está asociada la proteína myc. Sé que c-myc proviene de una mutación en myc de tipo salvaje que se expresa de manera constitutiva. Wikipedia me dice que N-myc es un factor de transcripción myc asociado al neuroblastoma.

"algo abusado"? Ahora, eso es un eufemismo si alguna vez vi uno, solo elija cinco nombres de genes de Drosophila . ¡Incluso tengo un tío que nombró dos genes en honor a su perro!
Estaba siendo educado. ;) ¿Qué genes son esos?
Fedra1 y Fedra2 . Sí, sé quién es Phaedra , pero confía en mí, los genes llevan el nombre del perro.
Gracias. Ambas respuestas me ayudan mucho. Precediendo a la inicial del cáncer asociado, por lo que "N-" = neuroblastoma. No sabía eso. Tampoco sabía sobre el epítopo EQKLISEEDL como myc. Entonces, ¿cómo distinguir entre el epítopo myc y el gen myc (aparte del contexto tal vez)?
Esta respuesta es incorrecta, la siguiente respuesta de Alan debería haber sido aceptada... Hay más información en este artículo de revisión, por ejemplo