¿Cuántas proteínas humanas están muy bien caracterizadas?

Siguiendo con ¿Cuántas proteínas humanas tienen una estructura 3D resuelta? ¿Existe una lista de proteínas humanas/complejos proteicos muy bien caracterizados?

Mi criterio para "muy bien caracterizado" incluye, al menos:

  • una estructura 3D de alta calidad
  • actividad conocida in vivo
  • asociados conocidos en sus actividades en la célula
  • cinética de su actividad
  • elementos reguladores de la expresión
  • etc..., y
  • (probablemente lo más importante) un consenso general entre los expertos de que está bien descrito

Lo más probable es que esta lista incluya proteínas o complejos de proteínas como:

  • p53,
  • polimerasa alfa, y
  • el complejo del poro nuclear,

por nombrar un número muy pequeño.

¿No cree que esta pregunta es una buena combinación para la comunidad de bioinformática en SE, biostar.SE?
Claro, e iré a ver qué hay allí también. Sin embargo, si hubiera una lista curada del tipo descrito en la pregunta, la respuesta a esta pregunta quedaría completamente fuera del dominio de la bioinformática, excepto para quien haga la lista.

Respuestas (2)

Para abordar su lista:

  • una estructura 3D de alta calidad: esto lo puede obtener fácilmente de PDB, utilizando las respuestas a la pregunta que vinculó como punto de partida. Sin embargo, cada vez es más claro que las proteínas intrínsecamente no estructuradas también desempeñan funciones importantes en la célula, y para estas no obtendrá una buena estructura 3D.
  • actividad conocida in vivo / asociados conocidos en sus actividades en la célula: los socios de interacción se pueden encontrar en bases de datos como STRING , aunque el solo hecho de conocer a los socios no significa que entendamos lo que está pasando :)
  • cinética de su actividad: No conozco ningún buen recurso sobre este excepto BRENDA para la cinética enzimática. Pero, por supuesto, también hay cinéticas en las interacciones proteína-proteína que sería interesante conocer. (Actualización: hay AffinDB ).
  • Elementos de regulación para la expresión: hay bases de datos como TransFac , pero los experimentos de ChIP-Seq muestran que solo conocemos una pequeña parte de la regulación.

Pero, creo que la clave para una buena respuesta está aquí:

(probablemente lo más importante) un consenso general entre los expertos de que está bien descrito

Comprobaría con qué frecuencia se describen los genes en la literatura. Los GeneRIF de NCBI pueden ser un buen punto de partida, porque son fragmentos de la literatura que se seleccionan y muestran en las páginas de NCBI Gene. Por ejemplo, p53 tiene >3800 de estos. La longitud del resumen también podría ser un buen indicador. (¿O la longitud de la página de Wikipedia?)

Muchas de estas preguntas pueden ser respondidas por UniProt:

  • alrededor de 4.600 proteínas con alguna estructura 3D ( esta consulta )

  • de estos 3.800 con función anotada en Gene Ontology ( esta consulta )