¿Cuántas proteínas humanas tienen una estructura 3D resuelta?

Me preguntaba cuántas proteínas humanas tienen una estructura 3D resuelta. ¿Existe una base de datos solo con proteínas humanas? Miré pdb pero no pude encontrar un filtro.

Creo que va a tener muchos problemas con la redundancia, especialmente si quiere saber la cantidad de proteínas únicas.
@GWW Supongo que escribir un pequeño guión puede eliminar la redundancia.
Es posible que tenga más suerte al hacer esta pregunta en biostar .
Tenga en cuenta que "resuelto" es muy subjetivo. No todas las estructuras son de alta calidad, y algunas de ellas simplemente son incorrectas debido a errores experimentales.
Esta es una pregunta muy temática por dos razones: el banco de datos de proteínas acepta NMR y estructuras cristalinas de proteínas que ofrecen diferentes grados de resolución y precisión. Estas estructuras también son algo subjetivas porque la proteína puede adoptar diferentes conformaciones dependiendo de su contexto biológico relevante. En tercer lugar, las extracciones con solventes pueden imponer una estructura errónea.
muchas de estas proteínas solo tienen uno o dos dominios resueltos como estructuras. las proteínas animales son difíciles de esa manera. ahí es donde esta pregunta se vuelve un poco difícil en mi humilde opinión.

Respuestas (4)

Mapeo de 6405 proteínas a 5220 genes, según Ensembl.

En BioMart de Ensembl , puede seleccionar la ID de PDB como referencia externa. Exporte los resultados y cuente las proteínas/genes únicos que tienen una ID de PDB.

PDB es un buen recurso para responder tales preguntas, ya que le permitirá filtrar los resultados por muchos parámetros adicionales. Para contar y extraer estructuras 3D de proteínas humanas:

  1. Abra Advancedla pestaña de búsqueda del sitio web de PDB.
  2. Seleccione Biology-> Source organismen el menú.
  3. tipo Homo sapiens (human)_
  4. Puede reducir la redundancia comprobando a Remove Similar Sequences at n% identitycontinuación.
  5. Enviar consulta.

Para agregar más filtros, haga clic en Refine Query with Advanced Search. Allí puede extraer estructuras por fecha de deposición, calidad (por ejemplo, resolución o factores R para estructuras resueltas por difracción de rayos X), ligandos, clasificación de enzimas, etc. (marcando Add Search Criteria)

La búsqueda de proteínas humanas con eliminación de homólogos con un límite de identidad del 90 % obtiene 7117 estructuras. El número de estructuras de proteína de rayos X de buena calidad (resolución < 2.5A) es actualmente 3964 (con el mismo límite de identidad).

A continuación, puede descargar la lista obtenida o crear informes personalizados (menús a continuación).

Una buena herramienta (también utilizada por PDB) para generar conjuntos de datos de proteínas no redundantes es cd-hit .

Según sus comentarios, no parece que sea reacio a escribir algunos scripts personalizados, por lo que una opción sería aprovechar la base de datos de Estructura NCBI. Puede filtrarlo por organismo y luego descargar los resultados como un archivo de texto/XML. Si necesita acceder a los datos PDB sin procesar, puede descargar el archivo PDB y examinar los que están en su lista filtrada.

El nuevo sistema de búsqueda de PDBe está diseñado para responder a estas preguntas http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules

muestra que hay 6964 macromoléculas humanas únicas con datos de estructura en el PDB.

Por supuesto, muchos serán fragmentos de proteínas en lugar de la molécula completa.