Me preguntaba cuántas proteínas humanas tienen una estructura 3D resuelta. ¿Existe una base de datos solo con proteínas humanas? Miré pdb pero no pude encontrar un filtro.
Mapeo de 6405 proteínas a 5220 genes, según Ensembl.
En BioMart de Ensembl , puede seleccionar la ID de PDB como referencia externa. Exporte los resultados y cuente las proteínas/genes únicos que tienen una ID de PDB.
PDB es un buen recurso para responder tales preguntas, ya que le permitirá filtrar los resultados por muchos parámetros adicionales. Para contar y extraer estructuras 3D de proteínas humanas:
Advanced
la pestaña de búsqueda del sitio web de PDB.Biology
-> Source organism
en el menú.Homo sapiens (human)
_Remove Similar Sequences at n% identity
continuación.Para agregar más filtros, haga clic en Refine Query with Advanced Search
. Allí puede extraer estructuras por fecha de deposición, calidad (por ejemplo, resolución o factores R para estructuras resueltas por difracción de rayos X), ligandos, clasificación de enzimas, etc. (marcando Add Search Criteria
)
La búsqueda de proteínas humanas con eliminación de homólogos con un límite de identidad del 90 % obtiene 7117 estructuras. El número de estructuras de proteína de rayos X de buena calidad (resolución < 2.5A) es actualmente 3964 (con el mismo límite de identidad).
A continuación, puede descargar la lista obtenida o crear informes personalizados (menús a continuación).
Una buena herramienta (también utilizada por PDB) para generar conjuntos de datos de proteínas no redundantes es cd-hit .
Según sus comentarios, no parece que sea reacio a escribir algunos scripts personalizados, por lo que una opción sería aprovechar la base de datos de Estructura NCBI. Puede filtrarlo por organismo y luego descargar los resultados como un archivo de texto/XML. Si necesita acceder a los datos PDB sin procesar, puede descargar el archivo PDB y examinar los que están en su lista filtrada.
El nuevo sistema de búsqueda de PDBe está diseñado para responder a estas preguntas http://www.ebi.ac.uk/pdbe/entry/search/index?organism_synonyms:HUMAN&view=macromolecules
muestra que hay 6964 macromoléculas humanas únicas con datos de estructura en el PDB.
Por supuesto, muchos serán fragmentos de proteínas en lugar de la molécula completa.
GWW
Gergana Vandova
GWW
Konrad Rodolfo
usuario560
shigeta