¿Cómo analizar los identificadores de residuos PDB de los archivos analizables SCOP?

Estoy tratando de analizar los archivos analizables SCOP , específicamente dir.des.scop.txt ver 1.75. Pero he tenido problemas con los identificadores de residuos de PDB en el archivo. Este es un archivo limitado por pestañas y el residuo de PDB y el identificador de cadena es la sexta columna que. Un ejemplo de este identificador es A:1-28,A:77-837 para el dominio d1kk8a2. De ahí en adelante lo representaré como domain_id (pdb_id chain&range). Este ejemplo en particular es sencillo, lo que significa que el dominio d1kk8a2 consta de los residuos 1-28 y 77-837 de la cadena A de la entrada 1kk8 del PDB correspondiente. Pero algunos de ellos son poco intuitivos y como d3ckra1 (3ckr A:-2-385), ¿qué significa la entrada negativa para el inicio? Y este ejemplo d2p83b1 (2p83 B:61P-385), hay una P en el rango (61P-385).

Si va al sitio web de pdb y busca las entradas correspondientes, luego vaya a la pestaña de secuencia, verá la alineación de la cadena PDB y los dominios SCOP correspondientes. Los rangos que se muestran allí corresponden a las entradas en SCOP, pero es difícil entenderlo. ¿Alguien puede explicar o proporcionar algunos consejos? Gracias.

Respuestas (1)

Los residuos de PDB se describen mediante el número de residuo y un código de inserción. Los números de residuos pueden ser cualquier número, incluidos los valores negativos. En 3CKR el primer residuo tiene nr. -6, seguido de -5, etc. Esto podría indicar que hay residuos adicionales al comienzo de la secuencia, en relación con otras entradas de PDB. En 2P83, el primer residuo tiene el número 61P. Eche un vistazo a https://lists.sdsc.edu/pipermail/pdb-l/2004-March/001513.html para obtener una explicación de por qué los números de residuos de PDB tienen códigos de inserción.

Muchas gracias por la útil respuesta. Me gustaría obtener los números de residuos asociados con cada cadena de proteína PDB. Pude obtener las secuencias de esta ubicación ftp.wwpdb.org/pub/pdb/derived_data , pero no pude encontrar la numeración de residuos correspondiente.
Creo que necesita obtener un analizador de archivos PDB y analizar la información de allí ...