Estos datos de secuencia (ADN) tienen muy pocos comienzos de metionina. ¿Cómo es eso posible?

Estoy trabajando en mi primer proyecto relacionado con la secuenciación y estoy tratando de encontrar proteínas con una ID de PFAM específica ( PF11999 ). El proyecto se llama "MMETSP", busqué las anotaciones para esa identificación, identifiqué péptidos de señal usando SignalP y sus ubicaciones objetivo con una herramienta llamada MultiLoc2 (solo estaba buscando objetivos extracelulares).

De las muy pocas secuencias que quedaron después de todo este filtrado, ninguno de los bits de ADN comenzó con el código de par de bases "ATG", para metionina. ¿Cómo puede ser esto?

Usé el shell para calcular que solo el 1,83% de todas las secuencias comienzan con ATG.
¿Alguna idea sobre esto?

¿Exactamente qué secuencias estás buscando?
Estoy buscando proteínas anticongelantes (PF11999) en diatomeas marinas, que se encuentran en la región extracelular. El uso del sitio de escisión proporcionado por SignalP I puede aislar el péptido de direccionamiento. Sin embargo, estos péptidos parecen no tener un código de "inicio". Obtuve las secuencias buscando las identificaciones de proteínas en los archivos fasta que obtuve de la búsqueda de anotaciones.
Entonces, ¿solo estás mirando la secuencia peptídica escindida? No hay ninguna razón por la que deban comenzar con una metionina a menos que sean de tipo I y no reciban más procesamiento N-terminal.
Bueno, estoy mirando el ADN que codifica el péptido. El péptido está ubicado frente a la proteína "materna", por lo que el ORF debería comenzar con una metionina, ¿no es así?
Si no hay UTR en esta especie y el CDS está anotado como completo, entonces sí. De otra manera no.
Entonces debería ser sí. Hablaré con mi supervisor el lunes. ¡Gracias por tu tiempo!

Respuestas (1)

Si alguien se tropieza con esta pregunta, descubrí cuál era el problema al final:
contrariamente a mi suposición de que las secuencias de ADN estaban todas en la dirección correcta 5'3', resultó que encontramos el ORF exacto en la cadena complementaria en la otra dirección y quién sabe dónde más. Afortunadamente, MMETSP-Data también presentaba un directorio /pep, en el que las secuencias necesarias se encontraban en una versión limpia. Gracias por leer y buena suerte.