Deducción de la longitud de la secuencia de proteínas a partir de la longitud de la secuencia de ADN del gen

Question

Deducción de la longitud de la secuencia de proteínas a partir de la longitud de la secuencia de ADN del gen

gato_curioso

¿Existe una forma estándar de deducir la longitud de la secuencia de proteínas a partir de la longitud de la secuencia de ADN del gen que la codifica?

Ingenuamente había asumido que amino_acid_seq_length / 3 -1(borrando uno para el codón de terminación) debería funcionar, pero aparentemente no siempre. ¿Hay una mejor manera?

Supongamos que el gen es eucariótico, específicamente un gen vegetal.

p.ej

O

científico

(AA Seq. / 3 ) - 1 debería ser un buen aproximado en bacterias y arqueas. Dado que generalmente el ARN de transcripción es maduro. En el organismo eucariótico, tiene todo tipo de complejidad de procesamiento, por lo que, a menos que empalme la secuencia de intrones, no sabrá con certeza la secuencia de la proteína

gato_curioso

Gracias @SciEnt. Pero si expresa un gen eucariótico en algo como E Coli, la proteína recombinante resultante aún debería ser (AA / 3) - 1 ya que carecerán de la maquinaria de procesamiento posterior.

científico

gato_curioso, si eso es lo que esperaríamos, tienes razón.

Respuestas (1)

Deducción de la longitud de la secuencia de proteínas a partir de la longitud de la secuencia de ADN del gen

(AA Seq. / 3 ) - 1 debería ser un buen aproximado en bacterias y arqueas. Dado que generalmente el ARN de transcripción es maduro. En el organismo eucariótico, tiene todo tipo de complejidad de procesamiento, por lo que, a menos que empalme la secuencia de intrones, no sabrá con certeza la secuencia de la proteína
Gracias @SciEnt. Pero si expresa un gen eucariótico en algo como E Coli, la proteína recombinante resultante aún debería ser (AA / 3) - 1 ya que carecerán de la maquinaria de procesamiento posterior.
gato_curioso, si eso es lo que esperaríamos, tienes razón.

Ashafix · Answer 1

Ashafix

Si observa la secuencia de ADN en la patente , verá que no comienza con ATG y no termina con un codón de parada. La secuencia descrita tiene algunas bases adicionales, por lo tanto, la discrepancia en la longitud de la proteína y el ADN. Esas bases adicionales casi siempre ocurren en el ADNc, por ejemplo, debido a la poliadenilación, las secuencias de Kozak, etc.

gato_curioso

¡Gracias! Entonces, si quisiera usar la secuencia para (digamos) la expresión heteróloga, ¿sería imperativo corregir esas aberraciones? es decir, ¿cómo se infiere cuál será la longitud correcta del aminoácido o qué bases son exactamente las bases adicionales? En otras palabras, ¿cómo se "limpia" una secuencia de ADNc?

Ashafix

Puedes usar una herramienta como esta: web.expasy.org/translate Solo ingresa la secuencia y busca el marco de lectura abierto más largo.

gato_curioso

Gracias de nuevo Ashafix. Eso me explica muchas cosas. Una pequeña pregunta: su herramienta predice la proteína 569 AA correcta en el caso de mi segundo fragmento. Genial. Pero en el caso de la primera secuencia, la herramienta da 569, mientras que el fragmento de código de patente enumera 570 . ¿AUTOMÓVIL CLUB BRITÁNICO? ¿Estoy cometiendo un error? O....?

Ashafix

Me parece una ofuscación de datos de patentes, la secuencia real en la patente es 569 pero si observa los últimos 5 aminoácidos en la secuencia traducida, es PLGEE, mientras que en la secuencia de aminoácidos de la patente aparece un aspartato de la nada: PLDEE . Dos recomendaciones: 1) Empieza a organizar tus secuencias con algún programa, es más fácil compararlas visualmente 2) Trata las patentes con cautela, tienen que decir la verdad de lo contrario no serán válidas, pero no necesariamente dicen toda la verdad y podría estar oculto en lo profundo de la patente para confundir al lector.

gato_curioso

¡Gracias por los consejos! ¿Alguna recomendación de un programa para organizar mis secuencias? ¿Que usas?

Ashafix

No creo que sea apropiado recomendar software comercial aquí, pero en Researchgate debería encontrar muchos consejos.

Deducción de la longitud de la secuencia de proteínas a partir de la longitud de la secuencia de ADN del gen

gato_curioso

científico

gato_curioso

científico

Respuestas (1)

Ashafix

gato_curioso

Ashafix

gato_curioso

Ashafix

gato_curioso

Ashafix

Validación biológica de la interacción gen-gen determinada computacionalmente

¿Qué significa “genes en el tronco del árbol evolutivo”?

¿Por qué la secuencia de aminoácidos presentada en el Catalytic Site Atlas de una proteína dada difiere de la secuencia en el RSCB Protein Data Bank?

Análisis de alineación degenerado

¿Qué es el "Dogma Periférico"?

¿Cómo validar las interacciones regulatorias deducidas de los datos de expresión génica?

importancia de la secuenciación del cDNA de un gen específico en diferentes plantas

¿Cómo escribir una secuencia de palíndromo como se desee (crear, teóricamente)? (auto-respondido)

¿Cómo se pueden verificar computacionalmente las predicciones informáticas del plegamiento de proteínas?

Transcripción de ADN a ARNm con intrones