Tengo pares de secuencias de ADN codificantes que deseo realizar alineaciones de codones por pares a través de Python , he "completado la mitad" del proceso.
Hasta ahora..
Biopython
el paquete.EMBOSS Needle
el programa.Yo deseo..
Pregunta
Agradecería sugerencias de programas/códigos (llamados desde Python) que puedan transferir espacios de pares de secuencias peptídicas alineadas a codones de los pares de secuencias de nucleótidos correspondientes. O programas/código que pueden llevar a cabo la alineación de codones por pares desde cero.
El proceso básico sería (en pseudocódigo, no sé Python lo suficiente, soy un geek de Perl):
$seq1=ATGCCAGGCTGA
$seq2=ATGGGACCATAA;
for ($i=0;$i<length($seq1);$i++){
codons1[$i]=amino_acid
}
for ($i=0;$i<length($seq2);$i++){
codons2[$i]=amino_acid
}
En este punto, tendrá dos matrices o hashes o tuplas o dictados o lo que sea que contenga el aminoácido que corresponde a cada posición de codón de las secuencias de entrada. Usted va y hace su traducción y lo de dS/dN y luego puede usar estas listas para mapear de nuevo a los nucleótidos originales:
for ($i=0;$i<length($ProteinSseq1);$i++){
print codons1[$i]
}
Deberá adaptar esto para manejar los codones correctamente (i ++ solo se incrementará en uno, debe extraer los tripletes) y luego leer los espacios, pero todos estos son problemas de programación que no tienen nada que ver con el lado biológico de las cosas.
terdón
hola_ahí_andy
terdón
terdón
terdón
hola_ahí_andy
terdón
WYSIWYG
---
para un espacio indicado en la secuencia peptídica por-
. La forma de hacerlo en python es:gcode={}
gcode['M']='ATG'
gcode['-']='---'
... y así sucesivamente. Luego, divida la secuencia de entrada y busque cada letra en el diccionario.