¿Dónde puedo encontrar algunos conjuntos de datos de secuencias de nucleótidos alineadas? ¿Y qué debo suponer sobre la precisión de las alineaciones allí?
(Me gustaría usar dichos conjuntos de datos para entrenar el modelo de alineación en el que estoy trabajando. En particular, para ayudarme a obtener una estimación de algunos parámetros, como la frecuencia de INDEL de un solo nt en algunas ubicaciones).
Puede encontrar la alineación multiz de 46 vías en el navegador del genoma de UCSC , está abajo en la parte de genómica comparativa y está etiquetada como "contras de 46 vías", que es una alineación del genoma de 46 especies de vertebrados. Puede usar datos en su navegador de genoma en el sitio u obtener información de descarga aquí .
Si está interesado en alineaciones por pares, no conozco ninguna base de datos de alineación por pares, pero de hecho no necesita una. Puede buscar secuencias de nucleótidos en la base de datos de nucleótidos del NCBI y alinearlas usando BLAST en su sitio web . BLAST es quizás la herramienta más común para alineaciones por pares y también para búsquedas de alineaciones en bases de datos, en las que se buscan coincidencias en una sola secuencia de consulta en una base de datos de secuencias. Si desea realizar una gran cantidad de alineaciones, puede descargar BLAST a su computadora para realizarlas más rápido.
cris
Anas Elghafari
Behzad Rowshanravan
Anas Elghafari
Anas Elghafari
WYSIWYG
Anas Elghafari
WYSIWYG
Anas Elghafari
Anas Elghafari
WYSIWYG
Anas Elghafari
rmccclokey