Encontrar y comparar genes homólogos

Tengo un gen de interés que me gustaría comparar entre homólogos. ¿Cómo se hace para encontrar un gen a partir de secuencias de codificación conocidas en todos los filos? Después me imagino que podría hacer una alineación de secuencia Clustal para ver cómo coinciden las secuencias.

Respuestas (5)

Hay varias bases de datos de homólogos, por ejemplo:

La ventaja de utilizar una base de datos existente es que se han utilizado métodos más sofisticados para detectar ortólogos que las simples búsquedas BLAST (consulte " Métodos computacionales para la inferencia de ortología génica " para obtener una revisión), y todo ya está precomputado, por lo que es mucho más rápido. La desventaja es que todos los métodos precalculados necesitan usar una instantánea de los genomas del pasado, por lo que no todos los genomas disponibles actualmente estarán allí.

Si entiendo bien su pregunta, Genome Browser en UCSC es un excelente lugar para comenzar. Si conoce el nombre del gen, puede buscarlo. Por ejemplo, aquí está la página del receptor 1 de insulina humana . A partir de ahí puedes comparar 46 genomas, con alineaciones.

Wow, esa es una interfaz fea. ¿Cómo uso esa cosa? Creo que eso es lo que estoy buscando. Mirando el gen INS-R1 como ejemplo, veo pollo, pez cebra, un grupo de 46 vertebrados. ¿Puedo usar esta herramienta para crear una secuencia de consenso de las regiones conservadas?

Si no tiene idea de dónde su gen coincidirá con otros genes, pruebe algo como Blast en el sitio web del NCBI .

Esto le dará una lista de aciertos que luego puede usar para alinear con un alineador de secuencia múltiple (MSA). La misma página del NCBI puede brindarle un árbol reconstruido a partir de los resultados del proceso de búsqueda, aunque existe una variedad de métodos que se pueden usar si solo descarga las secuencias e intenta construir la alineación de la familia de genes usted mismo usando "[x] Select Todo -- Obtener secuencias seleccionadas" en la página de resultados de explosión del NCBI, luego descargarlas en FASTA u otro formato con "Enviar a -- Archivo -- Formato FASTA -- Crear archivo".

Si lo que desea es incluir su secuencia de genes en el mejor lugar de alineación en una alineación de familia de genes existente, puede probar PAGAN .

tal vez prefiera NCBI/Homologene en su lugar. http://www.ncbi.nlm.nih.gov/homologene

o simplemente usando psiblast contra NR si tiene una secuencia de nucleótidos o proteínas.

http://blast.ncbi.nlm.nih.gov/Blast.cgi

Solo agregando mis 5 centavos, hay una base de datos reciente llamada metáforas :

MetaPhOrs es un repositorio público de predicciones de ortología y paralogía basadas en la filogenia que se calcularon utilizando los recursos disponibles en siete servicios populares de predicción de homología (PhylomeDB, EnsemblCompara, EggNOG, OrthoMCL, COG, Fungal Orthogroups y TreeFam). Actualmente, más de 306 millones de pares únicos de proteínas homólogas están depositados en la base de datos MetaPhOrs. Estas predicciones se recuperaron de 705 123 árboles filogenéticos para 829 genomas. Para cada predicción, MetaPhOrs proporciona un puntaje de consistencia y un nivel de evidencia que describen su bondad, junto con la cantidad de árboles y enlaces a sus bases de datos de origen.

Es particularmente bueno porque:

  • Es la única base de datos de homología que conozco que brinda información sobre paralogía frente a ortología.

  • Está vinculado a los nombres de UniProt.

  • Proporciona una API de Python bastante buena para consultas por lotes.