¿Cómo obtener el número promedio de diferencias por pares entre las poblaciones?

Tengo datos genéticos en formato .structure y .vcf (y puedo llegar fácilmente a otros formatos con PGDSpider ). La población de interés está estructurada y me gustaría calcular el número promedio de diferencias por pares (sobre una ventana dada) entre cualquier par de poblaciones.

¿Hay una herramienta existente que lo haría?

Respuestas (1)

Con relación a la otra pregunta sobre bioconductores , le señalaría estos paquetes;

  1. VariantAnnotation : proporciona funcionalidad para leer y manipular archivos vcf.
  2. GenomicRanges : proporciona funcionalidad para crear intervalos de genoma. También proporciona funciones de superposición para calcular las superposiciones entre varios rangos.
  3. rtracklayer : le permite cambiar fácilmente los formatos entre diferentes formatos de archivos biológicos.
  4. AnnotationHub : hace que muchos archivos de anotaciones comunes y poco comunes estén disponibles en el terminal R en varios formatos, como TxDb, OrgDb, etc., etc.

Aquí hay un tutorial muy similar a lo que estás pidiendo. Utiliza algunos de los paquetes mencionados anteriormente. Principalmente, AnnotationHub, GenomicRanges y VariantAnnotation.

Si desea el manual de estos paquetes, están disponibles en las páginas enlazadas.