Es la primera vez que publico en este foro, pero estaba buscando ayuda sobre los aspectos de datos de este proyecto.
Mis herramientas de elección estarían en python/R .
Objetivo: busco crear un perfil específico de la enfermedad de solo SNP y SNP en miARN y sitios de destino de miARN.
PARTE 1: TCGA Mi primer paso es usar datos TCGA que enumeran una tonelada de mutaciones dañinas en un formato LOH .txt. Me gustaría poder mapear esas mutaciones en SNP, genes o miARN (cualquiera que sea la entidad a la que pertenezcan). La hoja de datos de TCGA está aquí . Los datos de ejemplo están aquí. para el cáncer de mama. Supongo que también puedo usar estos datos de miARN y ARNm.
Preguntas aquí:
miARN/Objetivos y SNP El siguiente paso es obtener miARN y ARNm específicos para el cáncer y asignarles SNP. Supongo que usaré bases de datos de miARN dbSNP o Sanger para obtener miARN/objetivos y secuencias de semillas.
Estoy un poco perdido sobre cómo combinar todas estas piezas de información, qué formatos usar para la salida (vinculados a piezas individuales) y qué herramientas, si las hay, usar para recopilar todos estos datos usando python. Esta herramienta es herramienta útil mirdsnp.
Puede echar un vistazo a este tutorial para comprender los archivos TCGA MAF. Y puede encontrar una lista de archivos TCGA MAF que contienen mutaciones asignadas a genes y miARN en https://www.synapse.org/#!Search:syn1710680
pitido
prusia
pitido