¿Vocabulario controlado por moltype?

Al enviar secuencias usando tbl2asn a NCBI/GenBank, la documentación establece que existe un vocabulario controlado para la clave "moltype", pero en ningún lugar de Internet puedo encontrar una lista completa de ese vocabulario. "ARNm" y "genómico" se dan como ejemplos en varias páginas, y puedo ver en la documentación de Sequin cuáles son los descriptores de GUI de todos los términos del vocabulario (por ejemplo, "ADN genómico"), pero no puedo encontrar los términos en sí . ¿Alguna idea de dónde puedo encontrar esta lista?

Un poco complicado, pero ¿podría descargar Sequin para ver qué produce en el fasta para cada tipo de molécula?
No me había dado cuenta de los archivos fasta de salida de Sequin. Acabo de verificar y no parece incluir ninguno de esos descriptores en el archivo FASTA que se exportará cuando use el comando Exportar.
Lo siento, en realidad no sé nada al respecto. Solo un pensamiento que tuve.
Fue un buen pensamiento. Como puede ver, edité (quizás de manera inapropiada) mi comentario porque lo probé y no parecía funcionar.

Respuestas (2)

Existe esta página de "Vocabulario controlado para el calificador /mol_type" creada por la Colaboración internacional de bases de datos de secuencias de nucleótidos en 2013. Dice que los valores permitidos son:

"ADN genómico", "ARN genómico", "ARNm", "ARNt", "ARNr", "otro ARN", "otro ADN", "ARN transcrito", "ARNc viral", "ADN no asignado", "ARN no asignado "

Encontré esto como el segundo resultado de una búsqueda en Google sobre el vocabulario moltype .

También encontré eso. El problema con esto es que en los ejemplos proporcionados por NCBI, "genomic" es uno de los valores válidos "moltype". "genómico" por sí mismo no aparece en esa lista de vocabulario controlado.
Por supuesto, otra posibilidad es que la otra documentación del NCBI no sea válida y que este sea el vocabulario controlado que usan también.
Acabo de recibir noticias del NCBI. Aunque este vocabulario controlado entra en conflicto con su propia documentación (que sospecho que está desactualizada), es el vocabulario que usan ahora.

Encontré una versión archivada de Sequin para envíos y actualizaciones de bases de datos: una guía rápida , publicada por NCBI.

  • moltype debe usar uno de los siguientes valores. Ejemplo: [moltype=genomic]
    • genómico
    • ARN precursor
    • ARNm
    • ARNr
    • ARNt
    • ARNsn
    • ARNsc
    • otro-genético
    • ARNc
    • ARNsno
    • ARN transcrito
¡Gran trabajo! Eso parece que es lo que necesito. Es raro que esto no sea público.
La otra posibilidad es que la OTRA documentación esté desactualizada y que el vocabulario controlado que encontró mgkrebbs sea el que también usa el NCBI.
@DavidMaddison Sí, es extraño. Puede valer la pena ponerse en contacto con NCBI al respecto.
Sí, le envié una nota al NCBI preguntándole sobre esto hoy. ¡Volveré a informar!
Vea mi nuevo comentario a la respuesta de mgkrebbs.