Tengo una lista de proteínas de A. thaliana y me gustaría saber su ubicación en la célula. Encontré SUBA pero parece que no comparten su conjunto de datos y solo permiten consultas a través de su sitio web. Es un inconveniente para mí, porque necesito localizar 1,6 k de proteínas y procesar más los resultados. ¿Hay un conjunto de datos o una API que podría usar en su lugar?
PD. Si este no es el foro adecuado para preguntar esto, por favor notifícamelo.
Si hace clic en la publicación real de SUBA4 , puede ver en la sección de disponibilidad de datos que han depositado conjuntos de datos de origen de los que se derivan sus predicciones, en http://dx.doi.org/10.4225/23/581055ddcb1ce .
Estos parecen ser archivos estándar, por ejemplo, CSV de varias capas de datos, como aquí . Puede tomar algún esfuerzo (por ejemplo, su algoritmo) para integrar estas fuentes de datos, no estoy familiarizado con estos conjuntos de datos.
Por supuesto, es un inconveniente que no elijan anunciar esto en el propio servidor.
También puede intentar usar The Arabidopsis Information Resource (TAIR) .
Es la base de datos creada específicamente para la planta superior modelo Arabidopsis thaliana .
Puede descargar los archivos en formato .fasta, .gz, .txt, .csv desde su PAGINA WEB DE DESCARGAS . El sitio web también proporciona enlaces a otros recursos de información sobre A. thaliana .
PD: La base de datos se actualiza semanalmente.
Edición 1: intente esto o haga un seguimiento de download_files/Proteins/Properties/AtSubP_results
Maximiliano Prensa