¿Es necesario conocer y secuenciar todas las isoformas de microARN para obtener la expresión de microARN?

Por lo que entiendo, los microARN son estructuras nc cortas en forma de "horquilla". Al secuenciar y contar miARN, se "encuentran" isoformas de miARN, que son subsecciones de longitud variable y posiblemente con algunas mutaciones u otras diferencias con respecto al microARN "canónico". Los recuentos totales de un miARN son las sumas de los recuentos de las isoformas que se relacionan con ese miARN. [Por favor corrígeme si todo esto está mal]

Con respecto a la secuenciación de próxima generación, se debe agregar una "biblioteca" que le indique qué secuenciar. ¿Significa esto que solo se pueden leer y contar las isoformas "conocidas" o también se pueden leer y contar secuencias "nuevas" (es decir, mutaciones) que no se conocían antes de que comenzara la secuenciación?

Con respecto a qPCR, ¿esta técnica solo busca isoformas individuales? En cuyo caso, si quiero saber algo sobre una expresión de microARN en particular, necesitaría hacer qPCR para cada isoforma conocida relacionada con ese microARN. O, de hecho, es más fácil secuenciar la expresión de microARN con qPCR, ya que las secuencias pueden coincidir con la estructura de horquilla principal con mayor probabilidad. (Por más fácil quiero decir en comparación con querer obtener la expresión para una isoforma particular, ya que debe coincidir exactamente).

> Con respecto a la Secuenciación de Próxima Generación, se necesita agregar una 'biblioteca' > que le diga qué secuenciar. En el contexto de NGS, la "biblioteca" es un grupo de moléculas que usted secuencia. No es necesario conocer su contenido para obtener su secuencia.

Respuestas (1)

Yo había trabajado en un problema similar y les cuento mi experiencia.

Primero, debe considerar el hecho de que un miARN maduro puede surgir de múltiples ubicaciones genómicas, es decir, muchos pre-miARN pueden dar lugar al mismo miARN maduro.

Como dijiste, hay productos de escisión de pre-miARN con heterogeneidad en sus extremos, es decir, hay secuencias que no coinciden exactamente con la región madura anotada. Mientras que los productos con heterogeneidad en 3' pueden denominarse isoformas, es probable que los productos con heterogeneidad en 5' tengan objetivos diferentes a medida que se interrumpe la secuencia semilla y, por lo tanto, son técnicamente miARN diferentes (por definición).

Ahora, la mejor técnica para analizar isoformas es la secuenciación de ARN pequeño (NGS). qPCR no sería una buena técnica ya que los cebadores no siempre pueden diferenciar secuencias muy similares (lo que empeora por el hecho de que los miARN son demasiado pequeños). Una biblioteca NGS es un conjunto de secuencias de ADN que se obtiene al cortar el ARN/ADN seguido de la ligadura del adaptador (transcripción inversa para el ARN). Dado que se conoce la secuencia del adaptador, la reacción de secuenciación no requiere que conozca la secuencia de los productos. Sin embargo, necesitaría conocer el genoma de referencia para encontrar nuevos miARN. Esto se debe principalmente al hecho de que es muy difícil secuenciar los pre-miRNA (baja abundancia y estructura en horquilla). Puede identificar nuevos ARN pequeños con mucha facilidad, pero no puede decir que son miARN a menos que pueda asignarlos a un precursor de bucle de tallo (pre-miARN).

Puede descubrir muy bien nuevas lecturas y la gente ha descubierto muchos miARN nuevos usando NGS. Puedo contarte la metodología que seguí para encontrar productos atípicos del mismo pre-miARN. Para simplificar, llamo a los productos heterogéneos en 5' semillas malas (porque han alterado la secuencia de semillas) ya los productos heterogéneos en 3' como isomiRs . Utilicé una metodología similar a la de un programa muy conocido: miRdeep .

  1. Obtenga las secuencias de pre-miARN de miRbase
  2. Obtenga secuencias maduras de miARN de miRbase
  3. Use bowtie-1 para construir un índice a partir de las secuencias de pre-miRNA
  4. Retire el adaptador de sus lecturas fastq y elimine las lecturas de baja calidad. Hay muchas herramientas para hacer eso. Puedes probar Trimmomatic.
  5. Asigne secuencias de miARN maduros al índice de pre-miARN usando corbatín para encontrar la ubicación exacta del miARN maduro en el pre-miARN
  6. El mapa lee la región pre-miARN. Filtre las lecturas que no se asignan en una ventana predefinida alrededor de la región madura.
  7. Clasifique las lecturas como badseed o isomiR

Ahora, los isomiR y las lecturas que se asignan perfectamente a la región madura de miARN pueden considerarse contribuyentes a la expresión total de miARN. Sin embargo, badseeds no debe considerarse como una isoforma. También puede permitir un cierto nivel de desajuste y contar estas lecturas. Las secuencias con discrepancias en la región de semillas serían de nuevo malas semillas . Además, puede tener esquemas de puntuación para sus lecturas.

No existen muchos estudios sobre dicho análisis. No obtuve ningún resultado publicable con nuestros datos, pero la metodología es razonablemente correcta. Puede seguir adelante y aplicarlo para su estudio.

Ok, al menos una respuesta a la pregunta. Vale la pena retener el punto básico en la respuesta que es realmente un comentario: la biblioteca es el grupo de secuencias que obtiene de NGS, y usted secuencia todo el ARN de un tamaño particular. Identificas lo que has secuenciado en relación con una referencia, podría ser un genoma de referencia en el que los miARN ya están anotados, o puedes intentar descubrir otros nuevos, como lo hiciste. Y tú (o al menos yo) no encuentras ningún pri-miRNA.