Por lo que entiendo, los microARN son estructuras nc cortas en forma de "horquilla". Al secuenciar y contar miARN, se "encuentran" isoformas de miARN, que son subsecciones de longitud variable y posiblemente con algunas mutaciones u otras diferencias con respecto al microARN "canónico". Los recuentos totales de un miARN son las sumas de los recuentos de las isoformas que se relacionan con ese miARN. [Por favor corrígeme si todo esto está mal]
Con respecto a la secuenciación de próxima generación, se debe agregar una "biblioteca" que le indique qué secuenciar. ¿Significa esto que solo se pueden leer y contar las isoformas "conocidas" o también se pueden leer y contar secuencias "nuevas" (es decir, mutaciones) que no se conocían antes de que comenzara la secuenciación?
Con respecto a qPCR, ¿esta técnica solo busca isoformas individuales? En cuyo caso, si quiero saber algo sobre una expresión de microARN en particular, necesitaría hacer qPCR para cada isoforma conocida relacionada con ese microARN. O, de hecho, es más fácil secuenciar la expresión de microARN con qPCR, ya que las secuencias pueden coincidir con la estructura de horquilla principal con mayor probabilidad. (Por más fácil quiero decir en comparación con querer obtener la expresión para una isoforma particular, ya que debe coincidir exactamente).
Yo había trabajado en un problema similar y les cuento mi experiencia.
Primero, debe considerar el hecho de que un miARN maduro puede surgir de múltiples ubicaciones genómicas, es decir, muchos pre-miARN pueden dar lugar al mismo miARN maduro.
Como dijiste, hay productos de escisión de pre-miARN con heterogeneidad en sus extremos, es decir, hay secuencias que no coinciden exactamente con la región madura anotada. Mientras que los productos con heterogeneidad en 3' pueden denominarse isoformas, es probable que los productos con heterogeneidad en 5' tengan objetivos diferentes a medida que se interrumpe la secuencia semilla y, por lo tanto, son técnicamente miARN diferentes (por definición).
Ahora, la mejor técnica para analizar isoformas es la secuenciación de ARN pequeño (NGS). qPCR no sería una buena técnica ya que los cebadores no siempre pueden diferenciar secuencias muy similares (lo que empeora por el hecho de que los miARN son demasiado pequeños). Una biblioteca NGS es un conjunto de secuencias de ADN que se obtiene al cortar el ARN/ADN seguido de la ligadura del adaptador (transcripción inversa para el ARN). Dado que se conoce la secuencia del adaptador, la reacción de secuenciación no requiere que conozca la secuencia de los productos. Sin embargo, necesitaría conocer el genoma de referencia para encontrar nuevos miARN. Esto se debe principalmente al hecho de que es muy difícil secuenciar los pre-miRNA (baja abundancia y estructura en horquilla). Puede identificar nuevos ARN pequeños con mucha facilidad, pero no puede decir que son miARN a menos que pueda asignarlos a un precursor de bucle de tallo (pre-miARN).
Puede descubrir muy bien nuevas lecturas y la gente ha descubierto muchos miARN nuevos usando NGS. Puedo contarte la metodología que seguí para encontrar productos atípicos del mismo pre-miARN. Para simplificar, llamo a los productos heterogéneos en 5' semillas malas (porque han alterado la secuencia de semillas) ya los productos heterogéneos en 3' como isomiRs . Utilicé una metodología similar a la de un programa muy conocido: miRdeep .
Ahora, los isomiR y las lecturas que se asignan perfectamente a la región madura de miARN pueden considerarse contribuyentes a la expresión total de miARN. Sin embargo, badseeds no debe considerarse como una isoforma. También puede permitir un cierto nivel de desajuste y contar estas lecturas. Las secuencias con discrepancias en la región de semillas serían de nuevo malas semillas . Además, puede tener esquemas de puntuación para sus lecturas.
No existen muchos estudios sobre dicho análisis. No obtuve ningún resultado publicable con nuestros datos, pero la metodología es razonablemente correcta. Puede seguir adelante y aplicarlo para su estudio.
swbarnes2