Secuencia de referencia para definir polimorfismos de un solo nucleótido

El polimorfismo de un solo nucleótido (SNP) o la variación genética en general, por definición, son relativos a una secuencia de referencia. Cuando hablamos de bases de datos de SNP como en ("dbSNP—Base de datos para polimorfismos de un solo nucleótido y otras clases de variaciones genéticas menores", o "Un mapa de la variación de la secuencia del genoma humano que contiene 1,42 millones de polimorfismos de un solo nucleótido", títulos de investigaciones bien conocidas papers), ¿cuál es el genoma de referencia? De manera similar, para definir un "mapa/perfil SNP" de una persona (en genómica médica), ¿cuál es la secuencia del genoma de referencia? ¿Hay una referencia de facto o depende del contexto? Hay una oración "Los científicos están tratando de identificar todos los diferentes SNP en el genoma humano" en http://www.cancer.- ¿Cuál es el genoma de referencia aquí?

el genoma de referencia utilizado suele ser el hg19 (UCSC) o GRCh38 (NCBI). Para estudios basados ​​en la población que involucran algo así como una población endémica, se puede usar una referencia dependiente del contexto.

Respuestas (2)

No veo tu punto. Si tomamos, por ejemplo, la definición de Wikipedia :

SNP "es una variación de secuencia de ADN que ocurre cuando un solo nucleótido... en el genoma... difiere entre miembros de una especie biológica o cromosomas emparejados",

no hay lugar para el genoma de referencia. SNP es solo una posición variable con (comúnmente) dos alternativas en individuos de la misma especie. En los proyectos de secuenciación del genoma completo se pueden descubrir algunos SNP (a saber, aquellos que están en estado heterocigoto), pero definitivamente no todos.

Uno puede investigar los SNP y/o usarlos como marcadores genéticos independientemente de la disponibilidad del genoma de referencia. Esa es la forma en que se hace para los organismos que no son modelo, por ejemplo, utilizando RAD Seq : se descubren los SNP simultáneamente con el genotipado.

¿Cómo se define la ubicación/posición del genoma donde buscamos la variabilidad/alternativa?
Si está hablando de coordenadas, entonces están definidas por la ubicación en el genoma de referencia, por la ubicación en el mapa genético o no están definidas en absoluto.

dbSNP en realidad se indexa contra varias compilaciones de genomas de referencia, incluido hg19. puede ver esto en los registros de ssID: usamos las descargas masivas y también puede verlos allí.

Cualquier diferencia con respecto a dos construcciones del genoma es realmente una variante. Puede ver esto en el caso de las variantes trialélicas y cuádruples. Hay casos en los que se agregan o eliminan longitudes de secuencias completas en comparación con una construcción de genoma de referencia. Estas se denominan variantes de inserción/eliminación, que también pueden contener variantes de nucleótidos simples o cortos.

intentaré completar esto un poco más tarde... respuesta rápida aquí.

Los SNP se descubren no solo en proyectos de secuenciación del genoma completo. Es solo un tipo de marcadores moleculares.
ciertamente esto es así.