Tengo antecedentes estadísticos (no biológicos), y estoy muy confundido acerca de qué son exactamente los "datos" asociados con un SNP. A continuación, explicaré las cosas lo mejor que pueda; corríjame si algún punto está mal o no está claro. Supongamos que estamos trabajando con humanos, ya que lo siguiente cambiará según la especie. (Suponga que todos los casos de interés son bialélicos).
Cuando un locus tiene un alelo en al menos un cromosoma, la medida AA, Aa o aa se denomina SNP (pronunciado "snip"). Por lo tanto, usando lenguaje estadístico, los SNP son factores de tres niveles: estos son los datos asociados con un SNP . Como se dijo anteriormente, si el factor tiene 1 nivel (es decir, es solo aa o solo AA), entonces no es un SNP.
A veces, para los humanos, parece que la gente dice que un SNP es en realidad solo un alelo (por lo tanto, un factor de dos niveles, a o A). ¿Cómo es esto posible? ¿Las personas a veces solo miden un alelo en lugar de ambos para obtener el genotipo?
SNP no es un tipo de datos específico sino un fenómeno biológico. La abreviatura "Polimorfismo de nucleótido único" solo significa que existe una variabilidad (entre individuos) en una sola letra en una posición específica en la secuencia de ADN. Depende del hablante cómo decida describir la variabilidad; ya sea que elijan centrarse en las posibles secuencias y decir, por ejemplo, "Solo hay A o T en esta posición" o se centran en los posibles genotipos humanos y explican todas las combinaciones (AA, AT, TT).
Lo que constituye como datos SNP depende completamente de la pregunta de investigación, el organismo utilizado (diploide/haploide/poliploide) y el diseño experimental.
El artículo que vincula en su comentario utiliza líneas de avena y no individuos de la población consanguínea. La avena, como la arabidopsis, es naturalmente altamente autopolinizadora, por lo que crear líneas endogámicas altamente homocigóticas es relativamente fácil. En este caso, es razonable que los investigadores esperen solo genotipos AA o aa en cada línea.
Editar: ya que solicitó más ejemplos en los que el investigador elige centrarse en los alelos en lugar de los genotipos. La distribución de muchos genotipos de SNP se ajusta a las ecuaciones de Hardy-Weinberg . Si ese es el caso, la frecuencia de genotipos se puede calcular a partir de una frecuencia alélica en la población. El investigador podría preguntar: "¿La frecuencia del alelo es diferente en la población/grupo 1 de la población/grupo 2?" Recogen datos de los individuos del grupo 1 (AA, AA, Aa, Aa, aa) y del grupo 2 (Aa, Aa, aa, aa, aa). Deciden tratar cada alelo como una medida independiente (que no depende del individuo del que proviene) y sondean los datos: grupo 1 (AAAAAAaaaa), grupo 2 (AAaaaaaaaa) y luego hacen una prueba binomial simple para responder a su pregunta.
Nota: incluso si no se cumple el equilibrio de Hardy-Weinberg, las preguntas sobre la frecuencia de los alelos siguen siendo preguntas biológicas válidas (con un uso/interpretación ligeramente diferente en el futuro).
Creo que las respuestas anteriores brindan mucha información valiosa y relevante, pero permítanme agregar prospectos adicionales:
Déjame darte un cálculo del dorso del sobre. El tamaño del genoma humano es de 3 mil millones de pares de bases (BP). Hay alrededor de 30 mil genes en el genoma humano. Por lo tanto, el tamaño de un gen sería de alrededor de 100 mil BP (el ADN tiene regiones no codificantes, regiones reguladoras, etc. También un gen varía en tamaño desde unos cientos de BP hasta más de 2 millones. En aras de la simplicidad, puede ceñirse a este cálculo). Por otro lado, hay 5 millones de SNP en el genoma humano. Por lo tanto, Habría un SNP en cada 600 BP.
Entonces, podemos decir con certeza que habría genes que tienen más de un SNP. Mi sugerencia sería, como señaló @BagiM, no confundir los conceptos microscópicos con los macroscópicos.
Como se dijo anteriormente, si el factor tiene 1 nivel (es decir, es solo aa o solo AA), entonces no es un SNP.
Si hay alguna variación en esa base en su población, entonces es un SNP, incluso si no está mirando a un heterocigoto.
De todos modos, si estás hablando de un SNP, la gente generalmente se referirá a él por su base, no por el nombre del alelo que genera. (Y en realidad, muchas veces, los alelos no se nombran simplemente como A y a. Esa notación es útil cuando se trata de problemas perfectamente mendelianos de la tarea de genética de la escuela secundaria, pero en el mundo real, la mayoría de los datos no se ajustan a ese paradigma.
Hachiloni
usuario257566
David
usuario257566
David
usuario257566