¿Qué es la aleatorización mendeliana y cómo se utiliza para inferir causalidad en epidemiología?

Los estudios de características y enfermedades humanas se limitan inherentemente a estudios de observación, conocidos como estudios epidemiológicos. Esto puede hacer que sea muy difícil determinar qué causa realmente una enfermedad o rasgo en particular, y qué es solo un subproducto o biomarcador de la enfermedad.

La aleatorización mendeliana es una técnica estadística utilizada por los epidemiólogos genéticos para determinar los efectos causales , por ejemplo, si un biomarcador realmente influye en el riesgo de enfermedad o si es solo una asociación estadística.

Desde lo básico, ¿cómo se puede usar la genética para determinar las asociaciones causales entre los rasgos (como los marcadores sanguíneos) y el mayor riesgo de enfermedad, y en qué supuestos se basa esto?

¿No deberían ser trigonometría ~ SNP para la triangulación?

Respuestas (1)

Los estudios epidemiológicos analizan datos de cohortes de observación humana para tratar de vincular estadísticamente el riesgo de enfermedad y los biomarcadores. Por ejemplo, es un hecho bien conocido que fumar aumenta el riesgo de cáncer de pulmón, sin embargo, antes de la década de 1950 se consideraba lo contrario hasta que la evidencia observacional demostró ser irrefutable ( Levin, 1950 ).

confuso

Sin embargo, inferir la causalidad utilizando datos de observación puede ser complicado. Por ejemplo, existe una asociación estadística muy fuerte entre las ventas de helados y el riesgo de ahogamiento en el Reino Unido. En este ejemplo, es bastante claro que la asociación está confundida , es decir, hay una variable "oculta" que no hemos tenido en cuenta que vincula el 2. Es fácil inferir que las ventas de helados no aumentan el riesgo de ahogamiento, pero los 2 están correlacionados porque tanto las ventas de helados como el riesgo de ahogamiento aumentan en la misma época del año; ambos están positivamente correlacionados con los rasgos de 'buen clima'.

En el ejemplo anterior, es fácil decir que la relación se confunde. Sin embargo, en un estudio hipotético sobre la diabetes tipo 2 que encontró que un hematocrito sanguíneo más alto (% del volumen de sangre formado por glóbulos rojos) se asocia con mayores probabilidades de ser diabético, está menos claro si un hematocrito más alto aumenta la susceptibilidad/riesgo de convertirse en diabético. diabético, o si la diabetes aumenta el hematocrito. Los estudios longitudinales que siguen a las mismas personas durante muchos años ayudan a determinar cuál fue primero ; esto se basa en la suposición de que si el hematocrito elevado se asocia con un mayor riesgo de diabetes 5 años después, es más probable que el hematocrito sea causal, y tiene un biomarcador para el riesgo de diabetes (aunque todavía no puede decir que sea causal, puede ser solo un indicador de otro rasgo 'oculto', o el efecto puede estar mediado por otro marcador no medido).

Causalidad

Los estudios de asociación de todo el genoma (GWA) se han vuelto cada vez más populares desde la finalización del proyecto del genoma humano, y actualmente (15 de agosto de 2012) hay 7039 variantes genéticas (SNP, polimorfismos de un solo nucleótido) documentadas en el catálogo de estudios GWA publicados ( www.genome.gov/gwastudies ). Estos SNP se han asociado sólidamente con rasgos como el "riesgo de diabetes tipo 2" o los "niveles de adiponectina en sangre" en grandes estudios epidemiológicos genéticos, generalmente con muchos miles de participantes muestreados.

El punto clave sobre las asociaciones de SNP es que la dirección del efecto siempre se conoce; un SNP particular puede afectar sus niveles de adiponectina, pero la adiponectina no afecta los SNP que hereda.

Aleatorización mendeliana

En un estudio observacional que encuentra una asociación entre (por ejemplo) los niveles de triglicéridos circulantes y la diabetes tipo 2 (utilizando la glucosa en ayunas y la insulina como 'proxies') no es posible determinar la dirección causal; ¿Los triglicéridos aumentan el riesgo de diabetes o viceversa? (Este es un estudio de caso real de De Silva, et al . 2011 ).

Suponiendo que la herencia de los SNP es esencialmente aleatoria (es decir, no se ve afectada por el rasgo que está midiendo, en este ejemplo, los triglicéridos), es posible determinar el efecto causal de los triglicéridos en el riesgo de diabetes. Nota: esto solo es posible para rasgos (como los niveles de triglicéridos séricos) que tienen SNP identificados por estudios GWA.

En primer lugar, ya ha calculado la asociación entre los niveles de triglicéridos (en este estudio se asoció un aumento de 1 desviación estándar (DE) en los triglicéridos, con un Odds Ratio (OR) de 2,68, con diabetes tipo 2 en casi 10.000 humanos Participantes). Por ser un estudio transversal, solo se reporta una asociación, sin implicaciones causales... ¡aún!

Ingrese los SNP

Habiendo identificado los SNP que aumentan los niveles de triglicéridos (en el momento del estudio, se informaron 10 en la literatura), se debe medir o inferir el genotipo de cada participante para estos SNP (generalmente esto se realiza en estudios de cohortes grandes, que luego se utilizan para muchos proyectos individuales diferentes).

Luego se deriva una 'puntuación' combinada para cada individuo. Esto es conceptualmente muy simple; si un individuo tiene 4 de los 10 alelos que elevan los triglicéridos, se le asigna una puntuación de 4, y así sucesivamente. Esto se complica por el hecho de que los SNP tienen diferentes efectos sobre los triglicéridos, por lo que en su lugar se deriva una "puntuación de alelo ponderada" (en pocas palabras, el coeficiente de la asociación SNP~triglicérido se tiene en cuenta al agregar las puntuaciones de alelo de riesgo). Mediante el uso de este tipo de puntuación, se puede realizar una estimación de los efectos "por alelo";

A continuación, se determina la asociación entre los niveles de triglicéridos y la puntuación de alelos (mediante análisis de regresión lineal, ajustado por edad y sexo, ya que se sabe que afectan a los triglicéridos). En realidad, hay 2 formas de realizar el siguiente análisis, la primera de las cuales es conceptualmente más simple, pero la segunda es más robusta.

Método 1: el enfoque de 'triangulación'

Las dos asociaciones observadas calculadas hasta ahora (los niveles de activación por SD están asociados con la diabetes y la puntuación de SNP por alelo está asociada con los niveles de activación por SD) se pueden usar para calcular una asociación esperada . Esto se obtiene simplemente multiplicando los 2 coeficientes juntos. A continuación se muestra la representación de 'triangulación' de esto;

Enfoque de triangulación para la aleatorización mendeliana

Esta asociación esperada entre los SNP que aumentan los triglicéridos y el riesgo de diabetes solo es cierta si los triglicéridos elevados aumentan el riesgo de diabetes. A continuación, se puede calcular la asociación observada entre la puntuación SNP y la diabetes. Si las estimaciones esperadas y observadas son similares, entonces los triglicéridos aumentan el riesgo de diabetes y son un biomarcador causal. Si la asociación observada es nula (o, al menos, mucho menor), es probable que los triglicéridos sean secundarios.

Método 2: el análisis de variables instrumentales

Este método es para los estadísticos más resistentes. Las variables instrumentales son variables derivadas y representan un intermedio entre una 'causa' propuesta y el 'efecto' o resultado (en este caso, se propone que los alelos que elevan los triglicéridos 'causan' la diabetes, y esto está mediado por los propios niveles de triglicéridos) .

Usando una regresión lineal, se extraen los "valores ajustados" de un modelo con niveles de triglicéridos como resultado y la puntuación SNP ponderada como la única variable independiente. Estos valores ajustados representan la variación en los triglicéridos que predice la puntuación SNP. Estamos utilizando los SNP como instrumento aquí, ya que influyen directamente en el biomarcador (exposición, es decir, triglicéridos) y no se ven afectados ni por la exposición ni por el resultado (diabetes). La suposición importante aquí es que el efecto de los SNP en el resultado no se confunde y solo puede estar mediado por la exposición; esto es cierto para los genotipos ( Lallor, et al . 2008 ) .

Al determinar la asociación entre la variable derivada y la diabetes, sabrá si la proporción de la variación de triglicéridos predicha por los SNP está asociada con la diabetes; de ser así, los triglicéridos aumentan el riesgo de diabetes.

Resultados

El estudio realizó ambos tipos de análisis de aleatorización mendeliana y no encontró evidencia que sugiriera una asociación causal entre los triglicéridos y los fenotipos de diabetes.

Por lo tanto, la aleatorización mendeliana es una herramienta útil para inferir causalidad con biomarcadores. No es necesariamente una evidencia concluyente, pero puede ayudar a distinguir los biomarcadores de particular importancia e interés (con respecto a las intervenciones) de aquellos que son solo marcadores de la enfermedad.

¿Buen tiempo? ¿En el Reino Unido? Ridículo.