¿Cuál es la diferencia entre correlación y causalidad?

¿Cuál es la diferencia entre correlación y causalidad?

Piratas y ejemplo de temperatura global

Por ejemplo, ¿cómo sabemos cuándo estamos tratando solo con la correlación y no también con la causalidad aquí?Temperatura media mundial frente al número de piratas

Lo que ciertos filósofos parecen sostener al respecto

parecería que

  • diría Hume
    correlation ≡ causation.
  • Aristóteles diría eso en general
    correlation ≢ causation
    y
    causation ⇔ correlation
    solo si no estamos tratando con eventos fortuitos.

("≡" significa "es idéntico a" y "⇔" significa "implica el uno al otro").

¿Qué estás buscando específicamente en una respuesta aquí? Hay una posible pregunta filosófica y una posible pregunta de definición genérica fuera del tema. ¿Puede aclarar lo que espera y por qué es una pregunta específicamente filosófica?
Solo por diversión, algunas otras correlaciones son que las ventas de helados se correlacionan con las muertes por ahogamiento, el número de cigüeñas migratorias se correlaciona con la tasa de natalidad, la obesidad se correlaciona con la deuda y el índice S&P 500 se correlaciona estrechamente durante muchos años con el precio de la mantequilla en Bangladesh.
¿Puede publicar definiciones de correlación y causalidad?
XKCD obligatorio
Ese es un gran malentendido de Hume y su problema de inducción. Su punto era que no puede darnos un conocimiento cierto, no que todo lo que tenemos son correlaciones. Y para resaltar esa causa hay que razonarla, no simplemente encontrarla.

Respuestas (5)

¿Cuál es la diferencia entre correlación y causalidad?

  • La correlación es una relación descriptiva, todo lo que dice es: aquí hay un montón de medidas de dos (o más variables) y hay una relación numérica específica: que el coeficiente de correlación está por encima de cierto umbral. Hablando formalmente, la correlación no indica nada más que eso.
  • La causalidad, por otro lado, es una relación explicativa: proporciona una relación lógica entre las variables, que uno debería poder generalizar a casos más allá del conjunto de medidas del que extrajimos la hipótesis inicial. En el caso del gráfico Piratas/Temperatura, habría que proporcionar una explicación/mecanismo detallado de qué es exactamente lo que tienen los piratas para mantener bajas las temperaturas globales. ¿Era su ropa? ¿Fueron sus acentos graciosos? ¿Fueron sus odiosos loros? Entonces se debería poder generalizar este mecanismo a otros casos. Supongamos que en un análisis más profundo, decido que fueron sus acentos los que mantuvieron bajas las temperaturas globales. Entonces podría generalizar esto haciendo que las personas normales que no son piratas hablen con acento pirata., y medir el efecto que tiene sobre el calentamiento global.

La causalidad es difícil de definir de manera concisa, pero aquí hay una definición reciente de Nancy Cartwright ( ver también esta publicación ):

C causa E si y solo si C aumenta la probabilidad de E en toda situación que sea causalmente homogénea con respecto a E. (Causal Laws and Effective Strategies, 423)

La palabra clave aquí es "en cada situación" . La correlación no involucra todas las situaciones, solo los datos que tenemos ahora. La causalidad, por otro lado, involucra todas las situaciones, incluidas muchas que no están incluidas en nuestros datos actuales. Observe la definición probabilística, para permitir que afirmaciones como "Fumar causa cáncer" sean verdaderas aunque hayamos conocido a uno o dos fumadores empedernidos que no tienen cáncer.

Por ejemplo, ¿cómo sabemos cuándo estamos tratando solo con la correlación y no también con la causalidad aquí?

Esta es todavía una pregunta abierta. Resolverlo tendría serias implicaciones para la filosofía de la ciencia (con respecto al problema de la demarcación y al problema de la inducción).

Hasta cierto punto, el falsacionismo de Karl Popper fue un intento de resolver este problema. Antes de eso, el verificacionismo de los positivistas lógicos era problemático precisamente porque la correlación no implica causalidad, y uno podía verificar todo tipo de teorías pseudocientíficas, siempre que desenterraran suficientes puntos de datos adecuadamente correlacionados. Sin embargo, la falsificación no resuelve el problema por completo.

Ahora, dado que dos conjuntos de datos A y B están correlacionados, veamos las posibilidades de por qué están correlacionados:

  1. Su correlación es pura coincidencia.
  2. A causa B.
  3. B causa A.
  4. A y B son causados ​​por una tercera variable C.

La falsificación nos permite descartar casos como (1): en su ejemplo pirata, si uno tuviera una forma de aumentar repentinamente el número de piratas, o lograra que todos comenzaran a hablar como piratas durante algunos años, notarían que después de 10 o 20 años, las temperaturas medias globales aún no bajaban, por lo que podemos descartar con seguridad la hipótesis de que los piratas tienen alguna relación causal con las temperaturas globales.

Pero eso nos deja con (2), (3) y (4). Para estos, hay algunas heurísticas para discernir entre las posibilidades, pero no hay un método seguro.

  • El tiempo es un factor: en cualquier caso físico del mundo real, la causa siempre precede a los efectos, por lo que si sus datos tienen una marca de tiempo con suficiente precisión, podría usarlos como indicador. Esto permitiría decidir entre (2) y (3), pero aún nos deja indecisos entre cuál de los que seleccionamos y (4).
  • Generalización: si su teoría explicativa explica solo las dos variables que tiene y nada más, es posible que desee profundizar más. Una buena teoría debería ser capaz de explicar otras preguntas relacionadas, no solo las que plantean los datos disponibles. Por ejemplo, aunque una relación causal entre los piratas y el clima podría explicar los datos que tiene en su gráfico, nunca explicará nada más. Explicar el cambio climático utilizando el concepto de gases de efecto invernadero también explica otros fenómenos, por ejemplo, por qué funcionan los invernaderos y por qué Venus es mucho más cálido que la Tierra.
  • ¿Tu explicación encaja con otras teorías ya existentes? ¿Existe un patrón más general que sigan estas teorías? Si los piratas están relacionados con el cambio climático, ¿podemos también vincular la disminución de los gladiadores con la contaminación del agua?
Interesante. Lo que dice en respuesta a mi primera pregunta está relacionado con mi otra pregunta aquí: " ¿Cuál es la diferencia (si la hay) entre demostración [es decir, probar algo a través de causas] y descripción? ".
@Geremia ahora que mencionas, recuerdo una pregunta reciente que publiqué. Ver mis ediciones. -- Salud

Correlación y causalidad no son lo mismo:

La correlación es un hecho que surge simplemente de la observación, como en su buen ejemplo.

Por el contrario, la causalidad responde además a la pregunta: ¿Por qué ?

Responder a la pregunta de por qué significa dar una explicación de la observación. Una explicación debe ser más general que una observación específica. Debe cubrir varios casos, también casos aún no observados (poder predictivo). Las mejores explicaciones son las teorías científicas. Permiten derivar muchos fenómenos a partir de unos pocos supuestos generales.

Desgraciadamente no conozco una definición sencilla y llamativa de causalidad.

Aparte, en su figura 35.000 debe ser reemplazado por un valor diferente. ¿Usas una escala logarítmica?

Tome este ejemplo: personas que usan impermeables, personas que llevan paraguas y lluvia. Estos tres tenderán a ocurrir juntos, oa no ocurrir juntos. Esto es correlación.

Hay tres casos principales de causalidad: La relación entre la lluvia y los paraguas es causal. Cuando llueve, la gente saca sus paraguas. No existe una relación causal en la otra dirección: llevar un paraguas no provoca que llueva. Si guarda su paraguas durante la lluvia, eso no hará que la lluvia se detenga. Y la relación entre chubasqueros y paraguas vuelve a ser diferente: ambos tienen una causa común.

Tenga en cuenta que la correlación funciona en ambas direcciones: la lluvia se correlaciona con los paraguas y los paraguas se correlacionan igualmente con la lluvia. La causalidad suele ser una relación unidireccional.

La diferencia entre correlación y causalidad se capta mejor con la afirmación: "La correlación no implica causalidad". La causalidad implica correlación, sin embargo, no ocurre lo contrario: la correlación no implica causalidad. Es decir, no hay forma de deducir (o derivar) legítimamente una relación de causa y efecto entre A y B únicamente sobre la base de una asociación o correlación observada entre ellos.

La afirmación de que "correlación implica causalidad" es un caso de la falacia lógica llamada "causa cuestionable".

Cuando A y B están correlacionados, existen las siguientes opciones:

  1. No hay conexión entre A y B (hipótesis nula: H0), es decir, correlación coincidente.
  2. A causa B
  3. B causa A
  4. A y B son causados ​​por una tercera variable C
  5. (A causa B) Y (B causa A): "bidireccional" (A y B se causan simultáneamente) o "cíclico" (no simultáneo, [A causa B] ENTONCES [B causa A], etc.)

La idea de que la correlación implica causalidad es un caso de la falacia de "causa cuestionable", en la que se considera que dos eventos que ocurren juntos han establecido una relación de causa y efecto.

Falacia de Causa Cuestionable: "cum hoc ergo propter hoc" = "con esto por lo tanto debido a esto". Nótese que esto difiere del "post hoc ergo propter hoc" (después de esto, por lo tanto debido a esto), en el que un evento que sigue a otro se ve como una consecuencia necesaria del evento anterior. Un ejemplo de la falacia "post hoc" es: "Todas las mañanas mi gallo canta, luego sale el sol. Por lo tanto, el canto de mi gallo hace que salga el sol".

La correlación (P) no puede implicar causalidad (Q) porque la "implicación" es necesariamente algo deductivo. En el sentido lógico del término "implica" significa "es una condición suficiente para". Por lo tanto, la implicación (material) en el condicional "si P, entonces Q" establece una condición suficiente entre P y Q, tal que 'P es suficiente para Q', lo que equivale a decir 'Q es una condición necesaria para P. ' El significado técnico del condicional material "P implica Q" denotado como P -> Q significa "Si la circunstancia P es el caso, entonces sigue Q". En este sentido de la palabra "implica", siempre es correcto decir "correlación no implica causalidad". La correlación es una condición necesaria para la causalidad, ¡no una condición suficiente!

Además, una mera correlación entre A y B ni siquiera establece la dirección de la causalidad: del mero hecho de que A y B estén correlacionados no se puede deducir que A sea la causa o el efecto y lo mismo para B.

¿Cuál es la diferencia entre correlación y causalidad?

La diferencia es tener un modelo (también conocido como teoría).

Podemos decir que A causa B si podemos explicar por qué es así a través de la lógica y la razón.

Y aunque la causalidad a menudo crea una correlación, no es implícita. "Demasiado de algo bueno" es un ejemplo de tal paradoja, que todos conocen muy bien.

Por ejemplo, ¿cómo sabemos cuándo estamos tratando solo con la correlación y no también con la causalidad aquí?

nosotros no Pero, dado que no podemos identificar la causalidad, ciertamente no debemos asumir una.