Siempre me ha dejado perplejo una aparente paradoja en la probabilidad que estoy seguro tiene alguna explicación simple y bien conocida. Decimos que una "moneda justa" o lo que sea "no tiene memoria".
En cada lanzamiento, las probabilidades se reinician una vez más a las 50:50. De ahí la "falacia del jugador". Después de 10 caras, todavía se dice que las probabilidades de otra cara son 50:50. Lo mismo después de 20, 40, 80... caras .
Sin embargo, también sabemos que la serie convergerá en un equilibrio de cara: cruz. Y, de hecho, esto es contable en un orden bastante corto. La convergencia aparece bastante rápido.
¿Cómo pueden ambos ser verdad? ¿No hay algo en la serie física de lanzamientos que "recuerde"? ¿No hay necesariamente una probabilidad ligeramente mayor de cruz después de 10 caras ?
¿Cómo resuelve la lógica esta absoluta aleatoriedad en los eventos particulares con una ley general de convergencia? Me imagino que debe ser un problema bien conocido. Supongo que plantea la cuestión más amplia de qué tipo de probabilidad de "causalidad" es.
Tenga en cuenta que no conozco la lógica simbólica, por lo que, vergonzosamente, las demostraciones formales están más allá de mi comprensión.
Dado que ha pedido una respuesta no formal, trataré de hacerlo sin usar números ni ecuaciones.
Fundamentalmente, su pregunta es, ¿cómo es que los eventos individuales pueden ser completamente impredecibles, pero cuando se juntan muchos de ellos, ya sea en una secuencia o en una masa, el comportamiento de toda la pila se vuelve, si no totalmente predecible, al menos sustancialmente predecible? La respuesta es algo que se llama la ley de los grandes números, y es uno de los conceptos más fundamentales en estadística.
Como ilustración, imagina algo llamado caja de Galton: es una caja de forma triangular que se encuentra verticalmente, con su base en el suelo y un vértice en la parte superior. Hay un agujero en la parte superior para permitir que se deje caer una pelota. Se colocan una serie de alfileres o clavijas para que una pelota caiga hacia la derecha o hacia la izquierda de manera impredecible hasta que llegue al fondo. Como se ilustra en este diagrama, cuando se dejan caer muchas bolas, el resultado es un montón en el medio. No podemos predecir dónde caerá una sola bola, pero coloque suficientes bolas y podemos estar cada vez más seguros de que obtendremos una curva en forma de campana, simplemente porque es muy poco probable que una bola se mueva constantemente hacia la izquierda o hacia la derecha. . Una forma de pensar en ello es contar los caminos posibles a un punto en la parte inferior.Esto significa que no necesitamos suponer que una pelota está recordando las caídas anteriores. Cada bola es independiente y la curva resultante (una distribución binomial) surge espontáneamente de ella. Este es uno de los muchos ejemplos de cómo puede surgir un comportamiento aparentemente ordenado incluso cuando hay muchas cosas desordenadas en el nivel micro. Otra es la desintegración radiactiva: no podemos predecir cuándo se desintegrará un átomo, pero con una gran masa de ellos podemos predecir con mucha precisión qué proporción de ellos se desintegrará en un intervalo de tiempo determinado. Otro ejemplo surge de la teoría cinética del calor: no podemos predecir cómo se mueven las moléculas individuales, pero juntando suficientes podemos decir todo tipo de cosas útiles sobre sus propiedades termodinámicas.
Así que la falacia del jugador es una verdadera falacia, aunque siempre tentadora. Mi forma favorita de probar las intuiciones de las personas al respecto es preguntarles esto: supongamos que decido jugar a la lotería todas las semanas y mi estrategia preferida para elegir los números es buscar los números que ganaron la semana pasada y elegirlos. Encontrará muchas personas que piensan que esto es una locura porque las posibilidades de que el mismo conjunto de números gane dos semanas seguidas son mínimas. Pero, por supuesto, la probabilidad de que cualquier conjunto de números gane es igual: no se ve afectada por la ganancia de la semana anterior.
Si la probabilidad de cara = p , entonces la probabilidad de cruz = 1- p . Si es una moneda justa, entonces p = 1- p y la probabilidad de cara o cruz es p = 1/2.
Ahora supongamos que el número de lanzamientos de monedas es N , y digamos que N se está volviendo bastante grande. El valor esperado de la variable aleatoria que es el número de caras que salen de los N lanzamientos estará alrededor de la media Np , que para una moneda honesta es N /2.
La varianza de la variable aleatoria (el número total de caras de N lanzamientos) es Np (1- p ) (que, para la moneda honesta, es N /4), que es el cuadrado de la desviación estándar . Esto significa que si N aumenta por un factor de 4, entonces la desviación estándar solo aumenta por un factor de 2.
Entonces, a medida que aumenta el número de lanzamientos, la desviación del número de caras (que es sqrt( N )/2)) de la media esperada (que es N /2) aumenta , pero no tan rápido como aumenta el número de lanzamientos. . Cuando divides por N , el porcentaje de esa desviación esperada, dentro del número total de lanzamientos, se hace más pequeño y se acerca al 50 % esperado. Esto se debe a que es (sqrt( N )/2)/ N = 1/(2 sqrt( N )) .
Desde un punto de vista porcentual , parece que te estás acercando cada vez más a lo que se espera de una moneda honesta.
Desde un POV de conteo , no se ve exactamente igual. Si lanzas una moneda honesta 1,000,000 veces, la cantidad de caras probablemente estará a cierta distancia de 500,000. Pero el porcentaje del número de caras sobre el número total de lanzamientos será muy cercano al 50%. Y se acercará al 50 % con más y más lanzamientos, pero la distancia absoluta lejos de la marca del 50 % crecerá a una tasa proporcional a sqrt( N ). Pero el número de lanzamientos crece a razón de N .
p = 1/2
, no a p = 1-p
. p = 1-p
es cierto siempre que la moneda nunca caiga de canto, independientemente de si la moneda es justa.La convergencia aparece bastante rápido.
Esta es su suposición errónea. Aparece bastante rápido. En la mayoría de los casos. Pero no siempre.
En cierto sentido, hay dos capas de probabilidad: en la capa uno, cada evento individual tiene la misma probabilidad que sus predecesores. En la capa dos, la secuencia de eventos como un todo tiene una probabilidad de ocurrir. Y cada secuencia individual de una longitud dada tiene la misma probabilidad de ocurrir, es decir. HTTHTHT tiene la misma probabilidad que HHHHHHHH (H=cara, T=cruz), que es 0,5^8. Es solo porque en todas las secuencias posibles de una longitud dada el número de caras y cruces es del 50% cada una, por lo general, una secuencia de tiros independientes converge hacia estas frecuencias. Y, por supuesto, hay muchas, muchas más series de la longitud de ocho lanzamientos que contienen al menos una cruz, lo que nos hacecreo que habrá colas muy pronto.
El problema es que nunca sabes en qué secuencia estás, por así decirlo. Es por eso que, mirando hacia el futuro, solo la probabilidad del próximo evento único es lo que debería contar para el jugador. La improbabilidad de las 11 caras después de 10 caras es puramente subjetiva porque hay muchas más secuencias con al menos una cruz, pero sigue siendo del 50 %. Después de todo, tener 10 caras seguidas es el evento improbable, no es que el próximo tiro vuelva a ser cara. Pero, bueno, todavía ha sucedido, por lo que no importa en cuanto al próximo lanzamiento.
Tienes que ver qué es exactamente el evento (y el objeto de probabilidad). En el ejemplo de la moneda, la serie hasta el momento es un evento que ha ocurrido. Así que antes había una probabilidad de que ocurriera esta serie, pero ahora, como ha sucedido, solo queda una frecuencia de ocurrencia que ya conocemos . La única probabilidad en el sentido estricto de la palabra, que se trata de predecir estados de cosas futuros o al menos desconocidos , es la del próximo evento o de la próxima serie. Tan pronto como se realiza el próximo lanzamiento y hemos visto el resultado, solo existe la probabilidad del ahora próximo evento y la ahora siguiente serie posible.
La falacia consiste en suponer que debido a que cada vez hay más secuencias posibles con al menos una cruz, cuanto más larga sea la secuencia general, la probabilidad de que después de él experimente una gran cantidad de caras aumentaría . Pero no importa cuán improbable sea la secuencia que ya encontró , es un error de categoría aplicar probabilidad a eventos pasados y conocidos, es decir. "su" secuencia +1 lanzamiento en comparación con todas las demás secuencias posibles de esta longitud . Para cada lanzamiento, la probabilidad sigue siendo del 50%, sin importar lo que haya sucedido antes.
¡La probabilidad propiamente dicha solo tiene sentido para / se aplica a hechos futuros o desconocidos!
Como nota al margen, el siguiente "contraejemplo": Considere tres puertas, elija una que tenga la "probabilidad" de contener el premio de 1/3. Ahora se abre una puerta y tiene la opción de cambiar la puerta elegida. ¿Cuáles son las posibilidades? Bueno, definitivamente deberías cambiar, porque tu puerta ahora tiene la "probabilidad" de 1/3 como antes, pero la otra tiene 2/3. Aquí hay que considerar toda la serie, no hay contradicción. Eso es porque ya no hay probabilidad : el premio ya está detrás de una puerta, el evento ha sucedido . Esa es la diferencia.
TL; DR: Editar y Conclusión
Entonces la falacia, como expresa @wedstrom en su comentario, es pensar que la naturaleza se corregirá sola, dejará que la serie en curso converja rápidamente. Pero la naturaleza no es un actor que hace cualquier cosa. Y en el presente, solo hay pasado (eventos ocurridos/conocidos, frecuencia) y futuro (eventos próximos/desconocidos, probabilidad). Por lo tanto, si la probabilidad es independiente, esto debe tomarse literalmente como independiente de cualquier cosa que haya sucedido en el pasado, por escasa que parezca la ocurrencia de la serie total resultante.
Sin embargo, también sabemos que la serie convergerá en un equilibrio de cara: cruz.
Creo que este es tu problema central. De hecho, este es el resultado más probable de una serie de lanzamientos de monedas, pero la probabilidad no se aplica a las cosas que ya se sabe que sucedieron.
Imagina este juego:
Se lanza una moneda 100 veces. Los jugadores pueden apostar sobre el número total de caras que se lanzarán. Pueden hacerlo en cualquier momento antes o durante el juego.
Imagina que estás apostando antes de que comience el juego. Tu mejor apuesta es obviamente 50 caras (50% de 100 lanzamientos futuros).
Ahora imagine que está apostando después de que la moneda ya se lanzó 10 veces y salió cara las 10 veces.
¿Cuál es la mejor apuesta ahora? De acuerdo con la falacia del jugador, las monedas deberían igualarse y, por lo tanto, la mejor apuesta aún debería ser 50. Pero en realidad, el resultado más probable para los lanzamientos futuros sigue siendo un 50 % de cara, y ya tenemos 10 caras, por lo que la mejor apuesta es 55 (10 caras conocidas + 50% de 90 lanzamientos futuros).
Si usa una moneda justa, el promedio de caras arrojadas convergerá al 50%. Sin embargo, el número de caras no convergerá a la mitad de las monedas lanzadas.
Si bien el porcentaje se acerca cada vez más al 50 %, normalmente el número de monedas diverge cada vez más de exactamente la mitad. ¿Cómo puede ser esto? Tira diez monedas. Probablemente obtendrás de 3 a 7 caras. 30% a 70%. Lanza 1000 monedas. Probablemente obtendrás entre 450 y 550 cabezas. 45% a 55%. A pesar de que está más cerca del 50%, en realidad está más lejos (50 en lugar de 2) de que exactamente la mitad de los lanzamientos de monedas sean caras. No se necesita memoria. Su porcentaje se acerca al 50%, aunque en realidad se desvía más.
Ahora lanza 1000 monedas y luego lanza otras 1000 monedas. Diga cada vez que tenga entre 45% y 55% de cabezas. Pero como no hay memoria, hay un cincuenta por ciento de posibilidades de que en los primeros 1000 lanzamientos tenga menos del 50%, y en los siguientes 1000 lanzamientos tenga más del 50%, o al revés. En ese caso, te acercas mucho más al 50%. Por ejemplo, 45% + 55% significa exactamente 50%.
Esto es realmente matemáticas, no filosofía.
Suponga que ha lanzado la moneda m veces y ha obtenido n caras. La fracción de caras hasta ahora es n / m .
Ahora lanzas la moneda una vez más.
Hay un 50 % de probabilidad de que salga cruz y la fracción se convierta en n / ( m + 1), y un 50 % de probabilidad de que salga cara y la fracción se convierta en ( n + 1) / ( m + 1).
Por linealidad de la expectativa , la fracción esperada después del lanzamiento adicional es entonces ( n + 0.5) / ( m + 1).
Ahora puede verificar que si n / m = 0.5, entonces ( n + 0.5) / ( m + 1) = 0.5 también — si hemos tenido una ejecución pareja hasta ahora, entonces el valor esperado después de un lanzamiento más permanece igual .
Si 0.5 < n / m , entonces 0.5 < ( n + 0.5) / ( m + 1) < n / m .
Si n / m < 0,5, entonces n / m < ( n + 0,5) / ( m + 1) < 0,5.
En otras palabras, si hemos tenido una carrera desigual hasta ahora, el valor esperado después de un lanzamiento más está ligeramente más cerca de lo que estaba antes por la única razón de que el denominador de la fracción aumenta a un ritmo más rápido que el numerador. lo hace. Puede comenzar obteniendo 100 caras de 100 lanzamientos, pero 100 lanzamientos independientes más tarde debe esperar estar en 150/200, que está más cerca del 50%. Y 800 lanzamientos después de eso, debe esperar estar en 550/1000. El exceso es 50 en los tres casos, pero el porcentaje de exceso se hizo más pequeño.
Debido a que "convergen en un equilibrio" no significa un número exactamente igual de caras y cruces, significa que la proporción de caras y cruces se aproxima a la igualdad (con probabilidad 1: cuyo significado oculta todo el formalismo matemático para tratar con la posibilidad de otros resultados). De hecho, la probabilidad de un número exactamente igual de caras y cruces después de un número par de lanzamientos tiende a cero con más lanzamientos.
Ignora por un momento que hay una racha inicial de cabezas. Simplemente comience con la puntuación "cara: 10, cruz 0" y una moneda justa. Entonces, el puntaje aún "converge en un equilibrio", porque cuantos más lanzamientos de monedas hagas, menor será la diferencia proporcional hecha por la ventaja injusta de 10. Estás más feliz de darle a alguien una ventaja de 10 m en un maratón que en un 100 m sprint, y en efecto, Tails está feliz de dar cabezas cualquier cantidad de ventaja inicial en una "carrera infinita". A medida que te acercas al infinito, todas las constantes fijas son pequeñas, la probabilidad de que cruz haya alcanzado la cara al menos una vez en el camino se acerca a 1, la probabilidad de que cruce se acerque a 0,5, y eso es todo lo que queremos decir con equilibrio.
Lo mismo ocurre con cualquier secuencia inicial de lanzamientos de monedas. Ya sea que sea parejo o no, queda enterrado por la secuencia ilimitada de lanzamientos de monedas que viene después. Considere, si tiene las matemáticas para hacerlo, que el límite cuando x se acerca al infinito de (x+1)/x es 1. El numerador tiene una "ventaja inicial" sobre el denominador, pero no hace ninguna diferencia en el límite.
Estás comparando dos casos diferentes. Uno es "la probabilidad de caer cara en el próximo lanzamiento" y el otro es "la suma del número de caras". Este último se rige por el Teorema del Límite Central, que explica por qué la suma converge tan rápidamente (en muchos casos). La suma actúa de manera muy diferente a simplemente preguntar "cuál es el siguiente resultado", y es la suma la que causa la convergencia.
Desde la perspectiva de liberarnos de esta "paradoja", la clave es que para cada caso en el que tenemos N lanzamientos que caen cara, también tenemos un caso correspondiente en el que tenemos N lanzamientos que caen cruz. Desde la perspectiva de la "suma del número de cabezas", esto es importante. En el caso en el que discutimos "la moneda ha caído cara 10 veces seguidas", no es así, porque el hecho de que hayamos dicho que ha caído cara 10 veces nos impide considerar el caso en el que cayó 10 veces cruz. arriba. El caso de 10 cruces no tiene ningún efecto en nuestra discusión sobre el siguiente lanzamiento de moneda porque simplemente no sucedió. No estamos interesados en eso.
Es un poco más fácil visualizar la no paradoja si, en lugar de contar el número de caras y cruces, asignamos valores numéricos de caras y cruces (como +1 y -1) y tomamos el promedio . A la mayoría de los humanos les resulta fácil intuir que el promedio de una muestra se acercará al promedio de la variable aleatoria a medida que N crece.
Esta visualización se puede hacer de muchas maneras. Una forma es mirar todas las diferentes secuencias de caras y cruces que pueden ocurrir. Claramente, cada secuencia ocurre con la misma probabilidad (con una moneda justa). Sin embargo, cuando los coloca en "contenedores" según la cantidad de cabezas que ve, descubre que hay muchas más secuencias con un número "promedio" de cabezas que aquellas que tienen un número extraordinario de cabezas. Esto hace que veamos números promedio con más frecuencia que números extraordinarios.
Para dar un ejemplo concreto, las cadenas de longitud 3: 0 cabezas = 1 cadena ({T, T, T}), 1 cabezas = 3 cadenas ({H, T, T}, {T, H, T}, { T, T, H}), 2 cabezas = 3 cuerdas ({H, H, T}, {H, T, H}, {T, H, H}), 3 cabezas = 1 cuerda ({H, H, H}). 8 cadenas en total, cada una con una probabilidad de ocurrencia de 1/8. Así, por suma, probabilidad de 0 caras = 1/8, 1 cara = 3/8, 2 caras = 3/8, 3 caras = 1/8
Tiene razón: después de una serie de 10, 20, 40, 80 caras , la probabilidad de otra cara sigue siendo 1/2. No es un poco menos o un poco más grande, es constantemente 1/2. Los lanzamientos no tienen memoria.
Para reconciliar este resultado con la expectativa ingenua se debe tener en cuenta: La probabilidad de una serie de longitud 10 con 10 caras es (1/2) ** 10, que es aproximadamente 1/1000. es decir, la probabilidad de obtener esa serie cuando siempre se hacen 10 lanzamientos es 1/1000.
Y la probabilidad de 80 caras es en consecuencia (1/2) ** 80, que es aproximadamente 10 ** (-24), un decimal con el número 1 en la posición 24 después del punto decimal.
Por lo tanto, la contribución de tales series excepcionales al límite de todas las series de igual longitud es excepcionalmente pequeña.
Para construir sobre lo que señaló celtschk (y posiblemente otros, no los he leído todos) con más ejemplos, 'tiende hacia 50/50' no es algo que en los próximos n lanzamientos negará cualquier compensación que esté actualmente en su lugar, es más bien, cuando n se vuelve lo suficientemente grande, cualquier compensación actual se vuelve insignificante.
Es decir
Supongamos que de alguna manera logras lanzar 100 monedas y obtener 100 caras, pero de ahora en adelante, por el bien de los argumentos, digamos que los lanzamientos de monedas se dividen exactamente 50/50.
Esto significa que en 200 lanzamientos, tendríamos 150 caras y 50 cruces, todavía inclinados a cara.
En 500 lanzamientos, 300 caras y 200 cruces, todavía inclinado a cara, pero menos.
Con 10000 lanzamientos, 5050 caras, 4950 cruces, esto es casi 50/50.
Con 1000000 lanzamientos, 500050 caras, 499950 cruces, con tantos lanzamientos, esto ha convergido efectivamente en 50/50.
Esta es la convergencia que ve, el error que está allí inicialmente se vuelve insignificante a medida que agrega más lanzamientos. No hay 'posibilidades ligeramente más altas' de cruces.
Debe tener cuidado al especificar la pregunta que está haciendo. En el futuro, la moneda no tiene memoria y la posibilidad de cara en cualquier lanzamiento es 1/2. Período. Final. La convergencia a la media se debe a que cualquier exceso que tenga ahora se eliminará en cantidades mucho mayores .números. Digamos que los primeros diez lanzamientos salen cara. En este punto, si pregunto el número más probable de caras después de 100 lanzamientos, la respuesta es 55. Esto es un poco alto. Si pregunto el número más probable de caras después de un millón de lanzamientos es 500005, mientras que antes de los primeros 10 lanzamientos es 500000. Como la desviación estándar del número de caras en un millón de lanzamientos es 500, un exceso de 5 no es grande. acuerdo. Esto es lo que dice la ley de los grandes números. No importa qué exceso tengas ahora, si haces suficientes lanzamientos más, será muy pequeño en comparación con la desviación estándar del resto de los lanzamientos. Nada hace que se acerque más a la media, pero el exceso desaparece cuando consideras el promedio.
Supongamos que ha lanzado diez caras y está a punto de hacer un millón de lanzamientos más. ¿Cuál es la expectativa de la diferencia entre cara y cruz? Bueno, son diez, porque ya tienes diez lanzamientos, y la expectativa para los lanzamientos futuros es tanto cara como cruz.
Supongamos por el momento que en el próximo millón de lanzamientos obtienes exactamente medio millón de caras y medio millón de cruces. Esto significa que la diferencia resulta ser exactamente la expectativa, ya que con las primeras diez caras, tienes diez caras más que cruces.
Sin embargo, si observa el porcentaje de caras, encontrará que, dado que 500 010 de 1 000 010 lanzamientos fueron caras, obtuvo alrededor del 50,00005 % de caras y el 49,9995 % de cruces. Así que eso es bastante cercano a la igualdad.
Pero, por supuesto, no es exactamente el mismo número de caras y cruces. ¿No es eso un problema? En realidad, más bien al contrario: si en un millón de lanzamientos, obtienes exactamente medio millón de caras, y ni una sola más o menos, debes sospechar. Porque la probabilidad de obtener exactamente medio millón de caras en un millón de lanzamientos independientes de una moneda perfectamente justa es de aproximadamente 0,032 %. Peor aún, esa probabilidad incluso se reduce a medida que la secuencia se hace más larga, y en el límite de un número infinito de lanzamientos llega a cero.
El resultado de una secuencia de lanzamiento al azar de una moneda justa probablemente estará en algún lugar alrededor de la misma cantidad de caras y cruces. De hecho, ese rango de recuentos de personas que es probable que se encuentre incluso crece con más lanzamientos de monedas. Es solo que crece más lentamente que el número de lanzamientos (es decir, si haces el doble de lanzamientos, el rango en el que probablemente encontrarás que el número de caras no es el doble; de hecho, es solo sqrt(2) veces , o alrededor de 1,4 veces en general), y por lo tanto el rango de la fracción de cabezas disminuye.
Ahora que el rango creciente de conteos probables significa que con suficientes lanzamientos, sus diez caras iniciales estarán completamente dentro del rango de conteos probables, y ese rango eventualmente será tan grande que los conteos de diez son insignificantes en comparación con la desviación causada por el lanzamientos al azar.
Las series generalmente convergen, pero siempre hay una pequeña probabilidad de que una serie no converja después de un número finito de intentos, por lo que no hay contradicción. Si ya tenía 100 colas, toda la serie convergerá más lentamente. La interpretación de las probabilidades (¿grado de credibilidad? ¿propensión objetiva? ¿frecuencia?) es un asunto independiente.
¿Cómo pueden ambos ser verdad? ¿No hay algo en la serie física de lanzamientos que "recuerde"? ¿No hay necesariamente una probabilidad ligeramente mayor de cruz después de 10 caras?
Tenga en cuenta que no conozco la lógica simbólica, por lo que, vergonzosamente, las demostraciones formales están más allá de mi comprensión.
Mi forma de verlo es contando los posibles resultados. Digamos que haces 10 lanzamientos de monedas. Hay muchos resultados; Exactamente 1024 de ellos (2 elevado a 10), de los cuales solo:
...
...
La fórmula general se obtiene usando coeficientes binomiales , pero me salté el formalismo.
En general, hay una mayor probabilidad de tener aproximadamente tantos caras como cruces porque hay muchas formas de pedir una mezcla uniforme de caras y cruces, mientras que hay pocas formas de pedir mezclas desiguales.
Nota: esto está relacionado con el concepto de entropía, como se esperaba de la aleatoriedad.
No estoy seguro de si este es el tipo de respuesta que está buscando, pero aquí hay una explicación intuitiva y no matemática.
El lanzamiento de una moneda, aunque aleatorio, todavía se compone de una cadena de eventos que son teóricamente predecibles hasta cierto punto; es solo que estos eventos son muy complejos y se desconoce la forma en que interactúan (y cuáles son).
Por ejemplo, el resultado de lanzar una moneda podría depender de las siguientes propiedades:
Y así. Si supiera la forma exacta en que estas propiedades interactúan y conociera las condiciones iniciales de cada una de estas propiedades, podría tener una mejor idea de cómo podría caer la moneda (imposible en la práctica).
En términos de su pregunta, cada lanzamiento de moneda es un evento independiente que no puede dictar el próximo evento. Esto se debe a que cada una de las condiciones iniciales de partida será ligeramente diferente. Pero la forma del objeto tendrá un gran impacto en los posibles resultados. Cara o cruz está determinada por la interacción precisa de todas las variables en el proceso. Debido a la estructura de la moneda, solo son posibles dos resultados, y ninguno es más probable que el otro en función de la interacción de todas las variables impulsadas por la forma del objeto. Lo que lo empuja de una forma u otra (cara o cruz) tiene que ver con cómo la física hace que todas las partes del sistema interactúen juntas.
Esto significa que la contribución de todos los demás factores cuando se trata de empujar la moneda hacia un lado o hacia el otro no es suficiente para hacer que cara o cruz sean más probables que la otra. Cuando todo se suma en miles de muestras, se ve que ambas tienen la misma probabilidad de suceder y esto se debe a la interacción de todas las variables involucradas en este sistema físico.
Sin embargo, también sabemos que la serie convergerá en un equilibrio de cara: cruz.
Nosotros no, en realidad.
En cada lanzamiento, la probabilidad de que el siguiente lanzamiento sea cara o cruz sigue siendo 50:50. ¿No podemos voltear un número infinito de caras? Decimos que no podemos, porque la probabilidad es pequeña , es decir, es el límite cuando x->infinito en 1/2^x. Matemáticamente, podemos decir que este límite converge a 0 (si estamos en un terreno matemático normal).
Pero imaginemos ahora un tablero de dardos que es el círculo unitario. Atravesamos un dardo en el tablero, y golpea el tablero en un solo punto aleatorio. Hay una cantidad infinita de puntos, por lo que la probabilidad de acertar en cualquier punto individual es 0. Sin embargo, ¡debemos acertar en el tablero en alguna parte! Entonces, donde sea que golpeemos el tablero, en ese punto sucedió un evento de probabilidad 0 . Esto parecería mostrar que no solo la probabilidad no tiene poder causal, sino que incluso los eventos infinitamente improbables pueden verse obligados a ocurrir en un tiempo finito, con infinitas posibilidades.
Por lo tanto, si se lanza una moneda al aire un número infinito de veces, es cierto que deberíamos esperar un equilibrio exacto de 1:1 entre cara y cruz (para una moneda justa), pero también esperaríamos series infinitas de cara y cruz dentro de el conjunto infinito más grande, y si eliges después solo observar estos conjuntos infinitos, se violaría nuestra expectativa para todos los conjuntos infinitos. Así que esperamos un equilibrio de cara y cruz en el infinito, pero también esperamos equivocarnos un número infinito de veces correspondiente a una porción infinitamente pequeña del conjunto infinito de conjuntos infinitos.
El lanzamiento secuencial de una moneda crea la impresión de "construcción de historia". Sin embargo, si usamos el método equivalente , veremos claramente que no se construye ninguna historia (memoria). Tomemos el caso de lanzar una moneda 1000 veces, el método equivalente sería lanzar 1000 monedas una vez. Con este método, está claro que no se construye ningún historial, y si examinamos las monedas, ¡deberíamos encontrar alrededor de 500 caras (o cruces)!
Ya hay muchas buenas respuestas basadas en matemáticas aquí, pero este es el SE para filosofía, por lo que me gustaría ofrecer una más filosófica. Creo que la parte más interesante de tu pregunta es:
¿No hay algo en la serie física de lanzamientos que "recuerde"?
porque la respuesta es un sorprendente "¡sí!" Simplemente no es la moneda la que está recordando.
Supongamos que lanzo una moneda justa diez veces y obtengo el resultado 'TTHHHTHTTT'. Ahora supongamos que lanzo la moneda otras diez veces y obtengo 'TTTTHHTHTH' en su lugar. Nada inusual hasta ahora.
¡Pero espera! Cada una de esas dos secuencias es en realidad muy inusual; de hecho, las posibilidades de cualquiera de ellas son exactamente las mismas que las posibilidades de obtener cara diez veces seguidas. Un resultado como 'TTHHHTHTTT' solo parece más "aleatorio" que diez caras seguidas porque tu cerebro inconscientemente arroja información sobre la secuencia. Para nuestros cerebros, los dos resultados 'TTHHHTHTTT' y 'TTTTHHTHTH' parecen "revoltijos desordenados de 'T's y 'H's", aunque objetivamente hablando son completamente diferentes.
Entonces, la razón por la que tienes las mismas posibilidades de sacar cara o cruz, incluso después de sacar nueve caras seguidas, es simplemente que las dos secuencias 'HHHHHHHHHT' y 'HHHHHHHHHH' tienen la misma probabilidad de ocurrir que cualquier otra secuencia de diez lanzamientos: esa es la parte de "las monedas justas no tienen memoria". Pero, ¿y la otra parte? ¿De dónde viene la ley de los grandes números, si todas las secuencias de lanzamientos son igualmente probables?
Mencioné anteriormente que su cerebro arroja inconscientemente información sobre la secuencia cuando observa resultados como 'TTHHHTHTTT' o 'TTTTHHTHTH', y es por eso que esos dos resultados se ven tan similares. Bueno, ¡la ley de los grandes números funciona porque hace exactamente lo mismo! La ley no predice la secuencia exacta que obtendrá si lanza una moneda una gran cantidad de veces; más bien, la ley toma la cantidad total de caras lanzadas, la compara con la cantidad total de cruces y luego extrapola esa proporción. para secuencias cada vez más largas de volteretas. En lo que respecta a la ley de los grandes números, la secuencia 'TTHHHTHTTT' es exactamente la misma que la secuencia 'TTTTHHTHTH', o, para el caso, 'HHHHTTTTTT', porque cada uno tiene seis 'T's y cuatro '
Entonces, de hecho, la ley de los grandes números implica "algo que recuerda"; de lo contrario, no habría forma de realizar un seguimiento de los totales. ¡ El truco es que la "cosa que recuerda" eres tú! La ley de los grandes números se basa en su memoria para derivarla y hacer uso de ella. Entonces, en respuesta a la parte final de su pregunta, podría decir que la "causalidad de la probabilidad" son solo sus expectativas que actúan sobre resultados pasados: en lugar de decir que la equidad de la moneda "hace" que salga cruz el 50% de las veces, usted diría que su experiencia previa con monedas justas le hace esperar que la moneda salga cara o cruz por igual con cada lanzamiento. (Esta es la opinión general adoptada por la probabilidad bayseiana, una rama fascinante de las matemáticas y una de las muchas interpretaciones posibles de la probabilidad .)
Supongamos que decido hacer un dibujo, y dibujé una línea como esta: 'I', y luego otra exactamente igual a esta, y luego otra, y así...
Esta sería una imagen tediosa, pero es como un dibujo sin memoria : cada línea se coloca como si fuera la primera línea colocada.
Esto es, por analogía, como el lanzamiento de una moneda justa o un dado, cada lanzamiento sin memoria .
La pregunta es ¿hay otras formas de lanzar que tengan en cuenta la historia? Claro, no con un dado o una moneda, pero ciertamente con un dado virtual en un mundo virtual y un avatar tirándolo.
Y esto sería como un hombre haciendo un dibujo conociendo la línea que colocó antes y sabiendo la línea que coloca después, y la línea que está dibujando ahora mismo.
Tiene ante sí un objetivo y tras de sí una historia; y ahora mismo el momento dibujado.
La mayoría de las veces, la falacia, y su problema, se vuelven realidad solo cuando los eventos reducen las probabilidades de obtener los mismos valores en el futuro, digamos:
Mi frasco opaco tiene 100 bolas. 50 de ellos son blancos y 50 negros. ¿Cuáles son las probabilidades de obtener uno negro cuando se toma solo uno?
Este evento recuerda la historia y, si los eliges a todos, o solo a uno, las probabilidades son las mismas: 50/50.
Pero su problema es el contraste entre la incertidumbre y los hechos ya conocidos. Todas las veces se debe mirar la definición del problema. Si el pasado no es una restricción (como lo fue en mi ejemplo), entonces olvida el maldito pasado y sigue adelante:
Lanzo una moneda. ¿Cuál es la probabilidad de obtener cruz cuando hago flip?
No dice nada sobre el pasado, porque lanzar una moneda ideal no tiene nada que ver con ninguna propiedad física (una moneda no ideal, es decir, una del mundo real, tal vez tenga los bordes menos afilados cuando toque el suelo y el resultado futuro puede variar). ...). Editar : De hecho, este artículo de wikipedia relacionado con la entropía contiene un gráfico con la distribución de lanzamiento de moneda, y las personas que saben esto nunca volverían a cometer esta falacia, ya que se permite tener lanzamientos de moneda donde una moneda ideal tendría 1 en cada lanzamiento, aunque eso sólo sería un caso límite .
La mayoría de los poseedores de falacias piensan que el problema es así:
La moneda tiene la cualidad de un verdadero equilibrio en un intervalo específico de experimentos. Si le doy la vuelta X veces, X/2 de esas veces tendrá el resultado deseado.
Toman (u observan) el problema inicial así (sin jerga matemática; de lo contrario, no incurrirían en esta falacia):
Y convertirlos a esto:
(La mayoría de las veces no sabrán nada sobre la varianza y SD, por lo que ya no es necesario detallar esos conceptos).
Aunque la diferencia es sutil en el lenguaje, no es sutil sobre lo que sabe sobre su sistema. Está cambiando las proposiciones y agregando otra restricción (sí: reduciendo la entropía).
Entonces: Vuelva a las raíces de su problema. ¿Su sistema está evolucionando a través de iteraciones de experimentos? Si es así, adquiere conocimiento del sistema y se acerca a la información inicial general que conoce. Cuando llegas a ese estado, tu entropía se vuelve 0 (exactamente 0 shannons aquí): sabes cuál es la última bola.
Sin embargo, si su sistema no evoluciona con las iteraciones, las proposiciones iniciales generales aún se aplican: el mismo experimento, las mismas probabilidades que ya conoce (1 shannon una y otra y otra y otra y maldita sea hasta nuestra muerte y más allá o hasta que la moneda se detenga de alguna manera ser ideales).
Vale la pena mencionar la regresión hacia la media, que es una cosa real, aunque completamente acausal. No significa que si ha tenido un resultado muy improbable (8 caras de 10 lanzamientos) la probabilidad del próximo lanzamiento esté sesgada en contra de cara, pero sí significa que es más del 50% probable que el promedio de cualquier futura muestra de diez estará más cerca del 50 % de caras que su resultado actual del 80 %.
Cualquiera que vea 80 CARAS seguidas y no espere ver CARAS en el siguiente lanzamiento es un idiota, y me gustaría apostar contigo.
El problema básico es que en realidad no sabemos si la moneda es justa o no, solo podemos hacer una suposición asignando una probabilidad previa de 50/50. Luego debemos actualizar nuestra creencia sobre la equidad después de cada lanzamiento. El peso que le dé a su suposición inicial determina qué tan poco o cuánto debe cambiar las expectativas dados los resultados anteriores.
Curiosamente, en el caso específico del lanzamiento de una moneda, no necesitamos hacer ninguna suposición previa sobre la equidad para adivinar de manera óptima . Si la moneda es justa, entonces nunca importa si acertamos cara o cruz.
Por lo tanto, la estrategia óptima dicta que siempre debemos adivinar el resultado que se ha observado con mayor frecuencia, incluso después de un solo lanzamiento. Si la moneda es justa, no perdemos nada al hacerlo. Pero, si hay incluso una ventaja minúscula para un resultado sobre otro, lo más probable es que tengamos razón si adivinamos el resultado que ocurre con mayor frecuencia.
José Weissmann
nudo doble