¿Qué tiene de malo mi razonamiento de la pregunta de probabilidad de dos dados justos?

Hay un juego en el que se le pide que tire dos dados justos de seis caras. Si la suma de los valores es igual a 7, entonces gane £21. Sin embargo, debe pagar £ 5 para jugar cada vez que se lanzan ambos dados. ¿Juegas a este juego?

Una forma de pensar en esto es que obtener un 7 tiene una probabilidad de 1/6, y para ganar dinero necesitamos obtener un 7 a una tasa de 1/4, por lo que la respuesta es no jugar.

Otra forma de pensarlo es: ¿cuál es mi probabilidad de sacar un 7 al menos una vez de cada 4 lanzamientos? En cuyo caso, calcularía una probabilidad de no lanzar un 7 4 tiros seguidos (5/6)^4, y luego restaría esto de 1 para obtener una probabilidad de lanzar al menos un 7. Que es 1 - (5/ 6)^4 = 0,52. Por esta lógica yo jugaría el juego.

Ambas respuestas no pueden ser correctas. ¿Alguien podría explicarme cuál es incorrecto y por qué? ¡Gracias!

EDITAR: wow, esta es la primera vez que hago una pregunta en StackOverflow, no esperaba obtener tantas respuestas. Gracias a todos, estoy muy agradecido!

Debes considerar cuánto ganas y cuánto pierdes, para empezar. si rueda 7 una vez en cuatro rollos, ganas £ 1 . Si no lo haces, pierdes £ 20 . Ganar £ 1 52 % de los tiempos mientras perdía £ 20 el otro 48 % del tiempo es un mal negocio.
Si jugar el juego una vez es injusto para usted, ¿cómo podría ser una ventaja para usted jugar el juego cuatro veces?
"Esta es la primera vez que hago una pregunta sobre StackOverflow", pero no hiciste una pregunta sobre Stack Overflow. Si hubiera hecho esta pregunta allí, probablemente se habría cerrado como fuera de tema antes de cualquier respuesta.

Respuestas (4)

Su primer enfoque es correcto, al menos aproximadamente. (Si ganó £20 con un 7, entonces tendría que sacar 7 a razón de 1 4 partir en partes iguales. Dado que gana £21, puede permitirse una tasa ligeramente más baja, aunque no tan baja como 1 6 .)

Su segundo enfoque es incorrecto. Es cierto que más de la mitad de las veces, ganas al menos una vez en una secuencia de cuatro lanzamientos. Sin embargo, todo lo que te dice es: más de la mitad del tiempo, no pierdes dinero. ¡Esto no significa que alcance el punto de equilibrio en promedio! De hecho, te dice que:

  • Aproximadamente 48 % la mayor parte del tiempo, no saca 7, por lo que pierde £20 en el transcurso de cuatro lanzamientos.
  • Aproximadamente 52 % la mayor parte del tiempo, saca al menos un 7 y obtiene una ganancia neta de al menos £1. La mayoría de las veces, esto será exactamente £ 1.

Esto ya no se ve tan bien. En general, el hecho de que una variable aleatoria sea positiva más de la mitad de las veces no significa que su valor esperado sea positivo.

Tienes razón sobre las probabilidades involucradas aquí. La probabilidad de sacar un total de 7 en un par de dados justos es de hecho 1 / 6 . Asimismo, la probabilidad de sacar un 7 al menos una vez en cuatro rollos es 1 ( 5 6 ) 4 lo cual es sobre 52 % - y esto podría interpretarse igualmente como "la probabilidad de ganar dinero después de cuatro repeticiones del juego". Sin embargo, debemos tener cuidado con la forma en que interpretamos tales cantidades.

Imagine la siguiente variación del juego, a la que se aplica la lógica de su segunda respuesta:

Tu pagas £ 20 para jugar un juego en el que puedes tirar un par de dados hasta cuatro veces. si obtienes un 7 en cualquier rollo, ganas £ 21 atrás.

O, de manera equivalente, observando las ganancias netas para cualquiera de los resultados:

Tira un par de dados hasta cuatro veces. si obtienes un 7 en cualquier tirada, ganas £ 1 . De lo contrario, pierdes £ 20 .

Si bien es cierto que ganarás este juego 52 % la mayor parte del tiempo, probablemente no sea un juego al que quieras jugar, es básicamente lanzar una moneda al aire entre "ganar £ 1 " y "perder £ 20 ". Su segundo argumento postula un mundo en el que jugaríamos este juego porque probablemente ganaremos, pero ignora que la consecuencia de perder supera con creces el beneficio de ganar. Este juego es más pesimista que el original (ya que no no le permite ganar múltiples premios), pero ilustra más claramente por qué su segundo razonamiento es engañoso*.


La forma típica de evaluar rigurosamente este tipo de juego es observar los valores esperados en lugar de las probabilidades . El valor esperado es la respuesta a la siguiente pregunta:

Si jugara este juego repetidamente, ¿ cuánto ganaría o perdería en una ronda promedio?

Esto se puede calcular multiplicando los resultados posibles por las probabilidades respectivas; en el caso de este problema, tiene un 1 / 6 oportunidad de ganar una red de £ dieciséis y un 5 / 6 oportunidad de ganar £ 5 (es decir, perder £ 5 ). Puede calcular el valor esperado como:

1 6 £ dieciséis 5 6 £ 5 = £ 1.50
Mostrando que esperas perder £ 1.50 en una ronda promedio de este juego, lo que significa que no vale la pena jugarlo. También podríamos reescribir esto como
1 6 £ 21 1 £ 5 = £ 1.50
para captar la idea equivalente que ganamos £ 21 con alguna probabilidad, pero siempre hay que pagar £ 5 para ingresar, y esta expresión se alinea bien con su intuición: la cantidad con la que esperamos ser recompensados ​​(después de pagar para jugar) es £ 21 veces la probabilidad de que ocurra, y para que esto supere la tarifa de entrada, debe ocurrir aproximadamente una cuarta parte del tiempo, como dices correctamente.

También puede imaginar esto como jugar el juego seis veces, y considerando que espera ganar una vez (ganar £ 21 ) pero paga £ 30 para entrar, dejando una pérdida de £ 9 - que es solo seis veces la pérdida calculada previamente para un solo juego.


Como cuestión de curiosidad que no está directamente implicada en su pregunta: estos números están algo relacionados. Su segundo cálculo se puede describir como:

La probabilidad de que gane más dinero del que gasto jugando 4 rondas del juego.

Esto resulta ser mayor que 50 % , pero podría imaginarse pidiendo una probabilidad diferente como:

La probabilidad de que gane más dinero del que gasto jugando 100 rondas del juego.

No entraré en detalles, pero esta probabilidad resulta ser solo 3 % - y si juegas 200 rondas, la probabilidad de salir adelante se reduce a 0.4 % y todo el camino hasta 0.07 % después 300 rondas Como regla general, si juega un juego con un valor esperado negativo, la probabilidad de salir adelante disminuye exponencialmente con el número de juegos jugados. El hecho de que es más probable que salga adelante después de 4 games es cierto pero engañoso: la situación solo empeora a medida que se juegan más juegos, que es una de las cosas que te dice el valor esperado (y una de las razones por las que el valor esperado es una muy buena herramienta para evaluar juegos de azar).


*Nota: Digo "engañoso" en lugar de "incorrecto" porque es un cálculo correcto de algo , pero sería exagerado concluir a partir de esa probabilidad que este sería un buen juego para jugar si solo estuvieras caminando por el calle. Sin embargo, hay contextos naturales en los que el segundo tipo de cálculo es útil; por ejemplo, en la última ronda de muchos juegos de mesa o juegos de cartas, es posible que pueda calcular directamente la probabilidad de que un determinado movimiento le haga ganar .el juego a través de una lógica similar, donde el cálculo del valor esperado de "qué sucedería si hiciera esto un montón y lo promediara" no es realmente relevante (y podría conducir a resultados diferentes y, por lo tanto, incorrectos). Dicho esto, el valor esperado suele ser lo correcto en lo que pensar, excepto cuando tiene una razón convincente para considerar otra cosa.

Dejar ps X ser el ganador neto en un juego. Entonces X tiene dos posibles valores: dieciséis o 5.

En un juego, la probabilidad de ganar es

PAG ( X = dieciséis ) = 6 36 = 1 6 .

A largo plazo, el valor medio de X es

X X PAG ( X = X ) = dieciséis ( 1 6 ) + ( 5 ) ( 1 1 6 ) = 1.5.

(Esta cantidad se llama el valor esperado de X . Es esencialmente un promedio ponderado , donde la probabilidad PAG ( X = X ) es el "peso" de su resultado asociado X .

En otras palabras, la ganancia promedio por juego es la suma firmada de la ganancia promedio en $ y la pérdida en $ promedio; el último, por ejemplo, es igual a la ganancia negativa por juego fallido multiplicado por la proporción de juegos que no tienen éxito).

Por lo tanto, espero perder ps 1.50 por juego. Entonces, yo no jugaría este juego.

Hay 36 combinaciones posibles cuando lanzas dos dados. ¿Cuántos de estos suman 7? (6+1, 5+2, 4+3, 3+4, 2+5, 1+6) --> 6. Así que hay una probabilidad de 1/6 de que ganes.

Dejar X Sea la variable aleatoria que denota la cantidad que gana. Con una probabilidad de 1/6, ganas 21 y con una probabilidad de 5/6 ganas 0. Entonces, tus ganancias esperadas son 21 × 1 / 6 + 0 × 5 / 6 = 21 / 6 . Sin embargo, también debe pagar 5 para jugar (independientemente del resultado), por lo que sus ganancias netas esperadas son 21 / 6 5 < 0 . Dado que se espera que las ganancias netas sean negativas, ¡no jugaría el juego!

Digamos que la probabilidad de una combinación ganadora era pag . Las ganancias netas esperadas serían 21 pag 5 en base a los cálculos anteriores. Para que esto sea positivo, debe tener pag > 5 / 21 . Así que solo juegue si las combinaciones ganadoras tienen una probabilidad > 5/21 (cerca de 1/4, aunque no estoy seguro de cómo llegó a la conclusión de que debería ser exactamente 1/4).

¿Por qué el voto negativo?