Consideremos una moneda justa y un juego de lanzamiento infinito. Con frecuencia nos preguntaban cómo calcular la probabilidad de patrón apareciendo antes del patrón dónde y ambos son una de las ocho cuerdas . En principio, todos estos pueden resolverse mediante cadenas de Markov o análisis de primer paso. Pero estos dos métodos a veces pueden implicar una buena cantidad de cálculo. Por lo tanto:
Pregunta : ¿existe algún enfoque ingenioso que no requiera muchos cálculos que pueda resolver todo este tipo de problemas? (Vamos a limitarnos a por el momento y no considerar patrones más largos)
Explicación:
Dado que el primer lanzamiento = H significa empezar de nuevo, no tenemos que manejar este evento. Si el primer lanzamiento = T, el árbol binario de eventos se grafica como arriba, y vemos que entre todos los casos que dan como resultado un resultado determinado (es decir, no reinicios), las posibilidades de apareciendo primero a la de aparecer primero es .
¿Cómo concluimos entonces que la probabilidad requerida = ? La forma en que lo veo es que el árbol anterior en realidad define una "estructura fractal" en todo el espacio de probabilidad: entre todas las ramas de "comenzar de nuevo", la relación de las posibilidades de apareciendo primero a la de aparecer primero es siempre . Por lo tanto, la proporción general también es , de ahí la conclusión.
Entonces, ¿hay algún enfoque mejor que sea más ampliamente aplicable, más explicable o más eficiente? ¡Gracias!
Una forma divertida de resolver esto es con martingalas. Voy a dar la explicación intuitiva, aunque no es difícil hacer esto perfectamente matemáticamente riguroso. También me disculpo de antemano por la extensión de esta respuesta, pero trataré de justificar al final por qué esta es una forma útil de pensar.
El esquema: un crupier lanza una secuencia infinita de monedas hasta que aparece la secuencia THH o HTH. Hay dos líneas de apostadores, llámelas línea A y línea B.
La línea A está llena de apostantes que esperan ver THH. Así es como funciona: el apostador n.º 1 ("Aaron") primero se acerca al crupier y coloca una apueste a probabilidades iguales a que la primera moneda sea T. Si gana, entonces mantendrá , y lo apostará todo a que la próxima moneda será H. Si gana eso , apostará su en la siguiente moneda siendo H. Si eso sucediera también, tomará su beneficio (ya que uno de los dólares era suyo) y se marcha feliz; todo el juego se cerrará para todos los jugadores.
Detrás del apostador #2 hay otro mejor ("Barb") que apuesta exactamente de la misma manera, pero una moneda detrás de Aaron, y el apostador #3 ("Carl") se comporta de la misma manera; también lo hace cualquier otra persona en la fila.
Examinemos cómo se desarrollaría esto. Supongamos que la cadena de monedas del crupier es THTTHH en ese orden. Aaron apuesta primero; gana su primera apuesta desde que la primera moneda era T! También gana su segunda apuesta... solo para perder su tercera apuesta y salir con una pérdida neta de . Barb tiene el mismo destino, pero más rápido; ella pierde su dólar inicial inmediatamente. Carl gana un juego pero pierde el segundo, sufriendo el mismo destino final. El cuarto apostante ("Diana"), sin embargo, está destinado a ganar, y se irá con una red de . Tenga en cuenta que la siguen dos apostadores más ("Eva" y "Frank"), quienes pierden inmediatamente su primer dólar.
Ahora, a la línea B. Estos apostadores esperan ver HTH y realizarán los mismos tipos de apuestas con el crupier en la misma secuencia de lanzamientos de monedas... pero lo harán en la dirección opuesta. Es decir, el crupier ofrecerá sus dólares y hará apuestas de doble o nada en H, T, H en ese orden.
Así es como se desarrollaría esto con la secuencia anterior de lanzamientos de monedas. El primer apostador ("Mike") toma inmediatamente un dólar del apostador, porque la primera moneda era una T en lugar de la H que estaba buscando. (Recuerde, es la misma estructura de apuesta que con la línea A, pero la secuencia de monedas es diferente, y la dirección de ganancias y pérdidas se invierte). El segundo apostante ("Nelly") paga un dólar al crupier después de ver H, y luego paga dos dólares al comerciante después de ver a T, pero recupera todo su dinero (más una ganancia en dólares) cuando llega el próximo T. Esperemos que vea la idea clave aquí: el destino de todos los apostantes es el mismo, excepto posiblemente los últimos tres antes de que finalice el juego.En este caso, solo el último apostador de la línea B sigue en juego cuando finaliza el juego, y ese apostador pagará un dólar al apostador (neto).
La otra idea clave es que cada apuesta realizada es justa, lo que significa que, en promedio, las tenencias netas del crupier no cambian (consulte la justificación técnica a continuación). Esto es bastante útil, porque el juego termina precisamente de dos formas que podemos analizar con detenimiento. Nuevamente, tenga en cuenta que todos los apostadores antes de los últimos tres en cualquier línea son irrelevantes; el distribuidor ha tomado de cada línea Un apostante y ha dado a cada apostador de la línea B. Entonces, ¿qué sucede con los últimos tres en cada línea?
Si el juego termina en una secuencia THH como la anterior, entonces de la línea A los últimos tres apostadores toman , , y dólares del distribuidor. Los apostadores de la línea B toman , , y dólares del distribuidor. Por lo tanto, el distribuidor paga en este caso.
Si el juego termina en cambio en una secuencia HTH, entonces los apostantes de las últimas tres líneas A toman , , y dólares del crupier mientras que los apostantes de la línea B toman , , dólares del crupier (pago total: ).
Dejar denote la posibilidad de que THH venga antes que HTH. Entonces, el pago neto esperado del crupier es
Por qué me encanta este enfoque: es rápido y fácil de analizar cualquier enfrentamiento cara a cara de cualquier secuencia de 3 monedas. ¡Pero observe lo rápido que podría generalizar esto también a una racha de 4 monedas! Para enfrentamientos cara a cara de -rayas de monedas, tu única tarea es analizar cuidadosamente el comportamiento del final apostadores
¡Pero espera! ¡Hay más! También puedes usar este esquema de apuestas para pensar en otras preguntas interesantes. ¿Quieres saber el número esperado de lanzamientos antes de ver HTH? Solo considere una línea de apostadores HTH y cuente la ganancia que el crupier ha obtenido al final. ¿Quieres saber el tiempo de espera esperado para el primero de HTH y THH? Tenga dos líneas de apostadores, pero deje que ambas líneas hagan apuestas en la dirección normal (es decir, cómo se comportó la línea A en el ejemplo que describí). ¿Quiere hablar sobre dibujar letras al azar de la A a la Z y esperar la secuencia ABRACADABRA? Juegue el mismo juego, pero ajuste las proporciones de pago de las apuestas para que sean 25:1 en lugar de 1:1. Este es un enfoque increíblemente poderoso que generaliza muy bien y requiere solo una complejidad computacional mínima.
Justificaciones técnicas: El hecho de que cada apuesta realizada con cada apostador sea justa implica que las tenencias netas del crupier constituyen una martingala . El teorema de parada opcional se aplica en este caso porque se puede demostrar que el tiempo de parada tiene una expectativa finita (puede estar dominado por una variable aleatoria geométrica, por ejemplo) y los incrementos de la martingala están acotados.
Zubin Mukerjee
Empuje
Antkam