Me preguntaba cuáles son algunas de las soluciones propuestas en la literatura para la siguiente paradoja bien conocida:
Digamos que dos jugadores racionales e inteligentes, A y B, se paran frente a una pila de 100 monedas y juegan el siguiente juego: en cada turno, un jugador puede elegir recoger una moneda, darle al otro jugador el siguiente turno o recoger 2. monedas y terminar el juego allí mismo. A y B quieren maximizar sus ganancias. No pueden hablar entre ellos ni interactuar de ninguna manera (fuera del propio juego, por supuesto).
A podría razonar de la siguiente manera: si solo tenemos 2 monedas, elegiré 2 monedas allí mismo y terminaré el juego. Pero B, que es consciente de esto, optará por recoger 2 monedas cuando queden 3 (porque terminaría con 1 moneda extra). Continuando con esta inducción, finalmente llegamos a la conclusión de que el comportamiento más racional es recoger dos monedas en el primer turno de A. Obviamente una conclusión muy inusual.
¡Gracias!
(He marcado esta pregunta como 'epistemología' debido a los vínculos con la "paradoja del ahorcamiento inesperado")
La caja con 4 monedas es funcionalmente equivalente a la caja con 100 monedas, o cualquier otra acuñación más allá de 3 para el caso.
Por simplicidad, suponga que A siempre va primero.
PP = Beneficio personal
1 moneda
A : elige 1 moneda. PP = 1
B : (el juego ya terminó)
2 Monedas
A : saca 2 monedas. PP = 2
B : (el juego ya terminó)
3 Monedas
A : saca 2 monedas. PP = 2
B : (el juego ya terminó)
Hasta ahora, en términos de maximizar las ganancias, A no puede tener un mejor desempeño. Una vez que llegas a 4 o más monedas, un nuevo factor entra en juego: el rendimiento del otro jugador y "lo que es racional" se altera drásticamente. Si sabe que la persona es una persona racional como usted, puede elegir una a la vez y esperar que haga lo mismo, maximizando las ganancias de ambos. Si sabes que es una persona mala y codiciosa , puedes abrir con 2 monedas para terminar el juego. Si no sabes nada sobre la otra persona, la decisión más racional se basaría en lo que haría el jugador promedio B en tal situación. Si la persona promedio en la posición del jugador B simplemente va a terminar el juego allí mismo con 2 monedas, su movimiento más racional (como jugadorA ) sería terminarlo en el primer turno. De lo contrario, es más racional tomar 1 a la vez.
4 monedas
A : saca 2 monedas. PP = 2
B : (el juego ya terminó)
O
A : saca 1 moneda. PP = 1
B : saca 2 monedas.
El juego ha terminado.
O
A : saca 1 moneda. PP = 1 hasta ahora
B : saca 1 moneda. PP = 1
A : saca 2 monedas. PP = 3 totales
O
A : saca 1 moneda. PP = 1 hasta ahora
B : saca 1 moneda. PP = 1
A : saca 1 moneda. PP = 2 total
B : saca 1 moneda. PP = 2 totales
Esto me parece muy similar al dilema del prisionero, y el comportamiento lógicamente correcto depende de si se trata de un encuentro único con un oponente desconocido o de una serie de juegos repetidos.
Respuesta de teoría de juegos: Sí, las cosas son raras. La gente no actúa así porque sea irracional. ¡Hagamos más pruebas!
Respuesta empirista: al observar los datos históricos, la gente generalmente comparte hasta los últimos dos o tres. También sienten un deseo de reciprocidad muy fuerte. Si P(comparten)*(monedas restantes) -(P(comparten)-1)*2 > 0, entonces el empirista compartirá.
Teoría de la decisión atemporal : suponiendo que ambos jugadores solo están interesados en su propio beneficio, y son completamente lógicos, y están completamente seguros de que su oponente es igualmente racional y egoísta, ambos se dan cuenta de que el otro jugador hará exactamente lo mismo que ellos. Dado eso, ambas personas se dan cuenta de que si comparten, su pareja también lo hará. Por lo tanto, la decisión racional es tomar una moneda.
furia estoica
Yorei
mitch
Yorei
mitch
Yorei
furia estoica
José Weissmann
JMCF125