Cálculo de la estrategia de equilibrio de Nash

¿Cómo se calcula en principio la estrategia de equilibrio de Nash para NLH? ¿Hay diferentes métodos?

Simplifiquemos el caso y consideremos solo 2 jugadores y solo 1 mano de forma aislada. (No historia)

¿Por qué el voto negativo? Puede ser una pregunta difícil, pero creo que es lo suficientemente clara.

Respuestas (2)

Tu pregunta es muy general. La teoría de juegos, que emplea el equilibrio de Nash, es un conjunto de métodos para modelar situaciones en las que los jugadores están en conflicto.

Si su entrada es todo el juego, el problema se vuelve irresoluble. En primer lugar, no estoy seguro de si existe una solución de Nash, pero incluso si existiera, sería casi imposible de calcular, dados todos estos parámetros (jugadores, tamaños de pila, cartas, posición, jugadas, dinámicas de mesa, historia, meta -juego, etc)

Puede usarlo parcialmente para situaciones individuales, aunque principalmente para tener una idea de hacia dónde conduce el juego. Como ejemplo, sugeriría mirar a Nash Equlibrium para situaciones de push/fold de shortstack de HeadsUP

Finalmente, tenga en cuenta que incluso si pudiera calcular mágicamente estrategias de nash para situaciones más complejas, eso no sería necesariamente ganador a largo plazo. En general, el equilibrio de Nash calcula una estrategia defensiva, para no ser explotado por su oponente racional. En Holdem, la mayor parte de sus ganancias resultarán exactamente de lo contrario, es decir, encontrar la debilidad de su oponente y explotarla. Como ejemplo :

Un juego bien estudiado es el papel, piedra o tijera, donde el equilibrio de estrategia mixta de Nash sugiere que juegues al azar papel, piedra, tijera, el 33 % de las veces cada uno. Con esta estrategia, incluso un oponente de la computadora nunca podrá explotarte. El oponente tenderá a jugar igual, y al final llegarás al equilibrio de Nash, donde nadie gana ni pierde. Sin embargo, si tienes un oponente que SIEMPRE jugará la piedra, es obvio que querrás explotar su "debilidad" y jugar SIEMPRE el papel, obteniendo así ganancias. Esto también es cierto en el póquer, por supuesto de una manera más general y complicada.

El teorema de existencia de Nash demuestra que NLH tiene un equilibrio de Nash, suponiendo efectivo finito. Hay una cantidad finita de estados de juego distintos, es decir, cantidad de jugadores, tamaños de pilas, cartas de mano y tableros.
@jollyJoker-> Buen comentario, tienes razón. Dado que es finito, hay al menos un NE (mixto).
¿Qué es una estrategia mixta?
Entonces, ¿existe una estrategia de equilibrio de Nash pura?
Es posible que desee leerlo de nuevo con más atención. Si asumimos que sus estrategias disponibles son (retirarse, subir, igualar), una estrategia pura sería ej. doblar siempre. Obviamente, para el póquer eso no funcionará :)
Creo que sería difícil demostrar que la estrategia debe ser mixta. Tal como lo entiendo, un oponente puede usar la información de que las cartas que tiene no pueden estar en tu mano para tomar mejores decisiones en el river si tu estrategia no es mixta, pero ni siquiera estoy seguro de haber entendido bien esa parte. .
De acuerdo irresoluble. Y no enumeraste las apuestas. Incluso con una estructura de apuestas fija, no creo que se pueda hacer un juego completo y entonces no habría límite. Buena respuesta.
@Paparazzi Tenga en cuenta el "en principio" en la pregunta. Es irresoluble en la práctica, pero hay un número finito de opciones, por lo que es solucionable en principio.
@JollyJoker No me interesa interactuar contigo. No me dirigía a ti. Ya has dicho que no tengo nada sobre esto y que soy un inútil.

Equilibrio de Nash es donde dos jugadores no tienen un incentivo para cambiar su estrategia.

Una forma simplificada de ver cómo funciona un solucionador: si tiene player1 y player2. Comenzarías con alguna estrategia. Luego haz que player2 explote player1. Luego haz que el jugador 1 explote la nueva estrategia del jugador 2. Entonces player2 explota player1. Y sigue yendo y viniendo hasta que alcances un equilibrio o un punto en el que ningún jugador pueda explotar al otro.

Simplifiquemos el caso y consideremos solo 2 jugadores y solo 1 mano de forma aislada. (No historia)

La historia nunca importará para una estrategia de Nash Equilibrium. Mirar 1 mano de forma aislada no funcionará porque tienes que mirar todo el rango. A menos que te refieras a un juego de juguete donde cada jugador siempre tiene la misma mano específica. En ese caso:

  • SB: AA
  • BB: KK
  • Persianas = 1 / 2

Si tenemos pilas de 10bb y SB solo puede empujar o retirarse. Y BB solo puede igualar o retirarse. Un equilibrio nash será SB all-in y BB fold. Si el SB cambia su estrategia, ganará menos $$, por lo que no tiene ningún incentivo para cambiar. Si el BB cambia su estrategia, ganará menos $$, por lo que no tiene ningún incentivo para cambiar.

EDITAR: Por diversión, resolvió este juego con rangos completos a 0 explotabilidad: (Puede ver que 96o es una estrategia mixta para SB y 97o es una estrategia mixta para BB)

SB Strat (roja = empujón):

SB Strat

BB strat (verde = llamada):

BB strat

¿Sabemos que esta secuencia alcanzará un equilibrio? ¿Cómo sabes que no cambiarán de un lado a otro en las estrategias de un ciclo?
Esa es una buena pregunta y no lo sé. Me di cuenta de que si intenta resolver una estrategia complicada, el solucionador generalmente terminará bajando a un nivel muy bajo de explotabilidad y luego se quedará atascado allí durante mucho tiempo. El nivel de explotabilidad en ese punto suele ser tan bajo que simplemente detengo el solucionador. Estoy seguro de que la mayoría de los algoritmos en estos solucionadores son más complicados que simplemente ir y venir, pero eso es esencialmente lo que está sucediendo.