¿Cómo se calcula en principio la estrategia de equilibrio de Nash para NLH? ¿Hay diferentes métodos?
Simplifiquemos el caso y consideremos solo 2 jugadores y solo 1 mano de forma aislada. (No historia)
Tu pregunta es muy general. La teoría de juegos, que emplea el equilibrio de Nash, es un conjunto de métodos para modelar situaciones en las que los jugadores están en conflicto.
Si su entrada es todo el juego, el problema se vuelve irresoluble. En primer lugar, no estoy seguro de si existe una solución de Nash, pero incluso si existiera, sería casi imposible de calcular, dados todos estos parámetros (jugadores, tamaños de pila, cartas, posición, jugadas, dinámicas de mesa, historia, meta -juego, etc)
Puede usarlo parcialmente para situaciones individuales, aunque principalmente para tener una idea de hacia dónde conduce el juego. Como ejemplo, sugeriría mirar a Nash Equlibrium para situaciones de push/fold de shortstack de HeadsUP
Finalmente, tenga en cuenta que incluso si pudiera calcular mágicamente estrategias de nash para situaciones más complejas, eso no sería necesariamente ganador a largo plazo. En general, el equilibrio de Nash calcula una estrategia defensiva, para no ser explotado por su oponente racional. En Holdem, la mayor parte de sus ganancias resultarán exactamente de lo contrario, es decir, encontrar la debilidad de su oponente y explotarla. Como ejemplo :
Un juego bien estudiado es el papel, piedra o tijera, donde el equilibrio de estrategia mixta de Nash sugiere que juegues al azar papel, piedra, tijera, el 33 % de las veces cada uno. Con esta estrategia, incluso un oponente de la computadora nunca podrá explotarte. El oponente tenderá a jugar igual, y al final llegarás al equilibrio de Nash, donde nadie gana ni pierde. Sin embargo, si tienes un oponente que SIEMPRE jugará la piedra, es obvio que querrás explotar su "debilidad" y jugar SIEMPRE el papel, obteniendo así ganancias. Esto también es cierto en el póquer, por supuesto de una manera más general y complicada.
Equilibrio de Nash es donde dos jugadores no tienen un incentivo para cambiar su estrategia.
Una forma simplificada de ver cómo funciona un solucionador: si tiene player1 y player2. Comenzarías con alguna estrategia. Luego haz que player2 explote player1. Luego haz que el jugador 1 explote la nueva estrategia del jugador 2. Entonces player2 explota player1. Y sigue yendo y viniendo hasta que alcances un equilibrio o un punto en el que ningún jugador pueda explotar al otro.
Simplifiquemos el caso y consideremos solo 2 jugadores y solo 1 mano de forma aislada. (No historia)
La historia nunca importará para una estrategia de Nash Equilibrium. Mirar 1 mano de forma aislada no funcionará porque tienes que mirar todo el rango. A menos que te refieras a un juego de juguete donde cada jugador siempre tiene la misma mano específica. En ese caso:
Si tenemos pilas de 10bb y SB solo puede empujar o retirarse. Y BB solo puede igualar o retirarse. Un equilibrio nash será SB all-in y BB fold. Si el SB cambia su estrategia, ganará menos $$, por lo que no tiene ningún incentivo para cambiar. Si el BB cambia su estrategia, ganará menos $$, por lo que no tiene ningún incentivo para cambiar.
EDITAR: Por diversión, resolvió este juego con rangos completos a 0 explotabilidad: (Puede ver que 96o es una estrategia mixta para SB y 97o es una estrategia mixta para BB)
SB Strat (roja = empujón):
BB strat (verde = llamada):
Bromista alegre